Jump to content
Arkivverket

Indeksering av skiftekort


Recommended Posts

Jan Eikeland

Er det noen som har forsøkt  seg på å lese handskrift (Sted og Prestegjeld) fra disse scannede (bilde) kort og funnet ett brukbart ocr program som takler disse kortene?

Å automatisere lesning til ett indexregister for sidenr  bør vel la seg gjøre, litt avhengig av ocr programmet. (9000 kort er rimelig lang affære å bla igjennom).

mvh
 

Link to post
Share on other sites
Jan Eikeland
3 hours ago, Leif B. Mathiesen said:

Jeg har jobbet noe med å gjøre skiftekort søkbare. 

 

Hva mener du ett slikt OCR program skal lese på ett skiftekort.

F.eks dette.

SAO, Heggen og Frøland sorenskriveri I, H, 1667-1811, s. 13
Brukslenke for sidevisning: https://www.digitalarkivet.no/sk11216062100013  

 

hei. Tenkte på 3 felter: 1) Nummer i skiftekort registeret, 2) Sted og 3) Sokn/Prestegjeld.

Ser at plasseringen av  de feltene som må scannes varierer fra register til register (og muligens inmnen hvert register?)

Det kan antakeligvis  være en utfordring,

 

For dette registeret https://media.digitalarkivet.no/view/77803/5125 synes det som om nødvendig lesbar felt er plassert konsekvent over/tilliggende vannrette linje og greit å klippe ut lage en bildefil og sende til en applikasjon som kan lese håndskrevet tekst fra eksempelvis en bildefil. Resultatet , ren maskintekst kan  det deretter leses som bilde fra skjerm og sendes til en forholdsvis rimelig OCR-applikasjon og legges inn i eksempelvis regneark.

Behovet for automatisering av ovennevnte vil være en applikasjon som kan Lese SAMMENHENGENDE håndskrift i et bilde til maskinskrift. Vet ikke om noen av  dagens applikasjoner klarer dette? mvh

 

Edit: En mulig løsning vdr. sistnevnte register ovenfor kan muligens være å bruke bildesammenlikningsfunksjonen i AutoHotKey, men husker i farta ikke om en kan sette toleranse på gjenkjennelsesgrad, noe jeg tror man kan og  behandle alt som bilder, men da må det registreres minst ett bilde av hvert stedsnavn og sammenlikne bildene som igjen viser til en tekstvariabler(sideno, sted, område.)

 

Edited by Jan Eikeland
Link to post
Share on other sites
Leif B. Mathiesen

Alle skiftkort som er digitalisert får ett unikt nummer såkalt bildeID som begynner med sk og 14 siffer. Dette nummeret står ikke på skiftekortet men øverst til venstre i headingen. Dette nummeret må Digitalarkivet ha for å gjøre kortet søkbart. 

 

En annen sak skiftekortene er sorter etter Sorenskriverembete. Det er ikke angitt prestegjeld/sogn på alle.

 

Når det gjelder utfylling av skiftkort finnes det ingen standardnorm desverre. Fra nesten uleselig håndskrift til skrivemaskinskrift.

 

Det jeg har gjort er å sette inn bildeID  og korrekturlest  lister (.xlsx) som Digitalarkivet hat motatt fra lag og privatpersoner.

 

Jeg ser du er fra Akershus. Øvre og Nedre Romerike er nå søkbare.

Link to post
Share on other sites
Jan Eikeland
8 minutes ago, Leif B. Mathiesen said:

Alle skiftkort som er digitalisert får ett unikt nummer såkalt bildeID som begynner med sk og 14 siffer. Dette nummeret står ikke på skiftekortet men øverst til venstre i headingen. Dette nummeret må Digitalarkivet ha for å gjøre kortet søkbart. 

 

En annen sak skiftekortene er sorter etter Sorenskriverembete. Det er ikke angitt prestegjeld/sogn på alle.

 

Når det gjelder utfylling av skiftkort finnes det ingen standardnorm desverre. Fra nesten uleselig håndskrift til skrivemaskinskrift.

 

Det jeg har gjort er å sette inn bildeID  og korrekturlest  lister (.xlsx) som Digitalarkivet hat motatt fra lag og privatpersoner.

 

Jeg ser du er fra Akershus. Øvre og Nedre Romerike er nå søkbare.

hei. Sendte en edit nesten samtidig med din notis. Jo, det hadde nok vært enklere dersom håndskriften lå i definerte felt i fex pdf-dokument.

Får se om jeg prøver meg med AHK for å se om bilde gjenkjennelsen fungerer på kortene og hvor lang tid det tar å sammenlikne ett bilde med ett annet. Mulig det ikke blir store tidsbesparelsen enn ved manuell gjennomlesning.

Ja, moderen har slekt fra oslo til Nes i Romerike så supert med søkingsmulighet  når jeg igjen tar fatt i den delen av slekta.  mvh

Link to post
Share on other sites
Jan Eikeland

har undersøkt  AHK og bildegjennkjenning krever 100% likhet ved sammenlikning. Dermed er dette ikke noe alternativ da skrift og dets posisjon varierer noe.  mvh

Link to post
Share on other sites
Leif B. Mathiesen

Tror dette er langt i fremtden.

Men det som kanskej kunne være intressan er OCR lesing av registeren som finnes i mange skifteprotokoller.

Mange har vanskelig håndskrift,

 Et eks.

SAO, Nedre Romerike sorenskriveri, H/He/Hea/L0001: Skifteregistreringsprotokoll, 1829-1845, s. 761b-762a
Brukslenke for sidevisning: https://www.digitalarkivet.no/sk10051002251769  
 

 

 

Link to post
Share on other sites
Jan Eikeland
1 hour ago, Leif B. Mathiesen said:

Tror dette er langt i fremtden.

Men det som kanskej kunne være intressan er OCR lesing av registeren som finnes i mange skifteprotokoller.

Mange har vanskelig håndskrift,

 Et eks.

SAO, Nedre Romerike sorenskriveri, H/He/Hea/L0001: Skifteregistreringsprotokoll, 1829-1845, s. 761b-762a
Brukslenke for sidevisning: https://www.digitalarkivet.no/sk10051002251769  
 

 

 

Hvis jeg hadde tilgang tll applikasjon som kan utføre det du nevner ovenfor kan den antakeligvis benyttes til skiftekort også. (vet ikke hvor mange av disse registre som har fulgt en noenlunde fast l plassering av ønsket data slik Namdal skiftekort har). Som regel krever vel bruk av slik applikasjoner store volum/betaling for slike ocr tjenester.
Ellers har jeg veldig liten kunnskap/erfaring i bruk av selve ocr-programvaren. De fleste kommersielle programvarehus har sjelden prøveversjon hvor ocr for handskrift er integrert. Vet du om noen applikasjoner som kan utføre det du nevner om ocr lesing av sammenhengende håndskrift?

mvh

Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.