Gå til innhold
Arkivverket

Indeksering av skiftekort


Jan Eikeland
 Del

Recommended Posts

Er det noen som har forsøkt  seg på å lese handskrift (Sted og Prestegjeld) fra disse scannede (bilde) kort og funnet ett brukbart ocr program som takler disse kortene?

Å automatisere lesning til ett indexregister for sidenr  bør vel la seg gjøre, litt avhengig av ocr programmet. (9000 kort er rimelig lang affære å bla igjennom).

mvh
 

Lenke til kommentar
Del på andre sider

3 hours ago, Leif B. Mathiesen said:

Jeg har jobbet noe med å gjøre skiftekort søkbare. 

 

Hva mener du ett slikt OCR program skal lese på ett skiftekort.

F.eks dette.

SAO, Heggen og Frøland sorenskriveri I, H, 1667-1811, s. 13
Brukslenke for sidevisning: https://www.digitalarkivet.no/sk11216062100013  

 

hei. Tenkte på 3 felter: 1) Nummer i skiftekort registeret, 2) Sted og 3) Sokn/Prestegjeld.

Ser at plasseringen av  de feltene som må scannes varierer fra register til register (og muligens inmnen hvert register?)

Det kan antakeligvis  være en utfordring,

 

For dette registeret https://media.digitalarkivet.no/view/77803/5125 synes det som om nødvendig lesbar felt er plassert konsekvent over/tilliggende vannrette linje og greit å klippe ut lage en bildefil og sende til en applikasjon som kan lese håndskrevet tekst fra eksempelvis en bildefil. Resultatet , ren maskintekst kan  det deretter leses som bilde fra skjerm og sendes til en forholdsvis rimelig OCR-applikasjon og legges inn i eksempelvis regneark.

Behovet for automatisering av ovennevnte vil være en applikasjon som kan Lese SAMMENHENGENDE håndskrift i et bilde til maskinskrift. Vet ikke om noen av  dagens applikasjoner klarer dette? mvh

 

Edit: En mulig løsning vdr. sistnevnte register ovenfor kan muligens være å bruke bildesammenlikningsfunksjonen i AutoHotKey, men husker i farta ikke om en kan sette toleranse på gjenkjennelsesgrad, noe jeg tror man kan og  behandle alt som bilder, men da må det registreres minst ett bilde av hvert stedsnavn og sammenlikne bildene som igjen viser til en tekstvariabler(sideno, sted, område.)

 

Endret av Jan Eikeland
Lenke til kommentar
Del på andre sider

Alle skiftkort som er digitalisert får ett unikt nummer såkalt bildeID som begynner med sk og 14 siffer. Dette nummeret står ikke på skiftekortet men øverst til venstre i headingen. Dette nummeret må Digitalarkivet ha for å gjøre kortet søkbart. 

 

En annen sak skiftekortene er sorter etter Sorenskriverembete. Det er ikke angitt prestegjeld/sogn på alle.

 

Når det gjelder utfylling av skiftkort finnes det ingen standardnorm desverre. Fra nesten uleselig håndskrift til skrivemaskinskrift.

 

Det jeg har gjort er å sette inn bildeID  og korrekturlest  lister (.xlsx) som Digitalarkivet hat motatt fra lag og privatpersoner.

 

Jeg ser du er fra Akershus. Øvre og Nedre Romerike er nå søkbare.

Lenke til kommentar
Del på andre sider

8 minutes ago, Leif B. Mathiesen said:

Alle skiftkort som er digitalisert får ett unikt nummer såkalt bildeID som begynner med sk og 14 siffer. Dette nummeret står ikke på skiftekortet men øverst til venstre i headingen. Dette nummeret må Digitalarkivet ha for å gjøre kortet søkbart. 

 

En annen sak skiftekortene er sorter etter Sorenskriverembete. Det er ikke angitt prestegjeld/sogn på alle.

 

Når det gjelder utfylling av skiftkort finnes det ingen standardnorm desverre. Fra nesten uleselig håndskrift til skrivemaskinskrift.

 

Det jeg har gjort er å sette inn bildeID  og korrekturlest  lister (.xlsx) som Digitalarkivet hat motatt fra lag og privatpersoner.

 

Jeg ser du er fra Akershus. Øvre og Nedre Romerike er nå søkbare.

hei. Sendte en edit nesten samtidig med din notis. Jo, det hadde nok vært enklere dersom håndskriften lå i definerte felt i fex pdf-dokument.

Får se om jeg prøver meg med AHK for å se om bilde gjenkjennelsen fungerer på kortene og hvor lang tid det tar å sammenlikne ett bilde med ett annet. Mulig det ikke blir store tidsbesparelsen enn ved manuell gjennomlesning.

Ja, moderen har slekt fra oslo til Nes i Romerike så supert med søkingsmulighet  når jeg igjen tar fatt i den delen av slekta.  mvh

Lenke til kommentar
Del på andre sider

har undersøkt  AHK og bildegjennkjenning krever 100% likhet ved sammenlikning. Dermed er dette ikke noe alternativ da skrift og dets posisjon varierer noe.  mvh

Lenke til kommentar
Del på andre sider

Tror dette er langt i fremtden.

Men det som kanskej kunne være intressan er OCR lesing av registeren som finnes i mange skifteprotokoller.

Mange har vanskelig håndskrift,

 Et eks.

SAO, Nedre Romerike sorenskriveri, H/He/Hea/L0001: Skifteregistreringsprotokoll, 1829-1845, s. 761b-762a
Brukslenke for sidevisning: https://www.digitalarkivet.no/sk10051002251769  
 

 

 

Lenke til kommentar
Del på andre sider

1 hour ago, Leif B. Mathiesen said:

Tror dette er langt i fremtden.

Men det som kanskej kunne være intressan er OCR lesing av registeren som finnes i mange skifteprotokoller.

Mange har vanskelig håndskrift,

 Et eks.

SAO, Nedre Romerike sorenskriveri, H/He/Hea/L0001: Skifteregistreringsprotokoll, 1829-1845, s. 761b-762a
Brukslenke for sidevisning: https://www.digitalarkivet.no/sk10051002251769  
 

 

 

Hvis jeg hadde tilgang tll applikasjon som kan utføre det du nevner ovenfor kan den antakeligvis benyttes til skiftekort også. (vet ikke hvor mange av disse registre som har fulgt en noenlunde fast l plassering av ønsket data slik Namdal skiftekort har). Som regel krever vel bruk av slik applikasjoner store volum/betaling for slike ocr tjenester.
Ellers har jeg veldig liten kunnskap/erfaring i bruk av selve ocr-programvaren. De fleste kommersielle programvarehus har sjelden prøveversjon hvor ocr for handskrift er integrert. Vet du om noen applikasjoner som kan utføre det du nevner om ocr lesing av sammenhengende håndskrift?

mvh

Lenke til kommentar
Del på andre sider

Join the conversation

Du kan poste nå og registrere deg senere. If you have an account, sign in now to post with your account.

Gjest
Skriv svar til emnet...

×   Du har limt inn tekst med formatering.   Fjern formatering

  Only 75 emoji are allowed.

×   Lenken din har blitt bygget inn på siden automatisk.   Vis som en ordinær lenke i stedet

×   Ditt forrige innhold har blitt gjenopprettet .   Tøm tekstverktøy

×   You cannot paste images directly. Upload or insert images from URL.

 Del

  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...

Viktig Informasjon

Arkivverket bruker cookies (informasjonskapsler) på sine nettsider for å levere en bedre tjeneste. De brukes til bl.a. skjemaoppdateringer og innlogging. Bruk siden som normalt, eller lukk informasjonsboksen for å akseptere bruk av cookies.