Jump to content
Arkivverket
Jon Erik Berg-Hansen

Retting av digitalisert kildemateriale

Recommended Posts

Torbjørn Igelkjøn
54 minutter siden, Kristian Hunskaar (Arkivverket) skrev:

 

Et par stikkprøver viser at transkripsjonene Børe og Børre i FT1865 for Horten i mange tilfeller er riktige:

Det er likevel ingen tvil om at dere har påvist systematiske feil i FT1891.

 

Om man ønsker å påkalle Arkivverkets oppmerksomhet, bør man poste i Spør Digitalarkivet eller Spør Arkivverket. Det er tilfeldig hva vi får med oss i Brukernes eget forum. Nå har imidlertid undertegnede lagt merke til denne debatten, og jeg har gjort mine kollegaer som arbeider med transkriberte/søkbare data oppmerksomme på den. Nå står vi foran en "inneklemt fredag", så det er ikke sikkert at noen får mulighet til å se på den før til uka.

 

Det er allereie lagt ut ein tråd i forumet for spørsmål om transkribert materiale der det blir vist til denne tråden. Sjå #17.

 

Elles fanst det ikkje noko prestegjeld som heitte Børre. Er det då rett å skrive Børre, eller er det rett å skrive Borre der ein antar at prikken eigentleg ikkje skal vere der? Dette blir jo litt som å skrive Trondhjem når slurv gjer at det tilsynelatande står Trandhjem. Utlendingane som har transkribert ft1891 kan ikkje norsk og er kanskje meir "kjeldetru" bokstav for bokstav, medan vi som kan norsk kan leggje godviljen til i tvilstilfelle?

 

Eg prøvde meg ein gong på å registrere ei liste i ei kyrkjebok, men la det vekk etter å ha registrert noko slikt som 250 namn fordi eg eigentleg ikkje hadde tid til dette då. Deretter kom meldinga om at AMF uansett skulle registrere kyrkjebøkene etter 1815, og dermed fall det som var att av motivasjon vekk. Skulle eg setje igang att ville eg også måtte lese gjennom kyrre-standarden på nytt. Men det at eg er usikker på kor mykje velvilje ein skal leggje i tolkinga er også ein av grunnane til at eg aldri har sett i gang att. Så all ære til dei som brukar av si tid til å registrere og som gjer desse avvegingane. Frå eit brukarperspektiv vil ein gjerne ha kjeldetru avskrifter, men ein forventar også at materialet skal vere søkbart, og då er ikkje mogelegheita for at Borre er skrive som Børre akkurat den fyrste tankenn som fell ein inn.

Share this post


Link to post
Share on other sites
Jan H. Trelsgård
7 timer siden, Torbjørn Igelkjøn skrev:

 

Elles fanst det ikkje noko prestegjeld som heitte Børre. Er det då rett å skrive Børre, eller er det rett å skrive Borre der ein antar at prikken eigentleg ikkje skal vere der? Dette blir jo litt som å skrive Trondhjem når slurv gjer at det tilsynelatande står Trandhjem. Utlendingane som har transkribert ft1891 kan ikkje norsk og er kanskje meir "kjeldetru" bokstav for bokstav, medan vi som kan norsk kan leggje godviljen til i tvilstilfelle?

 

Om man leter i eldre kildemateriale og t. eks. eldre aviser tilgjengelige via nasjonalbiblioteket ser det vitterlig ut til at Børre/Børe har vært benyttet som en alternativ skrivemåte for Borre.

Eksempler: https://www.nb.no/items/d07e245cea818fbe46736b40c23ee78a?page=35&searchText=børre 

https://www.nb.no/items/d6c09021322787b46b61b71862d54e1a?page=9&searchText="børre sogn"

Share this post


Link to post
Share on other sites
Tone Merete Bruvik

1. Meld feil gjerne ved hjelp av korrekturmeldingene som flere av dere nevner i tråden her, men skriv gjerne i disse at det gjelder flere i samme telling i disse. Vi behandler alle korrekturmeldinger for en telling samtidig, slik at hvis det meldes om gjennomgående feil kan vi rette det i samme slengen. Da er det faktisk en fordel for oss at man ikke lager mange korrekturmeldinger for samme feilen, da slipper vi å kvittere ut en masse korrekturmeldinger om det samme. Men dette siste skjønner vi jo ikke er helt enkelt for dere å tenke på. 

 

2. Vi kan en relativ tung behandling av rettelser i søkbare data, slik at vi greier ikke å gjøre dette så fort som  man skulle ønske. Det kan ta flere år fra en feil meldes, til vi får rettet det. 

 

3.  Hvis du ønsker å rette opp en telling eller eventuelt lage en helt ny avskrift, ta kontakt med oss på epost digitalarkivet@arkivverket.no Ta kontakt FØR du begynner. Vi vil gjerne at du bruker en mal fra oss for å få med ID-til personer og bostedene slik at disse blir bevart i en ny versjon, det sikret at permanente lenker faktisk er permanente. Dette står også her i orienteringen om 1891-tellingen,  "Om 1891-tellingen fra Ancestry, MyHeritage og FamilySearch": https://www.digitalarkivet.no/content/462/om-1891-tellingen-fra-ancestry-myheritage-og-familysearch 

 

PS! Merk at for tellinger og andre transkriberinger som er laget av noen av de mange frivilligere, og som disse har rettighetene til, vil vi jo ta kontakt med dem før rettelser blir gjort, og de kan da ordne feilene selv hvis de ønsker det. 

Share this post


Link to post
Share on other sites
Anne-Lise Hansen

Takk. Godt å høre at det er noe en kan gjøre, for jeg synes ikke eksemplene jeg la inn fra Akershus festning i innlegg 18, kan bli liggende i mange år, siden feiltranskriberingen er så ille.

Share this post


Link to post
Share on other sites
Jon Erik Berg-Hansen
Posted (edited)

Takk til Kristian og Tone Merete - jeg har iallfall fått en slags reaksjon fra folk på "innsida."

 

Men: Å nyregistrere f.eks. hele 1891-tellinga for Horten og Borre for å rette feil blir ikke mitt prosjekt!

Det ville sikkert rette opp de fleste feila, men ikke for de personene som var født i Horten elller Borre i 1891 - men bosatt andre steder.

 

Torbjørn:

9 timer siden, Torbjørn Igelkjøn skrev:

Frå eit brukarperspektiv vil ein gjerne ha kjeldetru avskrifter, men ein forventar også at materialet skal vere søkbart, og då er ikkje mogelegheita for at Borre er skrive som Børre akkurat den fyrste tankenn som fell ein inn.

 

Dette er og blir et i praksis "uløselig" problem.

 

Men:

I noen sammenhenger har nyregistrator muligheter til å legge merknader om postene - ved f. eks. å "normalisere" navn/stedsnavn.

Da blir både den kildetro og normaliserte registreringen for samme post søkbar.

 

 

 

Lenke til posting i Spør Arkivverket ble gitt i (17) men gjentas her:

 

 

 

Edited by Jon Erik Berg-Hansen

Share this post


Link to post
Share on other sites
Torbjørn Igelkjøn
5 timer siden, Jan H. Trelsgård skrev:

 

Om man leter i eldre kildemateriale og t. eks. eldre aviser tilgjengelige via nasjonalbiblioteket ser det vitterlig ut til at Børre/Børe har vært benyttet som en alternativ skrivemåte for Borre.

Eksempler: https://www.nb.no/items/d07e245cea818fbe46736b40c23ee78a?page=35&searchText=børre 

https://www.nb.no/items/d6c09021322787b46b61b71862d54e1a?page=9&searchText="børre sogn"

 

Då er dette eit svært godt eksempel på kvifor ein skal skrive det som verkeleg står i staden for det ein trur det er meint å stå. Å avgjere om ein skrivemåte er reell eller slurvete skrift kan vere vanskeleg, og her ville eg ha bomma.

Share this post


Link to post
Share on other sites
Torbjørn Igelkjøn
Posted (edited)
5 timer siden, Tone Merete Bruvik skrev:

3.  Hvis du ønsker å rette opp en telling eller eventuelt lage en helt ny avskrift, ta kontakt med oss på epost digitalarkivet@arkivverket.no Ta kontakt FØR du begynner. Vi vil gjerne at du bruker en mal fra oss for å få med ID-til personer og bostedene slik at disse blir bevart i en ny versjon, det sikret at permanente lenker faktisk er permanente. Dette står også her i orienteringen om 1891-tellingen,  "Om 1891-tellingen fra Ancestry, MyHeritage og FamilySearch": https://www.digitalarkivet.no/content/462/om-1891-tellingen-fra-ancestry-myheritage-og-familysearch 

 

PS! Merk at for tellinger og andre transkriberinger som er laget av noen av de mange frivilligere, og som disse har rettighetene til, vil vi jo ta kontakt med dem før rettelser blir gjort, og de kan da ordne feilene selv hvis de ønsker det. 

 

Då er det altså også mogelegheiter for dei som evt. ynskjer å registrere ein AMF-database på nytt. Bra!

Edited by Torbjørn Igelkjøn

Share this post


Link to post
Share on other sites
Ivar S. Ertesvåg
Posted (edited)
7 timer siden, Jan H. Trelsgård skrev:

 

Om man leter i eldre kildemateriale og t. eks. eldre aviser tilgjengelige via nasjonalbiblioteket ser det vitterlig ut til at Børre/Børe har vært benyttet som en alternativ skrivemåte for Borre.

Eksempler: https://www.nb.no/items/d07e245cea818fbe46736b40c23ee78a?page=35&searchText=børre 

https://www.nb.no/items/d6c09021322787b46b61b71862d54e1a?page=9&searchText="børre sogn"

 

tja... ser det sånn ut, eigentleg?  Litt kjeldekritikk her ....

Eg søkte på nb.no etter "Børre sogn" og fekk tilslag på 3 aviser og 11 bøker. I dei siste var 3 eks av same skjønnlitterære bok, ei avskrift av ei kjelde frå 1500-talet (kva no "ø" representerer der...), og 5 hefte frå RHD med avskrifter frå  FT1865 og FT1875. det eine tilfellet eg sjekka, var ført inn som ei retting (frå Børre til Borre). Og så var det den eine boka du lenkjer til (som sjølv inneheld 4 "Børre" og 32 "Borre")

"Børe sogn" ga tilslag i 1 avis og 2 av dei same hefta frå FT1865 og det same kjeldeskriftet.

Til samanlikning ga "Borre sogn"  tilslag i 219 bøker, 617 aviser og 56 tidsskrift.

Eg vil vel seie at det ikkje er dekning for å seie at " ser det vitterlig ut til at Børre/Børe har vært benyttet alternativ skrivemåte".

ø-tilfella er ikkje fleire enn at alle kan vere trykkfeil.

 

Edited by Ivar S. Ertesvåg

Share this post


Link to post
Share on other sites
Kristin S. Aasen

 

Det er rett at man skal skrive som det står, og ikke hva man tror det står. Men ikke alltid lett. Selv har jeg prøvd å tyde noen vanskelige bokstaver flere ganger i likhet med flere andre. Da oppstår det lett feil. Tror det beste er å se andre lignende innførsler eller å se i originaler, kirkebøker, folketellinger og så videre. For å sammenligne. Før man transkriberer ferdig ordet. Da reduserer man kanskje risiko for feil.

Derfor liker jeg selv bedre korrekturlesning enn transkribering.

 

En stor kred til de personene som jobber med transkribering. Jeg tåler å se noen feil, men det er bedre enn ingenting. Man kan slå opp i originaler hvis det finnes eller spørre institusjoner. Feil blir rettet over tid. "Tålmodighet er en dyd".

 

Kan fortelle en historie. Det stod et navn i bekreftet grunnboksutskrift mottatt fra Kartverket tidlig på 1990-tallet i posten (avskrevet med penn). Navnet (Bastudalen) klarte jeg ikke å forstå og lurte på det i mange år. Spurte i avisen. Ingen respons. Senere tenkte jeg kanskje Basledalen. Etter å ha stilt samme spørsmål nylig igjen i en gruppe på FB, var det en som "endelig" la inn bilde av notis i avis (trykt papiravis) fra slutten av 1800-tallet. Eiendommen ble opprettet i 1860-årene. Da skjønte jeg at avskriften måtte ha kommet fra tyding av notis. Eller annen kilde med slike bokstaver. H ble tydet til B. (Gotiske bokstaver?). Svar: Hasledalen (skrives annerledes i dag). Man må nesten kjenne lokalhistorien.

Share this post


Link to post
Share on other sites
Jon Erik Berg-Hansen
Posted (edited)

Da har det gått omtrent to uker siden jeg oppretta temaet.

I # 24 og # 28 var det antydning til at problemet ble registrert av personer "innafor" DA,

men jeg kan ikke se at det foreløpig har kommet noen tilbakemelding om eventuell bevegelse i saken.

mer enn 1200 visninger kan vel tyde på at "problemet" har en viss interesse!

Edited by Jon Erik Berg-Hansen

Share this post


Link to post
Share on other sites
Jon Erik Berg-Hansen

Det har gått nye to uker uten at jeg registrert noen konkrete reultater for å løse dette problemet.

Er det ingen her som vet eller kan gjøre noe for å påvirke en eventuell prosess?

 

Nå 1400 visninger

Share this post


Link to post
Share on other sites
Tone Merete Bruvik

Her må jeg nok bare gjenta det jeg skrev i mitt svar fra 22. mai: 

 

På 22.5.2020 den 9.31, Tone Merete Bruvik skrev:

2. Vi kan en relativ tung behandling av rettelser i søkbare data, slik at vi greier ikke å gjøre dette så fort som  man skulle ønske. Det kan ta flere år fra en feil meldes, til vi får rettet det. 

 

Det er dessverre slik at vi ikke får rettet feil fort.

Share this post


Link to post
Share on other sites
Jon Erik Berg-Hansen
Posted (edited)

Jeg har ikke meldt/varsla noen spesifikke feil i denne saken.

Enkelttilfeller fra f.eks kirkebøker meldes inn "på vanlig måte."

 

Kan de påpekte systematiske registrerings/forståelsesfeil (iallfall godt over 1000) i tolking av Stedsnavnene Horten og Borre rettes

på en rasjonell/systembetinget måte? Da skal jeg hive meg på i et forsøk på å utbedre "skadene."

 

I denne sammenhengen mener jeg at å be om innmelding av enkelttilfeller blir en "håpløs" løsning.

En nyregistrering av f.eks. tellinga for 1891 for Horten og Borre frister meg heller ikke akkurat nå - har akkurat sendt inn 1920 for Horten.

 

Edited by Jon Erik Berg-Hansen

Share this post


Link to post
Share on other sites
Olaf Larsen
Posted (edited)

Jeg har bedt om retting av feiltranskriberte navn ved noen tilfeller, og de har blitt rettet, selv om det tok litt tid. Det får man finne seg i når det gjelder enkelttilfeller. Jeg lurer på om det er samme person/gruppe som systematisk har utført registreringene som er feil? Da bør kanskje vedkommende lukes ut av systemet.

 

Jeg reagerte også litt på en kommentar om 'tåpelig spørsmål'. For de av oss som har holdt på en stund, kan vel svært mange av 'ferskingenes' spørsmål ofte virke tåpelige, men vi hjelper dem jo likevel så godt vi kan. Jeg synes det er både unødvendig og upassende av voksne mennesker å karakterisere andre brukeres spørsmål eller meninger på den måten. Er det direkte feil man påpeker, kan man jo korrigere vedkommende på en høflig måte.

Edited by Olaf Larsen

Share this post


Link to post
Share on other sites
Jon Erik Berg-Hansen

I #1 og #20 blir det beskrevet hvordan den store mengden "systematiske" feilttolkninger i hovedsak oppstår - nemlig ved å sette bort digitaliseringa av kildemateriale (spesielt 1891-tellinga) til utenlandske aktører uten god nok språklig eller kulturell forståelse for oppgaven. Jeg kan jo håpe at dette ikke skjer igjen - men ønsker nå en rasjonell metode for å rette opp disse feila!

Share this post


Link to post
Share on other sites
Torbjørn Igelkjøn
Posted (edited)

Tone Merete Bruvik er inne på dette med systematiske feil 22/5. (Mi utheving):

 

På 22.5.2020 den 9.31, Tone Merete Bruvik skrev:

1. Meld feil gjerne ved hjelp av korrekturmeldingene som flere av dere nevner i tråden her, men skriv gjerne i disse at det gjelder flere i samme telling i disse. Vi behandler alle korrekturmeldinger for en telling samtidig, slik at hvis det meldes om gjennomgående feil kan vi rette det i samme slengen. Da er det faktisk en fordel for oss at man ikke lager mange korrekturmeldinger for samme feilen, da slipper vi å kvittere ut en masse korrekturmeldinger om det samme. Men dette siste skjønner vi jo ikke er helt enkelt for dere å tenke på. 

 

Eg antar at Digitalarkivet har verktøy for å rette slike systematiske feil.

Edited by Torbjørn Igelkjøn

Share this post


Link to post
Share on other sites
Olaf Larsen
9 timer siden, Jon Erik Berg-Hansen skrev:

I #1 og #20 blir det beskrevet hvordan den store mengden "systematiske" feilttolkninger i hovedsak oppstår - nemlig ved å sette bort digitaliseringa av kildemateriale (spesielt 1891-tellinga) til utenlandske aktører uten god nok språklig eller kulturell forståelse for oppgaven.

Gjelder ikke de samme problemene også ved digitalisering av kirkebøker, eller er utenlandske aktører bare aktuelle for folketellingene? Kirkebøker må jo i så fall være enda verre, på den måten at det blir mange enkeltrettinger.

Share this post


Link to post
Share on other sites
Jon Erik Berg-Hansen
Posted (edited)

#41

11 timer siden, Torbjørn Igelkjøn skrev:

Eg antar at Digitalarkivet har verktøy for å rette slike systematiske feil

 

Det er nettopp dette jeg etterlyser.

Foreløpig har jeg ikke oppfatta noen bekreftelse på at det er mulig å fikse dette "innafra" i DA.

 

Er det mulig???

 

At prosessen eventuelt ikke kan gjennomføres i løpet av ei uke eller to er helt greit - men det hadde vært hyggelig med et svar om det er mulig (og gjerne en antatt tidsplan).

 

Sitert fra #41

1. Meld feil gjerne ved hjelp av korrekturmeldingene som flere av dere nevner i tråden her, men skriv gjerne i disse at det gjelder flere i samme telling i disse. Vi behandler alle korrekturmeldinger for en telling samtidig, slik at hvis det meldes om gjennomgående feil kan vi rette det i samme slengen. Da er det faktisk en fordel for oss at man ikke lager mange korrekturmeldinger for samme feilen, da slipper vi å kvittere ut en masse korrekturmeldinger om det samme. Men dette siste skjønner vi jo ikke er helt enkelt for dere å tenke på. 

 

Dette er vel ikke en metode for "mitt" problem (1000+ feil) - eller misforstår jeg helt/delvis svaret?

 

 

 

 

 

 

#42

6 timer siden, Olaf Larsen skrev:

Gjelder ikke de samme problemene også ved digitalisering av kirkebøker, eller er utenlandske aktører bare aktuelle for folketellingene? Kirkebøker må jo i så fall være enda verre, på den måten at det blir mange enkeltrettinger.

 

Dessverre er problemet/ene (naturligvis) de samme ved digtalisering av kirkebøkene

Heldigvis er mye i det materialet gjort med norsk innsats - uten slike gjennomgående/systematiske tolkings/forståelsesfeil som jeg fokuserer på.

 

 

 

Edited by Jon Erik Berg-Hansen

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.


  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.