Gå til innhold
Arkivverket

Spørsmål om overlevering av kildeavskrifter


Leif Biberg Kristensen
 Del

Recommended Posts

Som mange vet har jeg skrevet av en betydelig mengde kildemateriale som er lagt ut på Solumslekt. Jeg henviser her til innholdsfortegnelsen.

 

Jeg vil spørre om dette er stoff som dere vil ha på Digitalpensjonatet? I første omgang kan jeg tenke meg å få lagt over kirkebøkene for Solum Mini 1 1701-1716 (egentlig klokkerbok, min avskrift går ut 1713), Mini 2 1713-1761 og Mini 3 1761-1814.

 

Nå er jo mine avskrifter i fritekst, men jeg kan være med på en viss strukturering. Det blir under ingen omstendighet aktuelt fra min side å omarbeide disse avskriftene til gjeldende standard. Så det jeg lurer på i første omgang er hvilke minimumskrav dere vil stille til strukturering.

Lenke til kommentar
Del på andre sider

Beklager!

 

Det er klart vi er interessert i å legge ut registreringene dine fra Solum!

 

Hva gjelder de eldste avskriftene er dette fra kirkebøker som i utgangspunktet er vanskelig å strukturere, men du har tatt med lenke til de skannede kirkebøkene og i så måte kan vi godta at de ikke følger Kyrre-standarden om vi da kan kalle det register.

 

Et minimimum hvis det skal kunne legges ut som søkbare databaser og ikke bare pdf/html må være dato for handlingen (ddmm eller dd.mm og år i eget felt), felt for fornavn og etternavn, samt bosted. Hvis det er mulig å få med fødselsdato/alder for hovedpersonen(e) er det også fint. Bipersoner som fadre, forlover ol. har vi ikke krav om.

 

Jeg forstår at det blir mye arbeid å strukturere hvis du skal få alt til å tilpasse seg Kyrre, så spørsmålet tilbake må vel bli, hva er du villig til å gjøre av strukturering?

 

Send gjerne en prøve til oss digitalarkivet@arkivverket.no

Lenke til kommentar
Del på andre sider

Når det gjelder for eksempel dåp i disse gamle bøkene, er det en slik inndeling dere ønsker?

 

nr|side|dato|barns navn|fars fornavn|fars etternavn|fars bosted|mors fornavn|mors etternavn|mors bosted|faddere|merknader

 

De 5 første barnedåpene i Mini 1 vil vel da se sånn ut:

 

1|1|03.04.1701|Anna Maria|Lauritz|Hafnefouget|||||Sr. Ludvig Blydt, Sr. Peder Weibye, Rasmus Rasmuss., Pernille Jens Rasmussens, Magdalena Jensdaatter|

2|3|05.05.1701|Christen|Isach||Hommelsgaard|||||Velgiordt Marum, Villom Thommesen, Anders Søfrensen, Ingebor Høigset, Marri Jonsdaatter|

3|4|29.05.1701|Lauritz|Hr. Peder||||||Rasmus Rasmussen, Mad. Rasmus Mallings, Mad. Karren Veibyes, Anna Lisbeth Becker|

4|4|29.05.1701|Gunhild|Olle||Omdal||||Torbiøn Bergen, Peder Mellom, Børthe Suttervigen, Marren Omdal, Karren Gisholt|

5|4|05.06.1701|Niels|Erich|Hansen|||||Isach Jonsen Elset, Halvor Weeholt, Torsten Findal, Karren Isach Aafosis, Marria Lauritzd. Graaten|

 

Denne er laget «på frihånd» og jeg garanterer ikke for at feltinndelingen er 100% korrekt. Jeg skal lage et oppsett for å få det riktig.

 

«Etternavn» vil jo som regel si farsnavn (patronym). Mødre er ikke nevnt annet enn ved uekte barn før 1733.

 

Er stolpetegnet | et greit skilletegn? (Redigert: Ser i «Kyrre» at det anbefales semikolon. Vil bruke det.)

Lenke til kommentar
Del på andre sider

Jeg leser om Kyrre-standarden nå, men savner noen eksempler. Finnes det noen korte eksempelfiler (SDV flat struktur) med feltoverskrifter og registreringer fra 1700-tallet som det kunne være mulig å ta en kikk på?

Lenke til kommentar
Del på andre sider

Jeg har tenkt mer på saken og har kommet fram til at jeg ikke har noen interesse av å strukturere disse avskriftene noe mer enn det som allerede er gjort. Jeg ber om respekt for dette som er et personlig og bevisst valg fra min side. Det handler om stoffets egenart, hvordan jeg selv opplever det og hvordan jeg ønsker å presentere tekst fra 1700-tallet. Jeg føler rett og slett fysisk ubehag ved å hakke avskriftene i småbiter og putte delene i hver sin lille boks.

 

For min egen del er materialet søkbart i massevis ettersom jeg har alt sammen integrert i min produksjonsdatabase og enkelt kan gjøre søk på regulære uttrykk.

 

Dere får en HTML-versjon av avskriftene, denne kan dere presentere hvordan dere ønsker. Jeg tar opp tekniske detaljer om utformningen sammen med oversendelse av de første filene.

 

Den vanskeligste biten av jobben med transkripsjon av disse bøkene er selve tydningen av skriften, - det krever tålmodighet og kunnskap om folk og steder som er nevnt i kilden. Sånn sett kan en vel si at jeg har gjort grovarbeidet. Dersom andre har lyst til å strukturere materialet etter gjeldende standard med det arbeidet jeg har gjort som grunnlag, vil jeg selvsagt ikke motsette meg det.

Lenke til kommentar
Del på andre sider

Vi har stor forståelse for at du ikke ønsker å påta deg et stort merarbeid etter at du har gjort den viktigste jobben, nemlig å transkribere kilden.

 

Vi kan publisere dataene som html eller pdf. I den nye løsningen for Digitalarkivet satser vi på at fulltekstavskrifter også skal være søkbare i det globale søket i den blå boksen, så registreringene dine er verdifulle uansett struktureringsgrad!

Lenke til kommentar
Del på andre sider

Takker for fint svar. Jeg har allerede oversendt et utkast av avskriftene for Solum 1701-1713, og avventer tilbakemelding på dette.

 

Artig å høre at også fulltekstavskrifter skal bli søkbare. I så fall kan det vel være lurt å dele dem opp på postnivå?

Lenke til kommentar
Del på andre sider

Ressurser vil avgjøre hvordan vi får gjennomført fulltekstavskriftene. Har vi god tid og personer nok, kan avskrifter "tagges" en hel del og bli lett strukturerte.

Lenke til kommentar
Del på andre sider

Ressurser vil avgjøre hvordan vi får gjennomført fulltekstavskriftene. Har vi god tid og personer nok, kan avskrifter "tagges" en hel del og bli lett strukturerte.

 

Nå ble jeg veldig interessert :)

 

En slik "tagging" - gjerne med normaliserte navn - er jeg med på. Har du noen dokumentasjon på struktur / metode?

Lenke til kommentar
Del på andre sider

Jeg har sett litt på HTML-filene du sendte oss. Det som hadde vært interessant å prøve, hvis det bare ikke hadde vært så travelt her hos oss, var å kode disse tekstene i et XML-system som heter TEI (Text Encoding Initiative - http://www.tei-c.org) som retningslinjer for tekster innen humaniora. Da kunne vi laget en utgave av disse kirkebøkene som bevarte den fortellende teksten, men samtidig kunne muliggjøre strukturerte søk. Både TEI og Kyrre er XML-maler, slik at hvis vi hadde teksten i TEI kunne man lage en eksport automatisk over i Kyrre.

 

Problemet er at her hos oss på digitalarkivet er det antagelig bare jeg som kunne ha gjort denne jobben akkurat nå, og jeg har rett og slett ikke tid til å gjøre det i et inneværende året med alt det andre som skal gjøres.

 

Det vi imidlertid kan gjøre er å legge materialet du har sendt oss mer eller mindre som det er, som en Webbok. Og vi kunne i tillegg, hvis du synes det er greit, spurt noen av pensjonatgjestene våre om de kunne tenke seg å konvertere teksten fra HTML til Kyrre via Augustus. Det vil antagelig medføre at de taste det om igjen, men da fra din transkriberte tekst, noe som jo er mye letter enn å skrive av kilden.

Lenke til kommentar
Del på andre sider

Jeg synes også at TEI er interessant fordi det kombinerer det beste av to verdener, det gjør teksten søkbar samtidig som den beholder sin opprinnelige struktur. Derimot er det forferdelig tidkrevende :(

 

Jeg skulle gjerne sett på DTD'en til den varianten av TEI du ville brukt, og om du vil tagge et par poster av hver type i mine avskrifter som et eksempel og sende til meg kan jeg se litt på det selv.

 

For øvrig har jeg sagt over at for min del er det helt greit dersom andre konverterer teksten fra fritekst til Kyrre-format.

Lenke til kommentar
Del på andre sider

Jeg har laget til et forslag til TEI skjema som kan være et utgangspunkt. Det er lett å endre seinere hvis det mangler noe. Det som er den største ulempen er at det er for mange elementer her som antagelig ikke vil bli brukt og som skaper støy.

 

Skjemae (TEI_kirkebok.rnc) er i Relax NG compact form. Jeg foretrekker klart Relax NG fremfor DTD fordi det gir bedre kontroll med innhold i elementer og attributter.

 

I vedlagte pakke er også et testkoding (Solum 1.xml) av de første postene i første kirkebok vedlagt. Det blir mye kode, spesielt i dåpen med alle fadderne. Men graden av koding kan bestemmes selv.

 

I tillegg til skjemaet og test-filen ligger også en XML-fil (TEI_kirkebok.xml) som innholder parametrene til tjenesten ROMA (http://www.tei-c.org/Roma/) som ble brukt for å lage til skjemaet.

 

Og jeg anbefaler at det brukes en XML editor i kodingen. Vi bruker Oxygen, men den koster en del penger. Den kan lastes ned med en 30-dagers prøvelisens: http://www.oxygenxml.com/

TEI_kirkebok.zip

Lenke til kommentar
Del på andre sider

Når LBK har gjort en sånn kjempejobb og er villig til å dele det med alle, går det ikke an å legge det ut som søkbar PDF bok? Det høres ut som hans avskrifter er rene "læreboken" i uttrykksmåter fra den tiden. Jeg tror mange kunne ha nytte av det, i allefall jeg.

Lenke til kommentar
Del på andre sider

Takk til Tone for filene. Dette skal jeg se nøye på, og kommer til å sende deg kommentarer og en litt utvidet test snart. Jeg kjører Linux og har arbeidet mye med tekstmanipulasjon, og regner med at jeg har verktøy for å merke opp stoffet som XML uten altfor mye dikkedarer. Jeg kan eventuelt bygge en forenklet markup selv og konvertere til XML.

 

Imidlertid håper jeg også som Berit at dere legger ut stoffet snarest på enklest mulig form. Dette med strukturering / koding kommer uansett til å ta lang tid.

 

Alle mine kildeavskrifter ligger til fri avbenyttelse på Solumslekt under Kilder, slik at Berit og andre har full tilgang til dem. Jeg regner ikke med å fjerne dem derfra om Digitalarkivet vil publisere dem. Jeg gir dem til Digitalarkivet for å sikre at arbeidet mitt skal få leve videre etter meg.

 

Så håper jeg at jeg også kan få gitt bort slektsdatabasen til noen som vil ta ansvar for den etter at jeg er borte. Der begynner jeg å se muligheter - uten at jeg ennå kan gå ut med noe spesifikt B)

Lenke til kommentar
Del på andre sider

Join the conversation

Du kan poste nå og registrere deg senere. If you have an account, sign in now to post with your account.

Gjest
Skriv svar til emnet...

×   Du har limt inn tekst med formatering.   Fjern formatering

  Only 75 emoji are allowed.

×   Lenken din har blitt bygget inn på siden automatisk.   Vis som en ordinær lenke i stedet

×   Ditt forrige innhold har blitt gjenopprettet .   Tøm tekstverktøy

×   You cannot paste images directly. Upload or insert images from URL.

 Del

  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...

Viktig Informasjon

Arkivverket bruker cookies (informasjonskapsler) på sine nettsider for å levere en bedre tjeneste. De brukes til bl.a. skjemaoppdateringer og innlogging. Bruk siden som normalt, eller lukk informasjonsboksen for å akseptere bruk av cookies.