Gå til innhold
Arkivverket

Sortering, søking og eksport


Norodd Hagenson
 Del

Recommended Posts

Når eg skal henta ut 20 av over 1500 postar, er søk, sortering og eksport viktig. Følgjande eksempel illustrerer problema:

 

1) Sortering: Dette kan best illustrerast ved eit eksempel: Eg søkte etter sofi*, døde, Hordaland. Eg fekk opp over 1500 treff. Det gjekk fint med Sofie, Sophia og liknande former. Bra så langt. Eg sorterte visinga på dato for hending. Mesteparten av treffa sorterte seg fint. Men så kom ein bolk med usorterte treff, tydelegvis fordi år og dato ikkje var komplette for desse postane. I nokre tilfelle var det berre år, i nokre kyrkjeleg dag på latin, og i eit tilfelle 221298. Eg ville gjerne ha 1700-tals treffa. Eg valde då dato for hending til 1801, og fekk med mykje, men ikkje postane med kyrkjedag på latin (utan år). Eg greidde heller ikkje å få fram desse postane ved å velja dato for hending større enn. Om det var meir som mangla, veit eg ikkje. For meg ser det ut som om slike postar med berre kyrkjedag fell ut når ein avgrensar på dato for hending. Om dette er ein programfeil, eller eit bevisst val på grunn av utfordrande data, veit eg ikkje. Kyrkjedagar på latin høyrer i alle fall til 1700-talet og tidlegare.

 

Spørsmål: Kva kan gjerast, og kva vert gjort for at postar som i dag ikkje har standard oppsett på dato skal kunna sorterast rett, og komma med på rett måte ved avgrensing på dato for hending?

 

Spørsmål: Kva kan gjerast, og kva vert gjort for at alle postar skal innehalda og visa år, ikkje berre kyrkjedag på latin?

 

Spørsmål: Vert postar som ikkje har standard oppsett, retta opp, og kva er tidsperspektivet for dette?

 

2) Søking: Eit av dei verkeleg store problema med søk i Digitalarkivet etter at søket vart fornya for mange år sidan, er at ein kan aldri vera sikker på at ein får med alle treff. Namnevariantar har rett nok løyst noko av problemet, i alle fall eit stykke på veg. I det aktuelle tilfellet lurte eg på om det mangla ei Sofie på Stord. Så eg søkte på sofi*, døde, Stord. I søket under punkt 1 fekk eg tre 1700-tals treff på Stord. I det nye søket fekk eg ingen, berre nyare treff. Skilnaden på dei to søka er altså berre val av geografi, Hordaland eller Stord. Dette er eit typisk eksempel på at treff som skulle vore med, vert borte. På Voss er eg van med at eg får null tilslag i enkelte eldre manntal, sjølv om eg veit at postane skal liggja der. Eg har ein mistanke om at databaseinnhaldet for ein del kjelder er ufullstendig, ved at det ikkje er flagga alle område (større og mindre) som postane høyrer til. Kva anna som eventuelt kan vera ufullstendig i databasane, veit eg ikkje.

 

Spørsmål: Kva kan gjerast, og kva vert gjort for at databaseinnhaldet følgjer standarden, og er fullstendig, slik at ALLE aktuelle postar vert viste?

 

3) Eksport: Eg kunne godt tenkja meg å kunna eksportera innhaldet i ei treffliste til eit rekneark. Eg prøvde å kopiera manuelt og lima inn både med lenker og som rein tekst. Litt småproblem vart det, anten med kjønn som ein del av namnefeltet, eller at kvar post kom på to linjer. Og uansett vart det manuelt arbeid.

 

Spørsmål: Vil det komma nokon eksportfunkjon  frå søkeresultat til rekneark?

 

 

 

Endret av Norodd Hagenson
Lenke til kommentar
Del på andre sider

Hei

 

For å svare på spørsmålene dine.

 

Sortering: 

- Det gjøres ikke noe i dag for å endre hvordan feltet Hendelsesdato fungerer. Dette feltet har som utgangspunkt år + dato som førte treff. Der man ikke har en dato, men kun et år, vil dermed komme bak treffene med år/dato. Man kan ikke legge til en dato for en hendelse kun for at det skal passe inn i en struktur. Noen hendelser har også perioden f. eks 1959-1986. 

- Latinske datoer har jo ikke tall, men tekst og vil derfor også komme bak kombinasjonen år/dato.

- Det er ikke aktuelt å endre f.eks "Domin. Septuages" til en verdslig dato. Man skal transkribere teksten slik den står i originalen. 

 

Søking:

Jeg er usikker på hva du mener med dette spørsmålet "Kva kan gjerast, og kva vert gjort for at databaseinnhaldet følgjer standarden, og er fullstendig, slik at ALLE aktuelle postar vert viste?"

 

Når det gjelder skrivemåter i transkriberinger, så skal de alltid samsvare med originalen. Det er ikke snakk om å standardisere disse. Når det gjelder variantsøket så er dette kun ment som en viss hjelp. Dette er ikke noe komplett liste som gir treff på alle tenkelige/utenkelige skrivemåter på et navn. Her er det helt klart rom for forbedring, men pr i dag er ikke dette noe som det jobbes med. 

 

Spørsmål: Vil det komma nokon eksportfunkjon  frå søkeresultat til rekneark? Det er ingen planer om det. 

Lenke til kommentar
Del på andre sider

Eg er heilt med på at transkriberinga skal vera slik det står i kjelda. Det er heilt grunnleggjande. Eg ber slett ikkje om noko endring der. Men når det i transkripsjonen berre står ein dato på latin, og ikkje år, då ville eg gjerne hatt med året òg. For året står i kjelda, ikkje sant? Og då burde det vel komma med i transkripsjonen?

 

Sortering:

For meg ser det ut som om berre postar av typen åååå-mm-dd vert sorterte rett, og kjem først når eg sorterer på dato for hending. Deretter kjem dei med berre årstal, ufullstendig dato, berre latinsk dato, eller typen ååmmdd, alt heilt utan sortering. Det eg ønskjer meg, er at alle postane vert sortert rett, i det minste på år, særleg når året finst i databasen eller kjelda. Eg er klar over at det kan vera utfordringar med datamateriale som ein gong i tida har vorte transkribert på litt ulikt vis. Men dette sorteringsproblemet er òg noko som let seg løysa. Om det t.d. står berre åååå i ein post, går det an å sortera den som om det sto åååå-00-00, men berre visa den som åååå.

 

Søking:

Om du samanliknar dei to eksempla mine, vil du sjå at Stord-postar, som kjem fram ved søk i Hordaland, ikkje kjem fram ved søk på Stord. Her meiner eg at det er noko gale, truleg i datamaterialet, og knytt til geografien. Og det gjeld langt frå berre dette tilfellet. Eg meiner det er viktig at alt som burde komma fram i eit søk, faktisk kjem fram. Det er det eg spør etter. Eg formulerte nok spørsmålet litt for rundt og generelt.

Lenke til kommentar
Del på andre sider

5 timer siden, Norodd Hagenson skrev:

Søking:

Om du samanliknar dei to eksempla mine, vil du sjå at Stord-postar, som kjem fram ved søk i Hordaland, ikkje kjem fram ved søk på Stord. Her meiner eg at det er noko gale, truleg i datamaterialet, og knytt til geografien. Og det gjeld langt frå berre dette tilfellet. Eg meiner det er viktig at alt som burde komma fram i eit søk, faktisk kjem fram. Det er det eg spør etter. Eg formulerte nok spørsmålet litt for rundt og generelt.

 

Kan du lenke til trefflistene for dine to eksempler?

Lenke til kommentar
Del på andre sider

Eg har sjekka eksempla ein gong til, og oppdaga at eg tok feil. Grunnen til at treffa ikkje kom fram på Stord, var at dei mangla årstal, og dermed ikkje kom med ved å leggja til avgrensing av treffa på dato for hending. At eg oversåg det, må eg berre beklaga. Men det at årstal manglar i postane, og at postane forsvinn ved avgensing på dato for hending, er likevel eit betydeleg problem, som eg gjerne skulle sett vart retta. Slik det fungere no, inviterer det til ufrivllige brukarfeil, ved at brukaren anten ikkje er merksam på slike spesielle ting, eller forsømer å ta omsyn til det i farten.

 

La oss gå vidare til Voss: Ved søk i manntala 1664 og 1701 eller i koppskatten 1645, får eg med heile Nordhordland. Einaste måten eg ser for å avgrensa søket, er å bruka tekstsøk. Men då veit eg ikkje korleis prestegjelda etc. et skrivne, og heller ikkje om det er ulike variantar av stavemåte. I det gamle Digitalarkivet kunne me få lista opp alle variantar av verdiane på eit felt. Det var til stor nytte. Noko liknande ser eg ikkje i det nye. Å få fram slike opplysningar knytt til ei kjelde, hadde vore til stor hjelp. Best ville det vore om ein får med berre det faktiske området ein søkjer på, og ikkje berre det større området som heile kjelda dekkar.

Lenke til kommentar
Del på andre sider

Det er en kjensgjerning at det er en fordel å kjenne dataenes struktur, oppbygning og fullstendighet, før man begynner å søke i dem.

 

Det du skriver om i annet avsnitt, dreier seg om at geografi er beskrevet delvis på kildenivå (metadata) og delvis i selve dataene. Der hvor det er geografiske filter i søkeskjemaene, forholder disse seg kun til geografiske metadata på kildenivå. Derfor vil det være situasjoner hvor du gjør geografiske avgrensinger ned på kommune- eller soknenivå i filteret, men hvor du likevel får treff i et større geografisk område, fordi kilden dekker et større område.

Lenke til kommentar
Del på andre sider

 Del

  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...

Viktig Informasjon

Arkivverket bruker cookies (informasjonskapsler) på sine nettsider for å levere en bedre tjeneste. De brukes til bl.a. skjemaoppdateringer og innlogging. Bruk siden som normalt, eller lukk informasjonsboksen for å akseptere bruk av cookies.