Gå til innhold
Arkivverket

[#28755] Bug i søkefunksjon FT?


Gjest Leif Kåre Solberg
 Del

Recommended Posts

Gjest Leif Kåre Solberg

Ved søk i FT 65 etter ”yrke” ”inneheld” ”drager” får jeg ingen tilslag for Hordaland. Når jeg derimot søker på navn etter ”Niels Gabrielsen” ”Bergen” får jeg tilslag hvor yrket er oppgitt til: ”Logerende Drager”. Lenke

Lenke til kommentar
Del på andre sider

Gjest Leif Kåre Solberg

Takk for påpekingen av det som skulle vært en selvfølge, det må ha blitt for langt på natten. Jeg har nå sett nærmere på omstendighetene rundt de aktuelle tilfellene. Det viser seg da at de ikke dreier seg om enkeltstående feiloppføringer, men i hvert fall for rode 18 og 21, samt for Arbeidsanstalten i Bergen er alle yrkesopplysningene feilført under kolonnen familiestatus. Tilvarende feil kan også gjelde for andre roder. Enten denne systematiske feilrubriseringen skyldes den opprinnelige folketelleren, eller den har sneket seg inn i under avskrift/konverteringsprosessen, omfatter den så mange personer i DAs versjon av FT 65 at den må ha gi ikke ubetydelige systematiske statistiske avvik for Bergen. I tillegg kommer folk som meg som ikke på forhånd har tatt høyde for denne type feilrubrisering ved søk. Søekemotoren i DA tillater bare søk på lokalnivå, ikke globalt-, landsnivå, for felter som familiestatus. Det er i seg selv en begrensning som jeg gjerne skulle ha en bedring på, men siden RHDs versjon tillater globalt søk på denne type variable, prøvde jeg der. Det viste seg så at dette søket heller ikke ga noen tilslag. Et nytt globalt søk i RHD under yrke ga 18 tilslag, inklusive de fire nå kjente tilslagene på ”drager” i Bergen. Dette betyr at den ovennevnte feilrubriseringen må være rettet opp i RDHs versjon, men ikke i DAs. Utenom de omtalte fire dragerne i Bergen, gir for øvrig Globalt søk i DAs versjon gir 26 tilslag på inneholder ”drager”. Hvis de fire omtalte dragerne i Bergen legges til gir det 30 dragere. Dvs. at dette eksempelet avdekker et ytterligere betydelig sprik mellom DA og RDH. Jeg har ikke gått ytterligere inn i materialet for å avklare hva som skyldes ulikheter/bugs i søkemotor og hva som kan tilskrives forskjeller i opprettingsstatus på selve materialet. Eksistensen av to digitale versjoner av folketellingene med ulike søkemotorer er kanskje en nasjonal luksus, men situasjonen gir et unikt utgangspunkt for reliabilitetstesting og forbedring av begge systemer og registre. Uansett vil jeg foreslå at folketellingsmaterialet i DA rettes opp etter siste oppdatering fra RDH. Dernest anbefaler jeg at algoritmene i begge søkemotorer gjennomgås og testes mot hverandre for å avdekke ytterligere avvik og svakheter. Om ønskelig bidrar jeg gjerne i en slik prosess.

Lenke til kommentar
Del på andre sider

 Del

  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...

Viktig Informasjon

Arkivverket bruker cookies (informasjonskapsler) på sine nettsider for å levere en bedre tjeneste. De brukes til bl.a. skjemaoppdateringer og innlogging. Bruk siden som normalt, eller lukk informasjonsboksen for å akseptere bruk av cookies.