Gå til innhold
Nasjonalarkivet

Recommended Posts

Hei,

 

I det siste har jeg hatt bedre tid enn vanlig, så jeg har eksperimentert litt med å bruke AI/språkmodeller til slektsforskningsting. Jeg er bruker av histreg.no, og selv om jeg synes det er en fantastisk tjeneste er det mange kilder som er slått sammen feil, og jeg tenkte det burde gå an å skrive et lite program som analyserer en personside i histreg, som kan si fra om noen kilder ser ut til å være feilkoblet, kan foreslå et navn osv. basert på "sunn fornuft".

 

Histreg er en såpass enkel side, at å laste ned og bearbeide tabellene derfra er lett nok (trenger ikke API).

Problemet er at histreg slår sammen en del kolonner som jeg må separere igjen, og noen ganger representerer informasjon i formater som ikke er gunstige for en språkmodell. Språkmodellen min forstår f.eks hva en kommunal folketelling er, men ikke hva KFOT står for. Det finnes veldig mange forskjellige kildeforkortelser, og jeg kan ikke forklare for språkmodellen hva alle betyr.

 

Alle de problemene kunne jeg unngått om jeg spurte Digitalarkivets servere direkte. Men en side for en enkelt kildetranskripsjon i Digitalarkivet er betydelig mer komplisert å lese ut informasjonen fra maskinelt. Ideelt sett skulle jeg hatt den samme informasjonen i json eller xml (skjema-filer er ikke nødvendig!)

 

Har Digitalarkivet et offentlig API for å hente ut informasjon i digitale formater? Hvis ikke, går det an for en privatperson som meg å få API-tilgang?

Logg inn for å kommentere

Du vil kunne skrive en kommentar etter at du logger inn



Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...

Viktig Informasjon

Arkivverket bruker cookies (informasjonskapsler) på sine nettsider for å levere en bedre tjeneste. De brukes til bl.a. skjemaoppdateringer og innlogging. Bruk siden som normalt, eller lukk informasjonsboksen for å akseptere bruk av cookies.