[#74653] Sentral register over alle som har levd i Norge?

Mai 27, 2010

Jeg kunne vel ha svart Helge at det er forskjell på nummerering av forekomst av et navn i en kilde og tilordning av en person-id, men siden han svarte meg så paddete sist vi var i en diskusjon her tror jeg ikke at jeg gidder.

Mai 27, 2010

Beklager at fargene ikke kommer særlig til sin rett her. Det er vanskelig å se den gule fargen.Det tar 1-2 sekunder å knytte opp en personforekomst ved å trykke på en slik binders.Datateknisk kan det gjøres adskillig mer raffinert enn bilde nr.2 illustrerer. Man trenger ikke å få opp binders på personforekomster som ikke kan gjelde samme person, f.eks. kunne man kjapt sløyfet binders på alle menn.Programrutiner kan lett søke frem neste forekomst som ikke tidligere er lenket mot andre og foreslå kandidater. Er man godt kjent og holder tunga rett i munnen kan man da f.eks. krysse av for 'ja - alle foreslåtte fedre / brudgom og mødre / brud' gjelder de samme to personene. Så leter programmet frem neste sett med personforekomster.Jeg har aldri målt hvor fort jeg kan lenke sammen forekomster, men med brukbar nøyaktighet (99,9%) lenket jeg flere ganger sammen flere tusen forekomster mens jeg testet og utviklet programmet.Det er ikke vist her, men jeg får også opp et lite symbol som indikerer at man kan få opp kilden. Ved å klikke på det kommer man til rett side i kirkeboka til Digitalarkivet.Fra dataene kan man så opprette en mer tradisjonell slektsbase. Viser et lite eksempel fra egen familie. Den er kun basert på dåpsinnførsler og viser et begrenset utdrag fra disse. Her er det ikke gjort noe annet arbeid med dataene enn å lenke sammen kirkebokforekomster som vist i de foregående bildene. Parentesene (KB) fører til kirkeboksida hos Digitalarkivet.

Mai 27, 2010

Og siden du, Leif (101) meldte deg på midt i mellom her, så får jeg benytte anledningen til å takke deg. Det er lenge siden, men du ga meg god hjelp med den delen som har med presentasjon av dataen i slektstre-form. Da med utgangspunkt i data fra TMG, riktignok.

Mai 27, 2010

Einar (103): Siden 2005 har jeg brukt en videreutvikling av det programmet som mitt registreringsprogram, nå med PostgreSQL som underliggende db-motor. Her ser du siste tilskudd, hvor jeg nå lenker opp samtlige identifiserte faddere i en barnedåp.

Mai 27, 2010

Bildet kom visst ikke med.

Mai 27, 2010

Jeg prøver igjen, programmet godtar visst ikke .jpeg-endelser:

Mai 27, 2010

Leif(106). Dette ser virkelig imponerende ut. Tror ikke jeg skal spørre deg ut om detaljene for jeg har ikke tid til å følge opp, men se ikke bort fra at jeg kan komme tilbake til saken en sen høst kveld.

Mai 27, 2010

Gremmes. Jeg er egentlig ikke en ord-deler.

Mai 28, 2010

Du kan se på bloggen min, det ligger en «executive overview» på (http://solumslekt.org/blog/?page_id=2). Der finner du også en lenke for nedlasting av kildekoden i SQL og PHP. Men det er et program som er spesialsydd for mitt personlige bruk, og vil kreve svært mye arbeid å sette seg inn i for andre. Jeg vil ikke anbefale noen å prøve dette uten å kunne relativt mye om webteknologi.

Mai 28, 2010

Vi mener det ikke er motstridende interesser mellom HBR og slektsforskermiljøet. Derfor er DIS-Norge, BSS, Lokalhistorisk institutt invitert med og flere av initiativtagerne er også medlem/aktive her. Vi inviterer gjerne andre med og er mottagelig for konstruktive forslag som det har vært flere av i denne tråden. Vi utvider gjerne gruppen som arbeider med den åpne delen av HBR og vil komme tilbake til egnede former for å organisere dette. Vi er åpne med motiver, arbeidsform, deltagelse, programkode og grensesnitt. Før vi starter den tyngre kodingen, vil det være lettere å gjøre endringerAkkurat som ved etablering av Wikipedia inviterer vi til en dugnad som innebærer mye mer arbeid enn det vi selv kan bidra med. Vi tror: 1. det vil være stor interesse, 2. øke interessen for historie inkl. slektsforskning både på kort og lang sikt. 3. det er tilnærmet ubegrenset av oppgaver ved å knytte sammen all historisk person og stedsinformasjon. Vi har vært i dialog med mange og fått oppslutning om dette synet, men hver enkelt får vurdere selv. Vi tror vi skal kunne sannsynliggjøre dette i en søknad til forskningsrådet og dette er en stor fordel for søknaden, men det er det andre som avgjør.Jeg forsøker å svare på flest mulig av kommentarene som (jeg tror) ikke allerede er besvart:Einar (76): Du har mange gode poenger og erfaring som HBR vil ha glede av. Vi trenger å tenke mer igjennom det. Folketellinger er gode å når man ser på hele populasjonen, husholdningen og boligen, men kvaliteten i dataene er kanskje ikke like bra.Einar (77): synes du argumenterer godt for at her er det mye data som egner seg for lenking og der man kan arbeide på helt andre måter enn en slektsgransker. Hver person som finner en kilde (for eksempel Aftenposten eller transkriberer en person eller stedsinformasjon fra Digitalarkivet) er også den første som har mulighet til å lenke denne. Det scannede bildet vil stå ved siden av den transkriberte teksten, så det vil være lett for andre å sjekke kvaliteten i transkriberingen senere. Det gir også motivasjon til å bidra med kilder/transkribering.Geir (78): ubegrenset informasjon: alle person- og stedsinformasjon i alle historiske kilder. Kirkebøker, skifteprotokoller, brev i privat eie, tomterest i naturen…Men vi ønsker dokumentasjon av dette i HBR, gjerne ved ekstern (permanent) lenke eller bilde.Leif (83): enig i at HBR kan være sted å samle data som mange enkeltpersoner har samlet gjennom et langt liv. Noen slektsforskere vil sikkert bli motivert av dette.Geir (90): vi har ikke bestemt inn eller ut format, men det vil være åpent.

Mai 28, 2010

Geir (78): Du skrev at jeg mener at det ikke er noen forskjell på HBR og bygdebøker. Nå skrev jeg ikke akkurat det, men jeg skrev: Jeg kan fortsatt ikke se den helt store forskjellen på HBR og gode bygdebøker.Datoer og personers lenker til andre bruk, både innenfor og utenfor bygda, gjør bygdebøkene bedre. Og vil man finne kildene bak bygdeboka, da er HBR et godt hjelpemiddel.Jeg er heller ikke redd for at bygdeboksalget skal gå ned pga HBR, tvert om.Som tidligere nevnt, vil heller Interessen for slektsforskning øke når HBR er på plass.

Mai 28, 2010

Ad (79): Hva slags forskning? Hva slags statistikk?Prosjektet faller altså inn under NFRs såkalte Infrastrukturprogram. Dette er en satsning for å gjøre tyngre (nasjonale) investeringer i utstyr, databaser og annet som tilrettelegger for forskning. Det er et kjernepunkt at dette er offentlige investeringer. Viktige aspekter for mange slike prosjekter er derfor at de åpner opp for forskning på mange fagområder og at de kommer flest mulig forskningsmiljøer til gode.Det er derfor verdt å understreke at HBR-prosjektet bare i liten grad legger opp til at prosjektdeltagerne underveis skal produsere forskningsresultater som en del av selve prosjektet. I stedet vil aktiviteten som finansieres med slike infrastrukturmidler ha som mål å legge til rette for forskning i etterkant, og dette inkluderer mange flere forskningsmiljøer enn de som er aktivt med i HBR-prosjektet. Alle data vi etablerer vil i prinsippet være åpne for alle, men tilgang vil måtte reguleres av det lovverk som gjelder for slike persondata helt allment (tilnærmet alt eldre enn 100 år er helt fritt, for det yngre er det mye strengere og mer komplisert).Et viktig ledd av forprosjektet er å kartlegge hvilken nytte forskjellige forskningsmiljøer mener de vil ha av at HBR-prosjektet realiseres, og deres innspill om hvilke prioriteringer som bør gjøres. Dokumentasjon av slike forhold er et svært viktig moment ved NFRs senere vurdering om fortsatt støtte. Vi har kommet ganske langt i dette, og har solide kontakter i mange miljøer som er veldig tydelige på at dette prosjektet vil ha meget stor verdi.Jeg gir bare en stikkordsmessig oversikt (se for øvrig Arnfinns henvisning til søknaden). De mest aktuelle fagene/disiplinene er: historie, demografi, samfunnsøkonomi, medisin, genetikk, psykologi, kriminologi, statsvitenskap, navnekunnskap, dialektforskning. Et knippe aktuelle forskningstemaer er (men her kan lista gjøres mye lenger): sosial mobilitet, fall i fruktbarhet, urbaniseringsprosessen, arveligheten til diverse sykdommer, industrialiseringsprosessen, masseutvandringa.Det kan være verdt å merke seg at for mange aktuelle anvendelser av dataene vil hovedfokuset være studier av forhold i nåtiden. Allikevel er det lange tidsspennet viktig: man har stor bruk for den historiske informasjonen for å studere nåtidsfenomenene i en større ramme og perspektiv, man trenger for eksempel genealogiske data for å studere arvelighet av sykdommer, eller man må ha med mange nok generasjoner for å kunne si noe fornuftig om hvordan yrkesvalg overføres mellom foreldre og barn. For mange av forskningsmiljøene er det derfor størst interesse for å få fylt ut med data fra 1964 (der det moderne folkeregisteret starter) og bakover, folketellinga 1950 er for eksempel særlig viktig (1960 er allerede integrert). Mange av miljøene har liten interesse for de historiske data rent isolert, dvs hvis det ikke er kontinuitet fram til i dag.Avslutningsvis: Det essensielle med den typen forskningsdata vi ønsker å få etablert er at man kan følge individer over tid (til en viss grad også rom), og at man kan følge relasjoner på tvers av generasjoner. Det er også ønskelig at man har mest mulig relevant informasjon om disse individene. All informasjonen som finnes i kildene kan i prinsippet tenkes brukt i forskjellige forskningsanvendelser. Nesten all forskning som gjør bruk av denne typen data anvender forskjellige statistiske metoder. Det faller alt for langt å gå inn på hvilke. Men det dreier seg altså om statistisk analyse, som er noe mye mer enn å lage tabeller.Til (80): Ja, SSB er en viktig deltaker i prosjektgruppa.

Mai 28, 2010

Leif (101) gulper opp at jeg skriver paddete. Jeg tar skikken der jeg kommer, og har sikkert lært noe av deg også i såmåte. Jeg har 10 datatommeltotter og er et alminnelig menneske. Du opphøyer deg som vanlig til mester. Dette er altså elitetenkning, og vi alminnelige bør ikke slippe til. Jeg stiller mange spørsmål, men stilen din skal altså være overbærende. Siste spørmålet mitt var hvordan Globalt søk i DA fungerer i praksis ? (Jeg får ikke svar på søk selv med kjente personer innen tidsperpektivet)

Mai 28, 2010

Helge: Du får det til å virke som at det er negativt å tilegne seg kunnskap. Det jeg kan om programmering og databaser har jeg faktisk lært meg sjøl. Og jeg er helt sikkert en kløne jeg også. Men det er ikke noe man lærer mer av enn sine egne feil :)Ellers synes jeg at du for din egen del burde legge om stilen litt og ikke ta alt opp i verste mening.

Mai 28, 2010

Nei, nå snur du det helt rundt. Jeg peker midt i siste innlegg at jeg spør. Det er jo innfallsvinkelen til å lære. Programmering og databaser lærte jeg først det grunnleggende av andre og seinere ved å prøve og feile, samt snappe opp fra folk og media. Å legge om stilen. Nei, jeg har ingen spesiell stil. Jeg tilpasser det skriftlige slik som det passes målgruppe, om det så være enkeltperson eller flere. Kanskje vi kan bære over med hverandre at jeg skriver på min spørrende måte og du bruker ekspertliturgi med engelsk og forkortelser ? Atter et spørsmålstegn.

Mai 28, 2010

Hvis du noengang har programmert litt ut over det helt trivielle, vet du at det er ti ganger så mye arbeid å lage noe som kan brukes av andre uten spesielle forkunnskaper enn å lage noe til eget bruk. Det er bare sånn det er, hvis det er det du mener med at jeg opphøyer meg til mester. Jeg har verken tid, motivasjon eller kompetanse til å skrive programvare for andre.Etiketten «ekspertliturgi» kan vel passe på litt av hvert i denne tråden. Jeg skjønner ikke hvorfor du henger den på meg.

Mai 28, 2010

Leif (101) Ja, det er jo nettopp tilordning av felles personnummer i basene for en person som er nødvendig. Hos Einar i 97-100 er det hele tiden menneskelig peking først, før han bruker bakenforliggende tabell. Alt i datamasinene er tabeller og adresser, (I tllegg til programinstruksjoner da). Når vi har pekt og tilordnet, holder databaseprogrammene styr på resten. For eksempel kobling mellom filer, gjerne gjennom indeksfiler som inneholder den fysiske lagringsadressen til de aktuelle postene i basisfilene.

Mai 28, 2010

Strengt tatt finnes det jo andre modeller enn tilordning av ett personnummer pr. individ. Man kan også koble sammen to forekomster av et personnavn i to ulike kilder mot en felles identifikator, som betyr at man antar at det er samme person. Denne felles identifikatoren kan man så knytte opp mot en eventuell tredje forekomst av navnet med enda en felles identifikator osv. slik at det vokser fram et «bilde» av personen i form av en trestruktur. Dette var essensen i GDM-modellen, som jeg tror Einar baserer sin datamodell på. (Jeg leste mye om dette da jeg gikk i gang med å skrive mitt eget slektsprogram.)Det er langt enklere teknisk sett å knytte alle kildeforekomster av et navn opp mot en felles person-id, det er også den løsningen jeg og de fleste andre har landet på. Men det er også langt vanskeligere å for det første skille mellom hva som faktisk framgår av kilden og hva som er våre egne konklusjoner, og for det andre å kunne reversere feilaktige sammenkoblinger.Ellers holder jeg med deg i at sammenlenking nødvendigvis må være en i hovedsak manuell prosess. Det er nok langt igjen til datamaskiner kan overgå den menneskelige hjerne i å gjenkjenne mønster på nær sagt alle nivåer. Så jeg har ingen tro på at slektsforskerne blir arbeidsløse i løpet av de nærmeste femti åra :)

Mai 28, 2010

Leif (18). Jeg er enig med deg ord for ord. Jeg bruker vel ordet personnr der du skriver identifikator. Ja, kjært barn har mange navn, en kan korte det ned til ID og jeg har også skrevet at dette er søke-/koblingsnøkkel. Ut over dette nevnte jeg indeksfiler, som gjerne brukes ved søk. Ved søk på Hans Olsen, kan det ofte være lagt opp slik, at du søker på Hans. Det blir generert en indeksert fil. Deretter beholder du Hans og søker videre på Olsen. Da blir det indeksert en ny fil, mye mindre, som kun inneholder filadressene til Hans Olsen'er. Disse indeksene kan først være i CPU's hukommelse som tabeller. Hvis de er store, legges de ut på disk. Dine identifikatorer er altså vesentlig for meg. Slektsforskerne må altså opprette de identifikatorne som filene skal lenkes sammen med. Enda en gang enig med deg Lars, at slektsforskerne behøver ikke å gå til NAV av den grunn.

Mai 28, 2010

Det bør etterhvert også lages ID-numre for folk som levde på f eks 1600- og 1700-tallet. Hvordan det kan gjøres, vet jeg ikke. Kanskje en nummerserie ordnet etter anntatt fødselsår.

Mai 28, 2010

Geir - i diverse innlegg - jeg tror ikke du trenger være redd for slektsforskning som hobby i framtida. Alt som produseres skal ideelt sjekkes, det gjelder også HBR. Å koble/lenke mellom mange forskjellige kilder vil uansett være en risikosport. Når man har arbeidet en del med mer enn egen slekt ser man fort hvor mange problemer som finnes, selv på 1800-tallet. På østlandet var det f. eks. mange fødsler utenfor ekteskap. Mange av disse byr på store problemer med identifikasjon.Etter mange års arbeid har jeg ennå ikke klart å idenfisere min egen tippoldefar med sikkerhet. Hvordan 'utenforstående' skal klare det ved linking av diverse baser/kilder skjønner jeg ikke i dag. Eller - det vil si, det er ikke vanskelig å lenke en person som far til min oldefar, navnet er jo tilgjengelig ved barnets dåp. Problemet er å lenke farskapet til rett person.Jeg synes ideen med HBR i utgangspunktet er god, men kanskje noe naiv i forhold til vanskelighetsgrad. Det er en myte at 1800-tallet er lett å arbeide med. Jo, lett i mange tilfeller, men det er mange fallgruver. For den som ikke ser disse er det selvfølgelig enkelt. Med tida er det blitt noen anetavler jeg desverre? har ødelagt. De kan se tilforlatelige og rimelige ut, og bygger ofte på forveksling av like navn og sted, noe så enkelt som at Ole Olsen på Øverby 1865 ikke er samme Ole Olsen på Øverby 1875 selv om alderen er noenlunde lik.

Mai 28, 2010

Jeg tror ikke man skal legge så stor vekt på nummerne, de kan like gjerne være vilkårlige løpenummer etterhvert som navneforekomster blir registrert i databasen. Lenking eller forslag om mulig identitet må jo baseres på navn og kronologi.For øvrig er gode, fonetiske navnesøkrutiner som er tilpasset historisk norsk språk og ortografi noe som er viktig å få på plass. Etter det jeg kjenner til, finnes det ikke gode algoritmer for dette i dag. Jeg har (i all beskjedenhet) utviklet et eget fonetisk navnesøk for min egen database, da jeg ikke fant noe som var brukbart.Den store utfordringen - spesielt med forskning på 1700-tallet - er det store antallet forekomster av like navn, for eksempel Anne Olsdatter, kombinert med sparsomme og flertydige innførsler. Her vil man aldri komme i mål med korrekt sammenstilling av dåp, giftermål, barnefødsler og begravelse for mer enn et lite fåtall hvor det forekommer ett eller flere skifter som belyser forholdene.

Mai 28, 2010

Ja, og det samme løpenummer må finnes for samme person i to eller flere filer. Ellers går det ikke an å holde de forekomstene opp mot hverandre. Person 10 i en fil kan ikke kobles mot samme person i en annen fil der denne personen er nr.1400. Det er mennesket som må lage samme, felles identifikatorer. Du Leif har laget fonetiske (uttale)-søk. Det er jo avansert. Navnene vil jo kunne være registrert ulikt, alder, geografi for hver person. Her er det menneskelig vurdering som må til for å tilordne/samordne identifikatorer. Når jeg leser Kåre Bævre (112) omfattes alt av mulige vitenskaplige gevinster. Langt ute i artikkelen, nærmest som en bisetning står det: man trenger for eksempel genealogiske data for å studere arveligheten av sykdommer. Konklusjonen er, at dette prosjektet dreier seg om statistisk analyse. Er vi iferd med å bli bondefanget ?

Mai 28, 2010

Når jeg leser den oppdaterte prosjektbeskrivelsen til Lars Holden får jeg en engstelig fornemmelse av at DIS-Norges DIStreff, landets største ansamling av bløff, svindel og bedrag, skal overføres til HBR-wiki. Men jeg håper det er en ubegrunnet engstelse. For det står i dokumentet at det kun kommer på tale å importere gedcom-filer med aner fra ''seriøse genesloger''. Men når DIS-Norge er nevnt såpass ofte, blir man jo bekymret.

Mai 28, 2010

Holdens tekst forklarer godt hvordan personkildeforekomstene nummereres, PKID-numre. Men jeg forstår ikke helt hvordan personsidene nummereres. Det skal jo gjøres med et PID-nummer. Har noen en forklaring for meg ?

Logg inn

[#74653] Sentral register over alle som har levd i Norge?

Recommended Posts

Gjest Leif Biberg Kristensen

Lenke til kommentar

Del på andre sider

Populære Dager

Populære Dager

Gjest Einar Aasprong

Lenke til kommentar

Del på andre sider

Gjest Einar Aasprong

Lenke til kommentar

Del på andre sider

Gjest Leif Biberg Kristensen

Lenke til kommentar

Del på andre sider

Gjest Leif Biberg Kristensen

Lenke til kommentar

Del på andre sider

Gjest Leif Biberg Kristensen

Lenke til kommentar

Del på andre sider

Gjest Einar Aasprong

Lenke til kommentar

Del på andre sider

Gjest Einar Aasprong

Lenke til kommentar

Del på andre sider

Gjest Leif Biberg Kristensen

Lenke til kommentar

Del på andre sider

Gjest Lars Holden

Lenke til kommentar

Del på andre sider

Gjest Jan Erik Aas

Lenke til kommentar

Del på andre sider

Gjest Kåre Bævre

Lenke til kommentar

Del på andre sider

Gjest Helge Hålåsæter

Lenke til kommentar

Del på andre sider

Gjest Leif Biberg Kristensen

Lenke til kommentar

Del på andre sider

Gjest Helge Hålåsæter

Lenke til kommentar

Del på andre sider

Gjest Leif Biberg Kristensen

Lenke til kommentar

Del på andre sider

Gjest Helge Hålåsæter

Lenke til kommentar

Del på andre sider

Gjest Leif Biberg Kristensen

Lenke til kommentar

Del på andre sider

Gjest Helge Hålåsæter

Lenke til kommentar

Del på andre sider

Gjest Tore H Vigerust

Lenke til kommentar

Del på andre sider

Gjest Arild Kompelien

Lenke til kommentar

Del på andre sider

Gjest Leif Biberg Kristensen

Lenke til kommentar

Del på andre sider

Gjest Helge Hålåsæter

Lenke til kommentar

Del på andre sider

Gjest Tore H Vigerust

Lenke til kommentar

Del på andre sider

Gjest Tore H Vigerust

Lenke til kommentar

Del på andre sider