Gå til innhold
Arkivverket

HVA SKJER MED SØKEMOTOREN


Jarle E Hannisdal
 Del

Recommended Posts

Da må jeg spørre igjen, for jeg er litt dum. Ved søket ditt på fritjof~2 som du har lagt inn ovenfor, får man 10000 treff.

1) Skal jeg da forstå det slik at med angivelse av ~2, så er det bare 2 forandringer fra utgangspunktet fritjof. Det vil altså ikke fange opp fridthjoff. Eller?

2) Et vanlig avanset personsøk på fritjof, gir også 10000 treff. Her finnes både fritjof, fridtjof, frithjof, fridhtjof, fridtjov og til og med fritdhtjov. Om fridthjoff finnes, vet jeg ikke, for jeg orker ikke å bla igjennom 10000 navn eller lage et script bare for å finne hva jeg søker på.

3) Et avansert personsøk på fritjof, med kryss i ruten for 'Skru av variantsøk', gir også 10000 treff, bare på fritjof. For en som har holdt på en stund, virker jo det helt dumt, for det er jo uhyre sjelden at et søk tidligere ga så mange treff på et såpass lite brukt navn. Da er igjen spørsmålet; Hva med de andre som ikke er omfattet i treffene, for hvis det teoretisk er 20000 fritjof'er, hva med de øvrige? Hvis det f.eks. bare finnes 300 fritjofer i landet, blant de 10000 hvor resten er duplikater, hvordan finner man de 300? Skal jeg bla igjennom alle for å telle duplikater?

4) Joda, fridthjoff finnes han også, 36 treff på fridthjoff med  avslått variantsøk.

 

Problemet med 10000 treff er at jeg ikke vet hva jeg egentlig har funnet. Jeg anbefaler ferskinger å søke bredt, og så tilpasse søket med mere og mere detaljer etter hvert, men dette kan jo ta luven fra hvem som helst.

Lenke til kommentar
Del på andre sider

På 8.5.2021 den 18.13, Olaf Larsen skrev:

Da må jeg spørre igjen, for jeg er litt dum. Ved søket ditt på fritjof~2 som du har lagt inn ovenfor, får man 10000 treff.

1) Skal jeg da forstå det slik at med angivelse av ~2, så er det bare 2 forandringer fra utgangspunktet fritjof. Det vil altså ikke fange opp fridthjoff. Eller?

2) Et vanlig avanset personsøk på fritjof, gir også 10000 treff. Her finnes både fritjof, fridtjof, frithjof, fridhtjof, fridtjov og til og med fritdhtjov. Om fridthjoff finnes, vet jeg ikke, for jeg orker ikke å bla igjennom 10000 navn eller lage et script bare for å finne hva jeg søker på.

3) Et avansert personsøk på fritjof, med kryss i ruten for 'Skru av variantsøk', gir også 10000 treff, bare på fritjof. For en som har holdt på en stund, virker jo det helt dumt, for det er jo uhyre sjelden at et søk tidligere ga så mange treff på et såpass lite brukt navn. Da er igjen spørsmålet; Hva med de andre som ikke er omfattet i treffene, for hvis det teoretisk er 20000 fritjof'er, hva med de øvrige? Hvis det f.eks. bare finnes 300 fritjofer i landet, blant de 10000 hvor resten er duplikater, hvordan finner man de 300? Skal jeg bla igjennom alle for å telle duplikater?

4) Joda, fridthjoff finnes han også, 36 treff på fridthjoff med  avslått variantsøk.

 

Problemet med 10000 treff er at jeg ikke vet hva jeg egentlig har funnet. Jeg anbefaler ferskinger å søke bredt, og så tilpasse søket med mere og mere detaljer etter hvert, men dette kan jo ta luven fra hvem som helst.

 

Til 1) og 2):

 

fritjof~2 gir i utgangspunktet ikke treff på fridthjoff, da det er for stor "avstand". Men så kommer det an på om variantsøket er slått på, eller ikke. Jeg skal illustrere dette med noen søk hvor jeg også søker med etternavn = wetteland, slik at antall treff begrenses og det blir lettere å se forskjellene.

 

Søk på fornavn = fritjof~2 og etternavn = wetteland gir tre treff når variantsøket er slått avhttps://www.digitalarkivet.no/search/persons/advanced?no_alias=1&firstname=fritjof~2&lastname=Wetteland

 

Ingen av de tre treffene har fornavn = fritjof, men de har fornavn som har ett eller to tegns "avstand" til fritjof.

 

Søk på fornavn = fritjof~2 og etternavn = wetteland gir fem treff når variantsøket er slått https://www.digitalarkivet.no/search/persons/advanced?firstname=fritjof~2&lastname=Wetteland

 

Søket gir altså to ekstra treff. Det ene har fornavn = fritjof, men kom ikke med i foregående treff, fordi etternavnet er stavet med enkel-v. Det andre nye treffet er Fridthjoff Wetteland, og årsaken er at søket nå ikke bare finner fritjof og alle stavemåter som har 1-2 tegns "avstand" fra fritjof, men også alle registrerte varianter av disse variantene.

 

Akkurat i dette tilfellet var riktignok ~2 unødvendig, fordi Fridthjoff ligger inne som en registrert variant av Fritjofhttps://www.digitalarkivet.no/search/persons/advanced?firstname=fritjof&lastname=Wetteland

 

Til 3):

 

Det er faktisk (minst) 10 000 forekomster i databasen av stavemåten Fritjof, for når variantsøket er skrudd av, får du utelukkende treff på stavemåten du søker på: https://www.digitalarkivet.no/search/persons/advanced?no_alias=1&firstname=fritjof

 

Så vidt jeg kan se, er det i underkant av 12 000 forekomster av stavemåten Fritjof. Antallet har formodentlig økt en del etter at AMF-kirkeboktranskripsjonene og FT1920 ble publisert.

Lenke til kommentar
Del på andre sider

På 8.5.2021 den 18.13, Olaf Larsen skrev:

Problemet med 10000 treff er at jeg ikke vet hva jeg egentlig har funnet. Jeg anbefaler ferskinger å søke bredt, og så tilpasse søket med mere og mere detaljer etter hvert, men dette kan jo ta luven fra hvem som helst.

 

Det er nå så mye søkbare persondata i Digitalarkivet, at et "bredt søk" ofte vil gi (mer enn) 10 000 treff. Med så mye søkbare persondata blir man oftere enn før nødt til å legge flere kriterier inn i søket, for å få antall treff ned på et håndterbart nivå.

 

Hvis man vil ha stålkontroll på hva slags treff man får, bør variantsøket være slått av. Men med variantsøket slått på, øker sjansen for å finne forekomster med "rare og utenkelige" stavemåter. Og nettopp det kan være en fordel for "ferskinger", som ennå ikke er trent til å tenke alternative stavemåter og/eller til å søke med spesialtegn.

  • Liker 3
Lenke til kommentar
Del på andre sider

Tusen takk, Kristian. 😃 Jeg ser jo at det blir litt mere jobb med å finne det jeg skal fram til, men muligheten for at vedkommende finnes i 'haugen' er jo større. Jeg håper dere lager en god bruksanvisning, kanskje med hjelp av en pedagog i tillegg til en datakyndig?

  • Liker 3
Lenke til kommentar
Del på andre sider

På 4.5.2021 den 16.19, Espen Tønnessen skrev:

Sitter å eksperimenterer og tester mulighetene. Vi må jo lage en veiledning må vite. 

 

Her er litt mer informasjon om hvordan fuzziness fungerer: 

  • Changing a character (box → fox)
  • Removing a character (black → lack)
  • Inserting a character (sic → sick)
  • Transposing two adjacent characters (act → cat)

I forbindelse med testingen kan jeg også opplyse at begrensningene på relatert person nå ikke gjelder, så her skal det være mulig å begrense søket på en mye bedre måte enn tidligere. Ta f.eks denne:
https://www.digitalarkivet.no/search/persons/advanced?from=&to=&firstname=Engelbrect~2&lastname=&birth_year_from=&birth_year_to=&birth_date=&birth_place=&domicile=&position=snekker~1&event_year_from=&event_year_to=&event_date=&related_first_name=Engelbrect~2&related_last_name=&related_birth_year=&sort=rel

 

 

Jeg hjelper daglig folk å finne slekta si, og trunkerte søk fungerte utmerket. f.eks *isto* - hvorfor er denne muligheten borte? 
Folk som ikke er veldig bevandret i data, det er veldig mange, klarer ikke finne det tegnet du bruker i eksempel som ser slik ut ~ det ligger rett og slett ikke på tastaturet, det gjør derimot * og det gav svar. Nå som det er mye rare transkriberinger fra AMF trenger vi alle varianter vi kan - og som fungerte før dere av en eller annen uforståelig grunn la om. 
Hvorfor ødelegge en søkefunksjon som fungerte utmerket? Skal det være tegn man må være viderekommen i data for å benytte, så legg dette som et tillegg og ikke istedet for? 
 

Skjermbilde 2021-05-14 kl. 14.37.56.png

  • Liker 1
Lenke til kommentar
Del på andre sider

På 9.5.2021 den 23.05, Kristian Hunskaar (Arkivverket) skrev:

 

Det er nå så mye søkbare persondata i Digitalarkivet, at et "bredt søk" ofte vil gi (mer enn) 10 000 treff. Med så mye søkbare persondata blir man oftere enn før nødt til å legge flere kriterier inn i søket, for å få antall treff ned på et håndterbart nivå.

 

Hvis man vil ha stålkontroll på hva slags treff man får, bør variantsøket være slått av. Men med variantsøket slått på, øker sjansen for å finne forekomster med "rare og utenkelige" stavemåter. Og nettopp det kan være en fordel for "ferskinger", som ennå ikke er trent til å tenke alternative stavemåter og/eller til å søke med spesialtegn.

Jeg hjelper daglig folk å finne slekta si, og trunkerte søk fungerte utmerket. f.eks *isto* - hvorfor er denne muligheten borte? 
Folk som ikke er veldig bevandret i data, det er veldig mange, klarer ikke finne det tegnet du bruker i eksempel som ser slik ut ~ det ligger rett og slett ikke på tastaturet, det gjør derimot * og det gav svar. Nå som det er mye rare transkriberinger fra AMF trenger vi alle varianter vi kan - og som fungerte før dere av en eller annen uforståelig grunn la om. 
Hvorfor ødelegge en søkefunksjon som fungerte utmerket? Skal det være tegn man må være viderekommen i data for å benytte, så legg dette som et tillegg og ikke istedet for? 

 

Skjermbilde 2021-05-14 kl. 14.37.56.png

  • Liker 1
Lenke til kommentar
Del på andre sider

Min I-PAD ser eg teiknet du er ute etter på «side 2» på tal-sida.  

Først .?123 deretter #+= då vil eg sjå ~ som nr 3 frå venstre.

 

 

Lenke til kommentar
Del på andre sider

Jeg er så enig med Winther - "Never change a winning team" sier fotballfolket.

 

(Men til Winther: Jeg fikk frem tegnet ~ på tasten til høyre for Å ved å trykke "alt"+"ctrl" (samtidig) og deretter mellomrom.)

 

 

  • Liker 2
Lenke til kommentar
Del på andre sider

21 timer siden, tom askerøi skrev:

Jeg er så enig med Winther - "Never change a winning team" sier fotballfolket.

 

Eg vil heller ha i pose og sekk. Det er kjekt med forbetringar, men ein vil gjerne også behalde det som var bra. 🙂

Lenke til kommentar
Del på andre sider

Jeg er enig med deg, jeg er også som Ole Brumm og sier "ja takk - begge deler". 

 

 

  • Liker 2
Lenke til kommentar
Del på andre sider

Join the conversation

Du kan poste nå og registrere deg senere. If you have an account, sign in now to post with your account.

Gjest
Skriv svar til emnet...

×   Du har limt inn tekst med formatering.   Fjern formatering

  Only 75 emoji are allowed.

×   Lenken din har blitt bygget inn på siden automatisk.   Vis som en ordinær lenke i stedet

×   Ditt forrige innhold har blitt gjenopprettet .   Tøm tekstverktøy

×   You cannot paste images directly. Upload or insert images from URL.

 Del

  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...

Viktig Informasjon

Arkivverket bruker cookies (informasjonskapsler) på sine nettsider for å levere en bedre tjeneste. De brukes til bl.a. skjemaoppdateringer og innlogging. Bruk siden som normalt, eller lukk informasjonsboksen for å akseptere bruk av cookies.