Jump to content
Arkivverket

HVA SKJER MED SØKEMOTOREN


Recommended Posts

Jarle E Hannisdal

Hva har Digitalarkivet gjort med søkemotoren, får enten 0 treff eller 10000. og søkeformelen som jeg har bruket i mange år funker ikke lenger.

Få tilbake slik det var for 14 dager siden. da virket det nå gjør det det ikke.

(ha*|he*) (*dal|*dahl) denne formelen skal gi ca 480 treff (+ nye) på Hannisdal nå gir den ingen. 

 

Virker som de er på gang med å ødelegge den god søkemotoren vi har hatt frem til nå.

 

er det andre som har funnet noe andet de har gjort med den.

 

Link to post
Share on other sites
Jon Sværen

Det synest som at DA har gått over til noko «einklare» søkjemotor.

Slik at ein no kan søkja kun på ein -1 bokstav:

 

F.eks oldefar Jørgen Hanson Sværen.

Fornavn: J

Etternavn: Ha*|Sv*

Kjønn: Mann

 

Heldelsår: 1850 - 1950.

———

Overskrift slik som deg: Søket gav 10.000 treff.

Kjønn: Står det 424.539.

——-

Dette skjer om eg er Logga inn eller ikkje !  Går ned på Geografi, Sogn og Fjordane, er talet vorte 9.705.

——-

Både du og eg før håpa at Kristin H er på jobb det borte i Oslo og gje oss og andre eit svar !

 

 

 

Link to post
Share on other sites
Espen Tønnessen
Jon Sværen

Espen !

 

Det er eit nytt søkje måte i DA, uansett kor mange lekkjer du sender ut !!

 

Ta den måten du søkjer på: KUN ein - 1 bokstav i fornavnet !

La oss sjå på desse 23 stk:

1. Anthon som vært far i Spydeberg 1883 ?

2. Emil Sverre i FT 1910 i Våle ?

3.  Ragna Karoline i FT 1910 i Våle ?

 

KORLEIS kan desse 3 koma med, når du søkjer på fornavnet: j*      ???

——

Her MÅ det koma noko meir frå DA-folka i Oslo !! 

 

Forbud om ta helg no, KAN ikkje godtakast !!

Link to post
Share on other sites
Espen Tønnessen

Det er ikke riktig at man bare søker på en bokstav. 

 

https://en.wikipedia.org/wiki/Levenshtein_distance

 

Skal prøve med en forenklet forklaring (med forbehold om at den kan bli litt for enkel): Tallet angir hvor mange bokstaver du ønsker at skal avvike fra det du har skrevet. Hvis du skriver hansen med en avstand på 1, vil du kunne få treff på hanson eller hanssen.
https://www.digitalarkivet.no/search/persons?page=2&s=hansen~1&event_year_from=&event_year_to=&event_date=


Men man vil også f.eks få treff på Hangen


Du får ikke treff på hansson, for da er der er bokstaven o forskjellig fra a, og det er en s i tillegg, altså en avstand på 2. For å få treff på hansson, kan du angi en avstand på 2.
 

https://www.digitalarkivet.no/search/persons?s=hanson+~1&event_year_from=&event_year_to=&event_date=

 

Det er dog litt forskjell på om man angir distansen med eller uten mellomrom. Uten mellomrom ser det ut til å gjelde for det spesifikke ordet, men hvis har mellomrom, og legger den bakerst, så gjelder den hele søkebegrepet. 

 

  • + signifies AND operation
  • | signifies OR operation
  • - negates a single token
  • " wraps a number of tokens to signify a phrase for searching
  • * at the end of a term signifies a prefix query
  • ( and ) signify precedence
  • ~N after a word signifies edit distance (fuzziness)
  • ~N after a phrase signifies slop amount

To use one of these characters literally, escape it with a preceding backslash (\).

Og en ting til: Nå kan man også trunkere på ett tegn, ikke to som før. (men altså ikke innledende trunkering).

Link to post
Share on other sites
Jon Sværen

Takk for innfo, Espen !

 

Ingen tvil om at det er ein annan måte å søkja på i DA !

 

Sidan det er 1 mai-helg, så skal de få lov å ta helg du og andre som arb i Oslo på DA.

 

  • Like 1
Link to post
Share on other sites
Espen Tønnessen

Takk for at du reddet helga! 1 mai. Stengt. Lørdag =handledag. 

 

Nå har vi mat i huset 😅

Link to post
Share on other sites
Trude Nilsen

🤬🤣🤬🤣

 

HADDE VÆRT FINT OM NOEN HADDE KOMMET MED EN NY VEILEDNING TIL HVORDAN GJØRE SØK I AVANSERT PERSONSØK!!! 

 

PÅ NORSK!!!

  • Like 1
Link to post
Share on other sites
Mathias Beyer
På 30.4.2021 den 19.28, Jarle E Hannisdal skrev:

Hva har Digitalarkivet gjort med søkemotoren, får enten 0 treff eller 10000. og søkeformelen som jeg har bruket i mange år funker ikke lenger.

Få tilbake slik det var for 14 dager siden. da virket det nå gjør det det ikke.

(ha*|he*) (*dal|*dahl) denne formelen skal gi ca 480 treff (+ nye) på Hannisdal nå gir den ingen. 

 

Virker som de er på gang med å ødelegge den god søkemotoren vi har hatt frem til nå.

 

er det andre som har funnet noe andet de har gjort med den.

 

Det er lenge siden det ble problemer med søkemotoren. Man googler ett navn og finner kilden, når man så går inn og søker direkte på navnet får man null treff! Noe har gått galt det er sikkert...

Link to post
Share on other sites
Tom Kandal

Hvordan skal jeg få tilbake søkefunksjonen slik at jeg får opp eksakte navn først, om de finnest og etterpå variablene som ofte er bra siden navn ofte ble skrevet ulikt i diverse kilder mm.

Leser om diverse tegnbruk etc.

Når jeg forsøkte hermetegn fikk jeg kun opp noen få treff på en gitt person.

Mange færre enn tidligere. 

Er som sagt ute etter å gå tilbake de eksakte navna og med variabler etterpå for å kunne fange opp mest mulig.

Ulike fornavn i bruk og med og uten patronym,  samt sted/plass benevnelsen...

Link to post
Share on other sites
Winther Kaya
På 30.4.2021 den 17.30, Espen Tønnessen skrev:

Det er ikke riktig at man bare søker på en bokstav. 

 

https://en.wikipedia.org/wiki/Levenshtein_distance

 

Skal prøve med en forenklet forklaring (med forbehold om at den kan bli litt for enkel): Tallet angir hvor mange bokstaver du ønsker at skal avvike fra det du har skrevet. Hvis du skriver hansen med en avstand på 1, vil du kunne få treff på hanson eller hanssen.
https://www.digitalarkivet.no/search/persons?page=2&s=hansen~1&event_year_from=&event_year_to=&event_date=


Men man vil også f.eks få treff på Hangen


Du får ikke treff på hansson, for da er der er bokstaven o forskjellig fra a, og det er en s i tillegg, altså en avstand på 2. For å få treff på hansson, kan du angi en avstand på 2.
 

https://www.digitalarkivet.no/search/persons?s=hanson+~1&event_year_from=&event_year_to=&event_date=

 

Det er dog litt forskjell på om man angir distansen med eller uten mellomrom. Uten mellomrom ser det ut til å gjelde for det spesifikke ordet, men hvis har mellomrom, og legger den bakerst, så gjelder den hele søkebegrepet. 

 

  • + signifies AND operation
  • | signifies OR operation
  • - negates a single token
  • " wraps a number of tokens to signify a phrase for searching
  • * at the end of a term signifies a prefix query
  • ( and ) signify precedence
  • ~N after a word signifies edit distance (fuzziness)
  • ~N after a phrase signifies slop amount

To use one of these characters literally, escape it with a preceding backslash (\).

Og en ting til: Nå kan man også trunkere på ett tegn, ikke to som før. (men altså ikke innledende trunkering).

For oss som gjerne fortsatt vil ha treff på trunkerte søk som Ing*bor* og som nå for null treff tilbake, og nå er også mulighet for å skru på/av variantsøk vekke, så det bare å finne seg en ny hobby da? Eller er det en bug som det jobbes med å få vekk? Med fare for å forenkle veldig 😉

https://www.digitalarkivet.no/content/search-names

Skjermbilde 2021-05-03 kl. 11.53.04.png

  • Like 1
Link to post
Share on other sites
Hanne Astad
Posted (edited)

Jammen godt å lese at det er flere som opplever dette, da jeg begynte å lure på eget vett og forstand her nå ...

Det hadde i alle fall vært fint å vite når det blir ordnet igjen, - for at det skal fortsette å være slik, det kan jeg jo virkelig ikke tro? 

 

 

Tillegg:

Hvordan forventes det nå da at man skal søke på et navn der man bare kjenner til siste delen av navnet, eller ved ukjent bokstav midt i navnet, dersom man ikke kan bruke * annet enn i slutten av et ord (navn)? Fuzzysøk erstatter ikke dette, det forvansker i beste fall. 

Jeg har søkt mye med trunkering i mange forskjellige applikasjoner, men dette har jeg aldri vært borti før. 

Edited by Hanne Astad
Link to post
Share on other sites
På 30.4.2021 den 17.30, Espen Tønnessen skrev:

Hvis du skriver hansen med en avstand på 1, vil du kunne få treff på hanson eller hanssen.

Da synes jeg at du kan redegjøre for årsaken til at det samme søket gir 10000 treff, hvor de siste er f.eks Johan Rud,  Jens Trønsnes, Gundar Olson, Beate Hovde  og Anna Lie.

 

Det er helt 'høl i hue' at dere ikke har informert brukere ordentlig på norsk om hvordan man søker. Jeg har tidligere påpekt feil i søkeresultater, som ble imøtekommet av dere, men det var tydeligvis enkeltfeil som ble rettet. Å kunne kunne lage så mye surr i søkemetodene at folk ikke finner fram, er ikke brukbart. Det er ille nok at en fersk bruker søker i folketellinger som er 'transkribert' i utlandet uten å finne personer, men når søkemetodene legger opp til at erfarne brukere ikke får treff på kjente navn, så er det noe grunnleggende feil. Man skal ikke behøve å være spesielt datakyndig for å kunne foreta enkle søk.

 

Hvorfor er det ikke store knapper i Personsøk og Avansert personsøk med f.eks. teksten Hjelp, Søkehjelp e.l. som man kan klikke på for å finne en godt utarbeidet hjelpeside eller et hjelpevindu?

Link to post
Share on other sites

Forøvrig finner jeg ikke lenger avkrysningsrute for "Skru av variantsøk" ?

Et søk på ingebor* gir 10000 treff, men ingeborg og engeborg går om hverandre. Hvordan sorteres treffene, og hva med de som ikke dekkes av de 10000 første treffene? Det samme gjelder treff på ingebor~, hvor det heller ikke sorteres på navnet man søker på.

 

Hvor mange av treffene er identiske, finnes det metoder for å forhindre duplikater av treff? Jeg tenker på et søk på f.eks. ole~ olsen~, så vil vel treff på hvert av navnene, og deres varienter igjen, produsere flere treff som er identiske?

Edited by Olaf Larsen
  • Like 1
Link to post
Share on other sites
Jarle E Hannisdal

Espen Tønnesen 

Vil man kunne få innledende trunkering og at søkestrengen skal inneholde et spesifikk utrykk?

ting som  fuzziness ikke klarer å ta med, 

vet ikke om den vil klare alle 90 skrivemåter av Fritjof.

Og når kommer det en Norsk bruksanvisning?

Link to post
Share on other sites
Espen Tønnessen

Vi har nå lagt ut en oppdatering som tillater trunkeringstegn foran i søkeordet i Avansert personsøk, takket være kreative og dyktige utviklere. Men du kan ikke ha både innledende og avsluttende trunkeringstegn i samme ord, og du kan ikke ha trunkeringstegn midt inni et ord. Og det gjelder kun Avansert personsøk, ikke enkelt personsøk (søkeboksen på forsiden). Så da kan man f.eks bruke "(fri*|fre*) (*of|ov|ovf)" eller tilsvarende for å finne fritjof. Men min påstand er at det må da være langt enklere å bare skrive "fritjof~2" for å få omtrent samme (bedre) treff.

 

Ta f.eks denne: https://www.digitalarkivet.no/search/persons/advanced?from=&to=&firstname=fritjof~2&lastname=&birth_year_from=&birth_year_to=&birth_date=&birth_place=&domicile=&position=&event_year_from=&event_year_to=&event_date=&related_first_name=&related_last_name=&related_birth_year=&sort=rel

 

I bunn og grunn er vi avhengig av de mulighetene som ligger i de søkemotorene som finnes på markedet. Vi har gått over til den samme søkemotoren som "alle" bruker. Jeg mener at fuzzy-søket er langt kraftigere og mer anvendelig enn bruk av trunkeringstegn. Navn har blitt skrevet på manger rare måter opp gjennom tidene, og transkriberingene kan ha litt varierende kvalitet. Det er fordeler og ulemper med de forskjellige søkemetodene.  Hvis man er en svært erfaren bruker som har forfinet søkekriterine og bygget seg opp erfaring over tid, så vil det kanskje være mulig å få gode treff. Hvordan kan du vite at du har tatt høyde for alle skrivemåter når du bygger slike avanserte søk med parenteser, eller og trunkering? De aller, aller fleste vil ikke ha nok erfaring til å bygge opp denslags søkestrenger, og dermed vil de heller ikke finne det de er ute etter. Derimot vil et slik distanse-søk kanskje være et langt bedre hjelpemiddel for de aller fleste. Søkestatistikken viser at kun 5% av søkene bruker trunkeringstegn bak et ord, 0,4% av søkene benytter trunkeringstegn foran et ord, og 0,01% av søkene bruker trunkeringstegn i midten. Vi kommer derfor ikke til å jobbe noe mer med trunkering. 


Når det er sagt, så kan man nok trenge noen flere triks i ermet for å få gode treff også med distanse. Ta f.eks dette søket: https://www.digitalarkivet.no/search/persons/advanced?from=&to=&firstname=xtofer~2|kristoffer~2&lastname=&birth_year_from=&birth_year_to=&birth_date=&birth_place=&domicile=ulvik~2|ulvigen|ulviken|uldvigs&position=&event_year_from=&event_year_to=&event_date=&related_first_name=&related_last_name=&related_birth_year=&sort=rel

 

Fornavn: xtofer~2|kristoffer~2

Bosted: ulvik~2|ulvigen|ulviken|uldvigs

 

Her forsøkte jeg meg først med ulvi* på bosted. Da fikk jeg også treff på Ulvildrud, Ulvingen osv. Fikk da 176 treff fordelt på 4 sider. Så eksperimenterte meg meg fram og kom til "ulvik~2|ulvigen|ulviken|uldvigs" for bosted. Der får jeg også 176 treff. Jeg får ikke treff på Ulvildrud, Ulvingen, men jeg får istedenfor andre rariteter sånn som Aalvik. Alt i alt ser det dog ut som det er flere relevante treff ved bruk av distanse. F.eks fikk jeg treff på Ulvek. Og det ville jeg ikke fått om jeg hadde belaget meg på "ulvi*".

Uansett hvordan man vrir og vrenger på det så er det ganske krevende å gjøre søk i Digitalarkivet. Metoder som passer for noen passer ikke for andre. Og man må teste ut og eksperimentere for å få gode treff som gir de resultatene man er ute etter. Jeg har forståelse for at når man har opparbeidet seg erfaring, og laget seg gode teknikker for å utføre søkene, så blir det en innarbeidet vane. Da kan også en slik løsning virke litt for enkel. Men gi det en sjans. Jeg kommer ihvertfall ikke til å se meg tilbake.

Link to post
Share on other sites
Torbjørn Igelkjøn
42 minutter siden, Espen Tønnessen skrev:

Metoder som passer for noen passer ikke for andre

 

Og akkurat difor vil vi brukarar ha både i pose og sekk. Eller som Ole Brumm sa: ja takk, begge deler.

 

Ut frå søkjeresultata ser det ut som at det såkalla variantsøket framleis er aktivert. Vil det bli innført mogelegheit til å skru dette av eller på?

 

Vil det bli mogeleg å bruke trunkeringsteikn framfor ord også i enkelt personsøk? (Eg har eit sterkt ynskje om dette).

 

Elles tykkjer eg at søk på f.eks. *isto* er nyttige søk, sidan dei fangar opp alle former for Christopher. Ofte er det også nyttig med trunkeringsteikn inne i ord.

 

Og sist men ikkje minst, så bør det lagast bruksanvisning før ein skiftar ut søkjemotoren på ein slik måte at søkjemetodane blir snudd opp ned på.

Edited by Torbjørn Igelkjøn
  • Like 1
  • Thanks 1
Link to post
Share on other sites
Marius Hellerud

Skjønner den nye måten å søke på er noe vi må lære oss (å leve med), og det gjør vi sikkert også. Men da har jeg et nytt spørsmål:

 

Om jeg søker etter min slektning Ellinor Martinsen uten trunkering av noe slag, hvorfor dukker hun så ikke opp i alle databaser hvor hun beviselig er? (Jeg får nemlig treff om jeg går inn i akkurat dén databasen og søker?)

 

I dette tilfelle brukte jeg avansert personsøk og savner i hvert fall tilslaget (eller tilslagene, for det er visst ikke bare henne som har dette navnet) i Døde 1951-2014-databasen. Hun står riktignok som Ellinor O Martinsen der, men det kan da ikke være dette som er årsaken til problemet?

 

Hilsen

Marius

Edited by Marius Hellerud
Link to post
Share on other sites
Espen Tønnessen
1 time siden, Marius Hellerud skrev:

Om jeg søker etter min slektning Ellinor Martinsen uten trunkering av noe slag, hvorfor dukker hun så ikke opp i alle databaser hvor hun beviselig er? (Jeg får nemlig treff om jeg går inn i akkurat dén databasen og søker?)

 

Akkurat denne kilden, Døde 1951-2014, er litt spesiell. Vi jobber med å finne ut av hva det er.

  • Like 1
  • Thanks 1
Link to post
Share on other sites
Espen Tønnessen

Sitter å eksperimenterer og tester mulighetene. Vi må jo lage en veiledning må vite. 

 

Her er litt mer informasjon om hvordan fuzziness fungerer: 

  • Changing a character (box → fox)
  • Removing a character (black → lack)
  • Inserting a character (sic → sick)
  • Transposing two adjacent characters (act → cat)

I forbindelse med testingen kan jeg også opplyse at begrensningene på relatert person nå ikke gjelder, så her skal det være mulig å begrense søket på en mye bedre måte enn tidligere. Ta f.eks denne:
https://www.digitalarkivet.no/search/persons/advanced?from=&to=&firstname=Engelbrect~2&lastname=&birth_year_from=&birth_year_to=&birth_date=&birth_place=&domicile=&position=snekker~1&event_year_from=&event_year_to=&event_date=&related_first_name=Engelbrect~2&related_last_name=&related_birth_year=&sort=rel

 

 

  • Like 2
Link to post
Share on other sites
Kristian Hunskaar (Arkivverket)
2 timer siden, Torbjørn Igelkjøn skrev:

 

Fordi "1835" ikke finnes i personposten, kun i den overordnede handlingsposten.

 

Når jeg i stedet legger 1835 inn som hendelsesår, får jeg treff: https://www.digitalarkivet.no/search/persons?s=%2Banne+%2Bmartine&event_year_from=1835&event_year_to=1835&event_date=

 

(Men søkeboksen på Digitalarkivets forside gir deg ikke mulighet til å legge inn søkekriterier i annet enn fritekstfeltet.)

  • Thanks 1
Link to post
Share on other sites
Torbjørn Igelkjøn
6 timer siden, Kristian Hunskaar (Arkivverket) skrev:

 

Fordi "1835" ikke finnes i personposten, kun i den overordnede handlingsposten.

 

Når jeg i stedet legger 1835 inn som hendelsesår, får jeg treff: https://www.digitalarkivet.no/search/persons?s=%2Banne+%2Bmartine&event_year_from=1835&event_year_to=1835&event_date=

 

(Men søkeboksen på Digitalarkivets forside gir deg ikke mulighet til å legge inn søkekriterier i annet enn fritekstfeltet.)

 

Dette må no vel vere ei endring, sidan eg meiner at dette har gitt treff før. Faktisk var det eit problem at det var vanskeleg å søkje på 1801, 1865 osv. fordi ein då fekk store mengder treff frå folketeljingane. Dette trur eg faktisk kan vere ei forbetring, sidan ein uansett kan søkje direkte på hendelsesår i staden.

Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.