Gå til innhold
Arkivverket

[#10741] Trafikkrekord


Gjest Jan Oldervoll
 Del

Recommended Posts

Gjest Tore H Vigerust

Takk til Bent, dette var virkelig opplysende.Hvordan skal følgende tolkes: ''Gjennomsnittlig antall vellykkede forespørsler etter sider per dag: 5 138 (5 346)'' ?Menes det her et gjennomsnitt på 5.138 *vellykkede' og *reelle* viste sider per dag ?

Lenke til kommentar
Del på andre sider

Gjest Tore H Vigerust

Svaret er visstnok ja.Jeg legger merke til at Arkivverket siste uke har 71% mere reelle viste sider (sider som kan sees av brukerne) enn Digitalarkivet, med et gjennomsnitt pr dag på 9152 mot DA 5346.Nytt spørsmål: Hvordan forklares det at Digitalarkivet har mer enn 2,4 millioner forskjellige filer?Er hver viste side i kildene telt for seg?

Lenke til kommentar
Del på andre sider

Gjest Tore H Vigerust

Differansen (eller forskjellen) på DAs websider mellom vellykkede forespørsler og vellykkede forespørsler etter sider, er ekstrem, og helt uvanlig.Statistikkene til Norsk Gallup og Kapitals webtoppen (Hegnar.no) teller bare vellykkede forespørsler etter sider, dvs rene nettotall.I og med at statistikken for Digitalarkivet nå er tilgjengelig, kan en se at den viser reellt bare 1/50-del i treff av hva som er blitt opplyst tidligere. Tidligere er kun bruttotallene for vellykkede forespørsler gitt, ikke nettotallene.Men hva forklarer differansen mellom netto 5.138 per dag og brutto 196.494 per dag ? (Når dette leses er tallene noe endret, pga oppdateringer.) Arkivverkets differanse er mer normal, med 11.567 vellykkede forespørsler per dag mot 8.247 vellykkede forespørsler etter sider.

Lenke til kommentar
Del på andre sider

Gjest Tore H Vigerust

Brukeren på Arkivverkets webside får vist 7,0 sider per gang (64.069 : 9.147), mens brukeren på Digitalarkivets webside får vist 1,7 sider per gang (37.423 : 22.022). Tallene kan også være lavere pga samme registrerte ip-adresse innenfor samme uke.

Lenke til kommentar
Del på andre sider

Gjest Bjørn Davidsen

Etter å ha gjort feristnad på å skjøna Vigerust sine utrekningar i dei førre inlegga, kom det til meg ei historie som min henfarne far fortalde frå då han gjekk på maskinistskulen i Bergen:Lærar Bjørkum til ein elev: - Kor mykje er 6x9?Eleven: - 56.Bjørkum: - Utruleg. De skulle vore lærar på Universitetet.

Lenke til kommentar
Del på andre sider

Gjest Tore H Vigerust

Bjørn, i stedenfor å komme med den kommentaren, kunne du bidra til en oppklaring. Tallet 1,7 er så ekstremt annerledes (og lavere) enn hva Digitalarkivets ansvarlige tidligere har presentert, at det er påkrevet med en forklaring. Er tallet mitt feil, hvis ja, på hvilken måte og hva er rett tall og hvorfor?

Lenke til kommentar
Del på andre sider

Gjest Tore H Vigerust

Det er mulig at statistikken ikke vil registrere .exe-filer som reellt fremviste sider; - stemmer det ?

Lenke til kommentar
Del på andre sider

Gjest Tore H Vigerust

Her er for sammenligningens skyld TNS Gallups ukestatistikk for uke 12 for 40 av de største (herunder alle de største) webstedene i Norge.Digitalarkivets resultat på et ukenitt av 37.423 vellykkede forespørsler etter sider skal sammenlignes med tabell PI i kolonne tre fra venstre. VG på listetoppen har 36,5 millioner, mens IT-avisen Business har 20.000 på tabellbunnen. Digitalarkivet vil altså komme inn på 40. plass hvis de melder seg på.

Lenke til kommentar
Del på andre sider

Gjest Bjørn Davidsen

Det får dei ansvarlege svara på - og det gjer dei nok - når dei vaknar i morgon tidleg. Men det eg ikkje skjønar, jo eg gjer vel det no i natta, er kvifor du bryr deg så ekstremt om dette. Det har vel med ynskjet ditt - uttala ein gong i Bergen i vitners nærvær, at du vil ha DA privatisera og lagt til Trangvik, det som alt anna.At noko går bra om det ligg utanfor Oslo, må jo etterprøvast - i vona om å få det vekk og inn DIT. Og er det statleg og gratis attåt, er det jo riktig ille, slik eg har oppfatta deg. Men om resten av hopen her vil tiltru deg å drive DA, gjenstår å sjå.

Lenke til kommentar
Del på andre sider

Gjest Jan Oldervoll

Statistikken som er lagt ut ER forvirrande, først og fremst fordi programmet som er brukt til å laga han er meint for ei anna type teneste enne vår. Dermed blir språket nærast uforståeleg.Når det står antall sider lasta ned betyr det statiske html-sider som ligg i rot. Hos oss vil det stort sett sei heimesida. Om ein vil ha antall oppslag må ein sjå på talet for vellykkede forspørsler som gjev eit heilt anna tal. Sider generert av program vil ikkje koma fram her.Antall filer er ikkje antall filer men antall forskjellige adresser. Ser du på dei første 10 personane i ein database, vil dei ha ei anna adrssse enn dei neste 10.Antall forskjellige maskiner vil vera misvisande. Det viktigaste her er at alle maskiner som ligg bak ein brannmur vil verta telte som ein. Sett frå vår ståstad har Arkivverket og heile statadministrasjonen berre ein maskin.Den som vil sjå ein reell statistikk for trafikken i mars kan sjå http://digitalarkivet.uib.no/adm/stat.htm

Lenke til kommentar
Del på andre sider

Gjest Bent Vangli

Interessen for statistikk er vist svært så stor, hvilket jo selvfølgelig er hyggelig når en først tar jobben med å legge den ut.Likevel, tolkningen av statistikk må ikke overdrives. Alle de som kjenner litt til hvordan Internett virker vet at slik statistikk er upresis og ikke kan tas for noe annet enn indikasjoner. Såkalte 'cache' servere (mellomlagringservere) vil ofte svare før forespørselen når målserveren, hvor statistikktellingen foregår. Da mister en tilslag.Et annet forhold er forskjellen sider vist og forespørsler. En side som inneholder mange elementer, slik som reklame, bilder, og lignende vil typisk generere mange forespørsler. Dette er ikke tilfellet for DA. Her er det et annet forhold som gjør seg gjelden. Det gjelder forholdet til dynamiske søkesider. Der vil første inngang til siden telles opp som forespørsel etter side og som generell forespørsel, mens påfølgende endringer i søkekriterier bare vil føre til telling som generell foresørsel. Med andre ord, siden telles opp bare en gang ved normal bruk. DA bruker i utstrakt grad slike dynamiske sider. Det kan ses på statistikken under Rapport - filtyper, hvor .exe (gjennspeiler bruken av dynamiske sider) står for omtrent 90% av trafikken.Sammenligner en dette med statistikken på http://www.arkivverket.no/Report.html er forhold helt annerledes. Filtypen .php gjenspeiler på denne maskinen bruk av dynamiske sider. Den står for ca 0,34% av trafikken. En vesentlig forskjell i bruksmønster.Det er disse forholdene som gir forskjellene i statistikken. En må ta hensyn til bruksmønsteret når vurderingen gjøres. For DA sitt vedkommende vil derfor antall generelle forespørsler gi den best indikasjon på bruken, nettop fordi 90% av forespørslene nettopp går på dynamiske oppslag. En telling for hver forespørsel i databasen. Derimot for www.arkivverket.no er nok forepørsler etter sider som blir den beste indikatoren, da nærmere 80% av alle forepørsler er etter .html og .pdf filer.Håper dette virker avklarende.

Lenke til kommentar
Del på andre sider

Gjest Tore H Vigerust

Jo, det var avklarende både fra Oldervoll og Vangli. Men når websider sammenlignes nasjonalt og internasjonalt holdes det såkalte skulte internett utenfor regnestykkene (som databaser). Det som sammenlignes er vellykkede forespørsler etter sider.Det som blir viktig for både Arkivverkets og Digitalarkivets websider, er å gi statistikk som er mest mulig sammenlignbare med andre store norske websider. TNS Gallup måler dette på en rettferdig måte (ved plassering av cookies på den enkelte side som skal telles). Det hadde jo vært fint om dere tok skrittet fullt ut og meldte begge webtjenestene opp til kontroll hos TNS Gallup (og forsåvidt også weptoppen hos HegnarOnline) slik at offentligheten får bedre kunnskap om statistikken målt på en sammenlignbar måte.Dette har stor betydning for mange, også budsjettene, i og med at Digitalarkivet, ifølge Statsbudsjettet for 2001 mm., er en av Norges aller mest besøkte websider.

Lenke til kommentar
Del på andre sider

Gjest Yngve Nedrebø

Digitalarkivets telleverk viste 47,5 millioner søk i databasene våre i 2003. Da holdt vi tekstsider etc. utenfor statistikken. Skulle vi regne med 'forespørsler' (eller 'vellykkede forespørsler'), ville vi hatt mellom 70 og 80 millioner. Vi har alltid vært presise med å fortelle hva vi har talt.Som allerede grundig fastslått av Oldervoll og Vangli: tallene må forståes i sin rette sammenheng.Er 70-80 millioner vellykkede forespørsler i året, 1,5 million i uken, mye eller lite? Det avhenger igjen av sammenhengen. I de fleste sammenhenger det er naturlig å sammenligne med, er det svært mye. Vi har hatt en vekst på 400% på seks år. Jeg er fornøyd både med utviklingen, og de absolutte tallene.Vi har i løpet av noen uker hatt besøkende fra 56 ulike land. Jeg synes det er brukbart det også. Vi har hatt inne 22 000 forskjellige maskiner siste uke. Ikke så rent galt det heller!

Lenke til kommentar
Del på andre sider

Gjest Bent Vangli

Statistikk tatt ut fra sin virkelighet blir bare meningsløse tall. Jamnfør mitt tidligere innlegg. Hvor galt det kan være kan følgende tenkte situasjon være:Tenk deg at du legger ut 1000 statiske websider på en server. En bruker som velger å lese alle disse sidene vil i statistikken telles opp som forespørsler etter 1000 sider. Derimot legges sidene inn i en database for dynamiske oppslag, vil brukerens lesing av alle 1000 sidene lage 1 forespørsel etter sider. Begge typer tilgang vil generere omtrent det samme antall generelle forespørsler, et tall på minst 1000. Hvilket tall gjennspeiler nå best den reelle bruken? 1 eller 1000?Tilfellet over er ikke så langt fra sannheten når det gjelder DA versus www.arkivverket.no. DA har rundt 90% dynamisk bruk, mens Arkivverket har nesten 100% av sine oppslag på statiske sider.Bruk av 'cookies' som telleverktøy fjerner noen usikkerheter, men innfører andre. Jeg, og stadig flere med meg, slår av automatisk mottak av slike 'cookies' og/eller man jevnlig fjerner disse ved hjelp av 'adAware' programmer. 'Cookies' er en blant mange ting som kan føre til spam, enten som søppelpost eller som oppdukkende reklamesider når man benytter Internett. Når 'cookies' sperres blir også tellingen feil for disse sidene.Som forklart, tallene må tolkes i sin rette sammenheng for å gi mening. Hvis ikke blir de misvisende. Har det ikke vært en som en gang sa noe sånt som; 'Når utgangspunktet er som galest, blir svaret som originalest'?Troen på at den ene eller andre tellemåten er objektivt rett i alle situasjoner er således høyst illusorisk, noe argumentasjonen over klart skulle vise. Se også statistikken til Jan som viser faktiske oppslag i databasen og dermed bruk, uavhengig av hvor mange sideoppslag som telles opp i en logg.Det som skal bli spennende utover, er å se hvordan utviklingen blir etter hvert som historisk informasjon bygges opp. Sammenligninger over tid vil ha stor objektiv verdi så lenge en kan anta at bruksmønsteret er tilnærmet likt. Det er der den store verdien av denne statistikken ligger, og som vi synes det er morsomt å dele med våre brukere.

Lenke til kommentar
Del på andre sider

Gjest Tore H Vigerust

Bent Vangli skrev: 'Tenk deg at du legger ut 1000 statiske websider på en server. En bruker som velger å lese alle disse sidene vil i statistikken telles opp som forespørsler etter 1000 sider. Derimot legges sidene inn i en database for dynamiske oppslag, vil brukerens lesing av alle 1000 sidene lage 1 forespørsel etter sider. Begge typer tilgang vil generere omtrent det samme antall generelle forespørsler, et tall på minst 1000. Hvilket tall gjennspeiler nå best den reelle bruken? 1 eller 1000?'Ta et omvendt eksempel: du legger ut en stor kildetekst (f eks 100 kb tekst) i én statisk fil, og hver gang noen spør etter den, registreres det som én forespørsel. Flytt kildeteksten over i en dynamisk base, som DA, legg på 'vinduer' slik at brukeren må trykke 'Neste' 120 ganger for å lese gjennom hele dokumentet. Hvor mange 'søk' registreres da i DA? 120 'søk' (minst). Dette er ikke et søkt tilfelle.

Lenke til kommentar
Del på andre sider

Gjest Tore H Vigerust

Jeg har to spørsmål til Bent Vangli:Sålangt jeg kan se, ligger Brukerforumet og Arkivforumet under samme katalog som kildene, dvs under /cqi-win/ ; er det ikke gunstig å få tall på hvor mange 'søk' eller forespørsler det er på Arkivforumet og Brukerforumet hver for seg, adskilt fra kildesøkene ? Kan det la seg ordne?Så registrerer jeg at 0,5 millioner av Digitalarkivets 2,4 millioner filer ikke har vært benyttet eller forespurt de siste 7 døgn. Disse filene er da forholdsvis passive. Hva slags innhold representerer disse 0,5 mill filer, dvs hva er lite etterspurt?

Lenke til kommentar
Del på andre sider

Gjest Jan Oldervoll

Tore: Du stiller spørsmålet feil veg.Me loggfører trafikken i Debattforuma. Det har vore i drift i fem år og ein dag og har 20788 tema, med totalt 123787 innlegg som har vore lest 3939459 gonger. He har ikkje hatt trong for å skilja mellom brukarforumet og arkivforumet.Som eg tidlegare har sagt har me ikkje 2,4 millionar filar. Det som kjem i denne statistikken er URL-ar, som er noko heilt anna enn filar. Siste veka er 2735 databaser av totalt ca 2800 i Digitalarkivet/Digitalapensjonatet brukt.

Lenke til kommentar
Del på andre sider

Gjest Tore H Vigerust

Nei, skille mellom arkivforumet og brukerforumet er overflødig. Men jeg forsto Bent Vangli dithen, at den statistikken som ble lagt ut for Digitalarkivet også inneholdt disse debattfora - stemmer det ikke?

Lenke til kommentar
Del på andre sider

Gjest Tore H Vigerust

Ok, da skjønner jeg at nær samtlige av kildedatabasene brukes hver uke (ihvertfall i høysesongen, som nå).Men siden de fleste kildedatabasene gir en rekke URL'er, så skulle det være interessant å vite hvilke type data som gjemmer seg bak de 0,5 millioner URL'er som *ikke* er ukentlig i bruk.

Lenke til kommentar
Del på andre sider

Gjest Bent Vangli

Hei ToreJoda, eksempelet ditt er relevant og viser nettopp at statistikken må vurderes opp i mot virkeligheten de er hentet fra. De kan ikke frakobles. Et sted som gir en rimelig grei beskrivelse av dette er [url="http://www.analog.cx/docs/webworks.html>http://www.analog.cx/docs/webworks.html (på engelsk).Sp 1. Tror det er mulig. Det skal også la seg gjøre å få databaseoppslagene telt som sideoppslag, men det krever litt arbeid og uttesting for å få det til. Jeg får komme tilbake til det ved en senere anledning når tiden tillater det. Foreløpig får det være slik det er til minst over påske.Sp 2. Her vet jeg ikke helt hva du sikter til, da jeg ikke finner noen oversikt over antall filer på DA. Er derfor usikker på hva du spør om. Antar likevel at du mener antall forskjellige filer som er forespurt. Filer er med nåværende definisjon statistikkpakken alle oppslag som ikke slutter på '.css' eller '/ReportDA.html'. Med andre ord inkluderer tallet alle databasesøk hvor søkeparameterne er unike. Så ut i fra tidligere diskusjon kan en derfor trekke den konklusjonen at det i perioden fra statistikkens start har vært opp i mot 2,4 millioner unike søk. Flere søk med lik parametersetting telles altså bare en gang uansett når i periodene søkene er foretatt, eventuelt de siste 7 dagene for tall i parantes.Over tid vil vi, basert på erfaringer og behov, se på parametersettingen for statistikken, og innimellom justere oppsettet. Det vil nok hovedsaklig skje i rykk og napp når tiden tillater det. Tross alt er ikke statistikk noen primæroppgave for Arkivverket, slikt får SSB ta seg av. Vi kan bruke denne statistikken i dag, og i enda større grad om et års tid eller så når utviklingstrendene fremstår klarere.Spesielt interesserte kan se på linken

Lenke til kommentar
Del på andre sider

Gjest Tore H Vigerust

Takk, Bent, det var nyttig informasjon, selv om tallet 2,4 mill fortsatt forvirrer meg. Jeg bruker selv Analog som statistikkprogram for min webside, og er kjent med det forklaringen som du ga en lenke til.Men jeg er fortsatt spent på om Digitalarkivets debattfora (Arkivforumet og Brukerforumet) er inkludert i den statistikken som nå er tilgjengelig med Analog 5.30 ? ; - jeg synes jo det ser slik ut, men Oldervoll synes å benekte det ?

Lenke til kommentar
Del på andre sider

Gjest Tore H Vigerust

I statistikken fra Analog er visst debattforaene med. Disse ligger sammen med databasefilene i katalogen /cqi-win/ som .exe-filer. Fra statistikkprogrammet ble startet opp, 5. februar, til igår, 25. mars, er det registrert 8.033.307 vellykkede forespørsler av .exe-filer. Siden samtlige .exe-filer ligger i katalogen /cqi-win/ og siden katalogen /cqi-win/ ikke inneholder annet enn .exe-filer, vet vi nå atdet er 163.945 vellykkede forespørsler per dag. Tallet er altså summen av såkalte 'søk' i alle kildene samt debattforaene tilsammen.Senere får vi forhåpetligvis adskilte /separate tall for kildesøkene og debattforaene.I tillegg har DA ca 35.000 vellykkede forespørsler etter sider siste uke. Det er dette tallet som skal brukes ved sammenligning med andre websider som f eks i TNS Gallups webstatistikk. Tallet på antall 'søk' kan med tiden sammenlignes med søk i bl a Bibsys.

Lenke til kommentar
Del på andre sider

 Del

  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...

Viktig Informasjon

Arkivverket bruker cookies (informasjonskapsler) på sine nettsider for å levere en bedre tjeneste. De brukes til bl.a. skjemaoppdateringer og innlogging. Bruk siden som normalt, eller lukk informasjonsboksen for å akseptere bruk av cookies.