19 august 2007

Håndgribelig troværdighed på Wikipedia

Jeg støder jævnligt på projekter og diskussioner om troværdigheden på Wikipedia, og de seneste uger er jeg faldet over tre eksempler på nogle ret håndgribelige, kvantitative og interessante bud på at vurdere/indikere/højne Wikipedias troværdighed. Dem synes jeg lige jeg vil nævne.

Farvekoder for troværdighed?

Luca de Alfaro, datalog fra UC Santa Cruz, har udviklet et program, der kan farvekode wikipedia-opslag efter hvor troværdige de er - baseret på historikken for de brugere der har redigeret i artiklen. Farvekoden bestemmes ud fra hvilke brugere der har redigeret i artiklen, og den respektive troværdighed for disse brugere udregnes på baggrund af deres redigeringshistorie. Jo længere tid brugernes redigeringer får lov til at stå, jo mere troværdighed tildeles de.

Tekst på hvid baggrund er som udgangspunkt til at stole på; jo mørkere orange den er farvet, jo mere grund er der til at stille spørgsmål ved troværdigheden. Således kan man se at for eksempel artiklen om Dallas Cowboys er forholdsvis troværdig:


Man kan læse mere på projektets wiki eller se en demo af projektet hvor et par hundrede wikipedia-artikler er importeret og analyseret.

Det ser umiddelbart lidt forvirrende ud, og det er i mine øjne en grov forsimpling, hvis man udelukkende vurderer troværdighed på dette grundlag. Men det er et prisværdigt initiativ at forsøge at indikere nogle af de konklusioner man kan drage ved at nærstudere artiklers og brugeres redigeringshistorik.

Jeg hørte først om projektet via Boing Boing.

Videnskabelig rygdækning
Det andet eksempel er fra augustnummeret af nettidsskriftet First Monday hvor der er en interessant artikel der undersøger Wikipedia-artiklers troværdighed på baggrund af hvor flittigt de citerer anerkendte forskningstidsskrifter. Til grund for undersøgelsen ligger en bestemt standard for henvisninger til forskningsartikler som blev introduceret på Wikipedia i 2005.

Selvom Wikipedia-artikler ikke citerer på linie med andre videnskabelige kilder, så finder undersøgelsen en stigende - og i stigende grad systematisk - brug af kilder. På den baggrund vurderes det at Wikipedia er hastigt på vej til at blive en yderst nyttig og troværdig kilde.

Sporing ad IP-adresser
Det sidste interessante eksempel jeg vil trække frem her, er også det der har fået langt mest opmærksomhed i både blogosfære og traditionelle medier. Det drejer sig om Wikipedia Scanner som er programmeret af Virgil Griffith, studerende fra Cal Tech. Det er et program der kan analysere de IP-adresser der står bag anonyme redigeringer på Wikipedia på en måde der gør det muligt at spore om nogen fra eksempelvis en større virksomhed eller organisation har været inde at rette i (pynte på) artiklen om virksomheden.

Det er en bemærkelsesværdig og smart lille løsning til at holde øje med hvad der sker på Wikipedia, og om der kunne være andledning til at læse artikler med større eller mindre skepsis.

Lige så bemærkelsværdigt er det dog hvor stor opmærksomhed denne historie har fået - for det er jo egentlig en gammelkendt problematik på Wikipedia. Prisværdigt med et redskab der kan hjælpe lidt til i vores vurdering af det vi læser, men som jeg ser det slet ikke noget der giver anledning til at gentænke hvordan vi opfatter Wikipedia og dens troværdighed - som der nogle steder lidt lægges op til. Læs en fin kommentar på dette ovre på Radar. Og se en fyldig historie om Wikipedia Scanner hos Wired.

Hvad er troværdighed?
Disse eksempler på at analysere Wikipedias troværdighed er guld værd i forhold til at arbejde imod en forståelse af dette fænomen - som trods alt stadig kun har seks år på bagen. Men de vidner som jeg ser det også om hvor kompleks og sammensat en størrelse troværdighed er. Og det vil for mig aldrig være særlig troværdigt at vurdere troværdigheden udelukkende på baggrund af det ene eller andet isolerede parameter.