Parlamenttikirjasto

perjantai 24. elokuuta 2007

Wikipedia ja laatu

Viime vuonna ilmestyneen Wikinomics-teoksen kirjoittajat (ks. saatavuus Selmassa) Don Tapscott ja Anthony D. Williams hyödyntävät taajaan Wikipediaa esimerkkinä siitä, millaisiin mullistaviin saavutuksiin parviäly tai ryhmäviisaus pystyy. Viitaten Nature-lehdessä vuonna 2005 ilmestyneeseen Jim Gilesin artikkeliin he väittävät jopa, että Encyclopaedia Britannica (EB) ja Wikipedia olisivat laadullisesti samantasoisia.
Tämä väite saattaa pitää joiltakin osin paikkaansa – Giles vertaili luonnontieteellisiä artikkeleita – ja on tietenkin retorisesti tenhoava. Oma näppituntumani on kuitenkin edelleen se, että EB on Wikipediaa tasalaatuisempi kokonaisuus. Toisaalta kaikenlaisten tietosanakirjojen (painettujen, digitaalisten, avoimien, kaupallisten…) käyttäjien on hyvä olla lähdekriittisiä. Taannoisessa viestissäni listatut blogitiedon laadun arvioinnin kriteerit ovat soveltaen hyödynnettävissä myös yksittäisten Wikipedia-artikkeleiden lähdekriittisessä tarkastelussa. Alla ehdotan joitakin lisämenetelmiä tähän tarkoitukseen:


Sisällön ja erikielisten versioiden analyysi

Artikkelisivua kannattaa tarkastella kielen, oikeinkirjoituksen ja sisällön näkökulmista: Kuinka hyvin laadittu sivu on? Löytyykö kirjoitusvirheitä tai muita kömmähdyksiä? Ovatko lähteet paikannettavissa? Ovatko esitetyt tietoväitteet uskottavia arkijärjen tai yleistietämyksen perusteella?

Jos vääristely- tai vandalismiepäilyt heräävät, artikkeliin liittyvät keskustelu- ja historiasivut kannattaa käydä läpi huolellisesti. Myös erikielisten Wikipedia-artikkeleiden vertailu kannattaa: englannin- ruotsin- ja saksankieliset Wikipedia-artikkelit ovat usein suomalaista vastinettaan laajempia ja yksityiskohtaisempia. Toisinaan suomenkieliseen artikkeliin on putkahtanut myös englanninkielisen artikkelin väärinymmärrykseen perustuvia käännösvirheitä.

Laadun tai laaduttomuuden eksplisiittiset indikaattorit

Wikipedia-artikkelissa voi olla monenlaisia sen laatuun liittyviä merkintöjä tai leimoja. Artikkeli voi olla tynkä, sen sisältämän tiedon todentaminen voi edellyttää lisäviittauksia kolmannen osapuolen lähteisiin, se voi olla kiistanalainen tai rikkoa Wikipediassa noudatettua neutraalin näkökulman periaatetta (NPOV) tai se voi olla vertaisarvioitu ja merkattu suositelluksi sivustoksi. ("Vertaisarviointi" ei tietenkään tässä viittaa tieteelliseen referee-käytäntöön, vaan Wikipediayhteisössä harjoittettuun laatukontrolliin.)

Tekijän maineen tai auktoriteetin tarkastelu

Vaikka Wikipediaa päivitetään usein nimimerkin turvin, ahkerat yksittäiset tietosanakirjatoimittajat keräävät vähitellen toiminnallaan hyvää tai huonoa karmaa. Wikipediassa syntynyttä mainetta voi selvittää tutkimalla nimimerkin käyttäjäsivua, jos sellainen Wikipediasta löytyy. Esimerkiksi nimimerkki Ppntori on tehnyt yli 30 000 muokkausta Wikipediaan ja saanut urakoinnistaan erilaisia muiden käyttäjien myöntämiä tunnustuksia. Käyttäjäsivuun kytkeytyvältä keskustelusivulta paljastuu, että Ppntori on ollut mukana myös erilaisissa tiedollisissa kiistoissa, joita Wikipedian kaltaisessa avoimen sisällön tietosanakirjassa väistämättä syntyy. Ppntorin käyttäjäsivun päivitystahti paljastuu historiasivulta: nimimerkki on Wikipediassa jatkuvasti aktiivinen. Käyttäjäsivulta on pääsy myös loki- ja muokkaushistorioihin, jotka kertovat siitä, millaisiin asioihin käyttäjä on Wikipediassa keskittynyt. Vaikka käyttäjäsivuja ei löytyisikään, nimimerkki- tai IP-osoitekohtaista logia on aina mahdollista tarkastella.

Koska Wikipedia-nimimerkkiä saatetaan hyödyntää muissakin verkkopalveluissa, nimimerkin mainetta voi setviä myös googlaamalla sitä, millaisissa muissa yhteyksissä tai palveluissa nimimerkkiä hyödynnetään. Mikään ei tietenkään takaa, että tiettyä nimimerkkiä muualla hyödyntävä henkilö on sama kuin Wikipediassa.

Yksittäinen Wikipedia-toimittaja voi erilaisissa keskusteluissa vedota asiantuntemukseensa: hän voi väittää olevansa professori, dosentti tai tohtori. Tällaisiin väitteisiin kannattaa suhtautua skeptisesti, ellei väittäjälle ole esittää tuekseen todistusaineistoa. Nimimerkin suojassa voidaan omaa tiedollista auktoriteettia yrittää kasvattaa myös valheellisin perustein.

Organisaatio- ja yksilökohtaisten intressinäkökohtien huomiointi

Ken MacLeodin tuoretta scifi-teosta The execution channel ei voi kirjana suositella, mutta siinä on kiinnostava kuvaus siitä, millä tavoin tiedustelupalvelut voivat käyttävät blogosfääriä todellisuuden valkopesuun. Myös Wikipedia on altis erilaisille propaganda-, harhautus- ja markkinointioperaatioille, jotka usein tehdään anonyymisti, jopa ilman nimimerkiä.

Kun käyttäjä ei hyödynnä nimerkkiä, tämän karkea tunnistus tapahtuu Wikipediassa IP-osoitteen perusteella, jolloin IP-osoitekohtainen tarkastelu voi paljastaa mielenkiintoisia asioita. Wired-lehti on listannut omalle sivulleen IP-osoiteavaruuksien paljastamia organisaatioiden suorittamia indoktrinaatiotemppuja: joko suoranaisia vääristely-yrityksiä tai lievempiä todellisuuden sävytyksiä. Wikiskannerin avulla voidaan tutkia esim. tietyn organisaation IP-osoiteavaruudesta tehtyjen muutosten luonnetta.

Webliometrinen analyysi

Tieteellisiin viittauskäytäntöihin keskittyvän bibliometriikan sisartutkimusala webliometriikka keskittyy verkko- ja linkitysanalyyseihin. Pienimuotoista webliometriikkaa voi harjoittaa esim. Googlen "link"-haun avulla: Kuinka paljon linkkejä tiettyyn Wikipedia-artikkeliin on? Löytyykö artikkeliin Wikipedian ulkopuolisia linkkejä? Millainen taho ne on tehnyt? Esimerkiksi Franz Schubertia käsittelevä englanninkielinen Wikipedia-artikkeli on tätä kirjoitettaessa linkitetty 191 kertaa. Näistä linkeistä 20 on peräisin Wikipedian ulkopuolisista domaineista (mm. BBC:ltä).

Lopuksi: tiedon avoin lähdekoodi

Wikipedia on avannut tiedon muodostuksen lähdekoodin: tietosanakirjan historia- ja lokisivut paljastavat ne kiistat ja keskustelut, joita kaupallistenkin tietosanakirjoja laadittaessa todennäköisesti käydään kulissien takana, mutta jotka eivät koskaan pääse julkisuuteen. Yksittäisen tietosanakirja-artikkelin eheys ja johdonmukaisuus voi siis olla näennäistä. Wikipedian radikaali avoimuus antaa lähdekriittiselle tarkastelulle hyvät lähtökohdat. Selkeät tyyli- ja sisältövirheet voi myös helposti itse korjata.


Kimmo Tuominen

2 kommenttia:

mace kirjoitti...

Kiitos hyvästä blogista! On aina hyvä tuoda esiin koko kirjo ominaisuuksia, joilla Wikipedia tai jokin muu, uusi ilmiö poikkeaa edeltävistä ilmiöistä. On masentavaa tavata ihmisiä jotka kuvittelevat, että "Wikipedia on kuin tietosanakirja, mutta ilmainen". On jo hyvä, jos joky tietää että sitä voi kuka tahansa muokata, mutta on myös paljon muuta joka kannattaa ottaa huomioon ja ainakin osa näistä osioista ovat kyllä WP :ssä ihan hyvin esillä.

Kirjaston blogi-toimitus kirjoitti...

Itse kaipaisin systemaattisia analyyseja Wikipedian ominaisuuksista ja luonteenpiirteistä. Kuten tässä ammoisessa blogikirjoituksessa mainitsen, Wikipedian lähdekoodi on avoin. Tämän pitäisi mielestäni helpottaa sekä määrällisten että laadullisten tutkimusten tekoa Wikipediasta. Taannoisessa Tieteessä tapahtuu lehdessä on otettu ensi askeleet suomalaisen Wikipedia-tutkimuksen suuntaan. Wikipedian "muokkaa" ja "historia"-painikkeiden kulttuurista potentiaalia on puolestaan käsitelty kiinnostavasti täällä.