Parlamenttikirjasto

tiistai 24. heinäkuuta 2007

Blogien määrä ja laatu

Kuinka löytää se hyödyllinen ja käyttökelpoinen tieto? Miten erottaa laadukkaat blogit ja mielenkiintoiset näkemykset informaatiomassasta? Millainen blogitieto on laadukasta ja mitä laadulla tarkoitetaan blogien yhteydessä?

Blogihakukone Technorati tekee säännöllisin väliajoin mittauksia blogiavaruuden tilasta. Uusimman "state of the live web" -raportin mukaan blogiavaruus, blogosfääri tai blogistania on nyt 60 kertaa suurempi kuin kolme vuotta sitten. Uusia blogeja syntyy 120 000 vuorokaudessa. Ei tarvitse kovin paljon pyöristää Technoratin saamia mittaustuloksia sanoakseen, että joka minuutti syntyy 90 ja joka tunti 5 400 uutta blogia. Blogeja on jo yli 70 miljoonaa ja maailmassa lähennetään 17 blogiviestiä joka sekunti, eli 1,5 miljoonaa blogiviestiä päivässä. Kiinnostavaa Technoratin saamissa mittaustuloksissa on myös se, että vuoden 2007 aikana japani on ohittanut englannin suosituimpana bloggauskielenä (japanin osuus on 37 ja englannin 33 prosenttia kaikista uusista blogiviesteistä).


Intialainen matemaatikko ja kirjastoteoreetikko S. R. Ranganathan kutsui jo vuonna 1931 kirjastoa kasvavaksi organismiksi . Vaikka fyysiset kirjakokoelmatkin kasvavat, niiden kasvu pysyy yksittäisissä kirjastoissa kurissa tila- kustannus- yms. syiden vuoksi. Kun kokoelma karttuu uusilla kirjoilla, sitä on toisaalta myös karsittava. Jotta painotuotteiden vaatima tila ei kirjastossa kasvaisi, kartunnan ja karsinnan pitää olla samansuuruista. Blogiavaruus sen sijaan paisuu bittitodellisuudessa kurittomasti. Verkko toimii omalla kasvulogiikallaan, vailla atomimaailman pidäkkeitä.


Painettuihin julkaisuihin verrattuna blogit ovat uudentyyppinen, entistä dynaamisempi, vuorovaikutuksellisempi ja keskustelevampi tiedonlähde. Blogit sisältävät yhtäältä runsaasti hyödyllistä tietoa, käyttökelpoista ajankohtaisinformaatiota, hyviä tiedonlähdevinkkejä, perusteltua mediakritiikkiä ja punnittuja asiantuntijamielipiteitä. Toisaalta blogeissa on paljon roskaa: megatavuittain tekstiä, joka saattaa olla hyödyllistä kirjoittajalleen ja tämän lähipiirille, mutta jolla ei ole suurempaa relevanssia muiden tiedonhakijoiden kannalta. Kaikkein huolestuttavin blogiavaruuden piirre on vandalismi. Technoratin mukaan mm. erilaisiin kaupallisiin tarkoituksiin laadittuja "roskablogeja" tai "splogeja"syntyy kolmesta seitsemään tuhanteen joka päivä. Roskablogin olemassaolon ainoa tarkoitus voi olla Googlen indeksointi- ja relevanssilajittelualgoritmien harhauttaminen .


Laatukriteerit


Klassinen tapa lähestyä yksittäistä blogia tai blogiviestiä lähdekriittisesti on soveltaa erilaisia laatukriteereitä. Laurel A. Clyde on listannut tällaisia kriteereitä Internet-vuosissa laskettuna jo aika lailla iäkkäässä teoksessa "Weblogs and libraries" (ks. saatavuus Selmassa). Clyden esittelemät laatukriteerit ovat hyvin perinteisen tuntuisia ja soveltuvat miltei sellaisenaan muunkin tyyppisen verkkoaineiston kuin blogien laatuarviointiin. Kirjasto voivat soveltaa niitä esim. rakentaessaan suosittelulistoja tai aihehakemistoja, mutta on niistä hyötyä tavallisille ja vähän edistyneemmille tiedonhakijoillekin: Maineikas blogiavaruuden kartoittaja Robert Scoble kertoo oheisessa videossa käyvänsä läpi yli 600 RSS-syötettä ja 1 300 blogiviestiä päivässä. Uutisvirtaa suodattaessaan hän soveltaa yllättävän monia Clyden esittelemistä kriteereistä.

Soveltaen suomennettuna Clyden listaamat laatukriteerit ovat seuraavat:


 • Tiedollinen auktoriteetti (Kuka blogin on laatinut? Millainen on laatijatahon pätevyys / asiantuntemus/ maine muiden asiantuntijoiden keskuudessa? Mikä organisaatio sponsoroi tai julkaisee blogia? Millaista tietoa blogi antaa sen luojasta, julkaisijasta tai sponsorista? Onko blogiin viittauksia luotettavissa aihehakemistoissa tai virtuaalikirjastoissa?)
 • Tarkoitus (Mikä on blogin päämäärä tai lähtökohta? Keille blogi on suunnattu? Onko päämäärä linjassa arvioijan käyttäjäyhteisön tarpeiden kanssa? Kuinka hyvin blogi saavuttaa tavoitteensa tai missionsa?)
 • Kattavuus (Kuinka kattava blogi on? Onko sen kattavuus linjassa blogin tarkoituksen kanssa? Onko sen kattavuus linjassa arvioijan käyttäjäyhteisön tarpeiden kanssa? Kuinka täydellistä kattavuus on vai onko esitetyissä tiedoissa aukkoja? Kuinka syvällisesti aihepiiri on katettu? Onko käsittely syvällisempää toisilla alueilla kuin toisilla eli kuinka tasalaatuinen blogi on? Onko blogissa viittauksia muihin tiedonlähteisiin? Kuinka laadukkaita viitatut tiedonlähteet ovat?)
 • Luotettavuus (Kuinka ajantasaista blogissa annettu informaatio on? Voidaanko esitetyt väitteet vahvistaa muiden tiedonlähteiden avulla? Onko blogin sisältö värittynyt tai peräti vääristynyt jonkin näkökulman tai intressin vaikutuksesta? Herättääkö tiedon esittämistapa luottamusta? Onko kirjoitus- tai kielioppivirheitä? Kuinka tasokasta kirjoitustyyli on? Onko käytetyt tiedonlähteet dokumentoitu? Käytetäänkö viittauksia?
 • Ajankohtaisuus (Kuinka usein blogia päivitetään? Onko esitetty tieto ajan tasalla? Ovatko valokuvat ja muu visuaalinen informaatio ajan tasalla? Kuinka täydellisiä päivitykset ovat?)
 • Formaatti (Kuinka hyvin blogin esitystapa vastaa tehtäväänsä ja käyttäjäkunnan tarpeita? Kuinka hyvin blogiformaatti soveltuu aiheen käsittelyyn? Onko blogin sisältö esitetty selkeästi ja organisoidusti?)
 • Ulkoasu (Kuinka houkutteleva blogin pääsivu on? Millainen vaikutelma lukijalle tulee? Onko ulkoasu linjassa blogin tarkoituksen, sisällön ja käyttäjäkunnan odotusten kanssa? Käytetäänkö fonteissa, linkeissä ja taustassa värejä, jotka soveltuvat verkkoviestintään? Onko fonttikoko sopiva suhteessa blogin tarkoitukseen ja sen kohdeyleisön tarpeisiin?)
 • Navigointi (Onko sivuilla navigointi helppoa? Toimivatko navigointitoiminnot loogisesti kaikkialla blogissa? Kuinka helppoa on tiedon löytäminen? Onko sisällöstä karttaa tai sanahakemistoa? Onko blogilla hakukone ja kuinka hyvin se toimii?)
 • Linkit (Ovatko tehdyt linkitykset linjassa blogin tarkoituksen ja kohdeyleisön tarpeiden kanssa? Toimivatko linkit? Ovatko linkit parhaita mahdollisia blogin käsittelemässä aihepiirissä? Onko linkit kuvattu tarkoituksenmukaisesti? Erottuvatko linkit helposti blogin muusta sisällöstä?)
 • Käyttäjien erityistarpeet ja tiedon saavutettavuus (Voivatko näkövammaiset käyttää blogia? Onko käytössä aputeknologiaa, kuten sivunlukuohjelma? Onko liikkumisrajoitteisten käyttäjien tarpeet huomioitu? Onko sivustolle tehty käytettävyystestaus? Onko sivu avoinna kaikille käyttäjille? Tarvitaanko johonkin toimintoihin tai sisältöihin maksuja tai salasanoja?)
 • Tekniset tekijät (Toimiiko blogi millä tahansa selaimella? Latautuuko se nopeasti? Onko blogi aina käytettävissä, vai onko esim. huoltokatkoja? Ovatko sivut pitkiä ja hankalakäyttöisiä? Kuinka helppo niitä on tulostaa? Onko "tulostussivu"-toiminto käytettävissä?)
 • Blogin viehätysvoima tai houkuttelevuus (Kuinka houkutteleva blogi on muihin saman aihepiirin blogeihin verrattuna? Kuinka hyvin vakiintuneet blogitoiminnot onnistuvat?)
 • Päivämääränmukainen järjestys (Onko blogiviestit päivätty? Näkyykö selvästi, kuinka usein blogia päivitetään? Onko päivitystahti linjassa blogin tarkoituksen tai päämäärän kanssa?)
 • Interaktiivisuus (Millaisia vuorovaikutusmuotoja blogi tarjoaa? Kuinka hyvin ne toimivat? Kuinka paljon niitä käytetään? Kuinka moni ihminen kommentoi blogia ja kuinka usein? Ovatko kommentit sopivia blogin tarkoituksen, aihealueen ja käyttäjäkunnan tarpeiden kannalta? Kuuluvatko kommenttien lähettäjät blogin kohdeyleisöön? Kuinka helppoa käyttäjien on lähettää kommentteja ja olla vuorovaikutuksessa muiden blogin käyttäjien kanssa?)
 • Toiminnallisuudet (Onko blogilla arkisto? Kuinka helppoa vanhojen postien tai kommenttien löytäminen on? Käyttääkö blogi pysyviä linkkejä eli ns. permalinkkejä )? Käytetäänkö webkameraa, ääni- ja videotiedostoja jne. tarkoituksenmukaisesti? Löytyykö RSS ja/tai Atom-syötettä? Kuinka helposti syöte tai syötteet löytyvät?

Laadun arvioinnin tarpeet ovat moninaiset ja laadun ja roskan välinen raja on tietenkin suhteellinen. Jos on tarkoitus käydä läpi 600 RSS-syötettä päivittäin, omat arviointikriteerit sisäistyvät ja niitä sovelletaan intuitiivisesti. Vuorovaikutuksellisuus houkuttaa myös tietynlaiseen subjektiivisuuteen: kavereiden tai verkkotuttujen blogeja suositellaan ja omassa viiteryhmässä syntyneitä uusia viestejä linkitetään mieluummin kuin aivan vieraiden laatimia.

Suosittelun rooli mediaekosysteemissä

"Weblogs and libraries" -teoksen varhainen kirjoittamisajankohta selittänee sen, ettei kirjassa ole otettu huomioon blogien ja yksittäisten blogiviestien laadunarvioinnin yhteydessä korostuvaa erilaisten äänestys-, "diggaus"- ja suosittelujärjestelmien roolia. Matti Lintulahti kuvaa Journalismikritiikin vuosikirjassa 2006 (ks. saatavuus Selmassa) verkkoa uudenlaisena mediaympäristönä, joka kääntää traditionaalisen joukkoviestinnän mallit päälaelleen. Kun perinteinen media analysoi, filtteröi, tarkistaa ja editoi ensin ja julkaisee vasta sitten, blogiavaruus ja koko vertaismedia tuottaa ensin kasapäin tietoa, jota se alkaa sitten koko yhteisön voimin puntaroida, setviä ja arvottaa. Tämä uudenlainen mediaekosysteemi perustuu lukijoiden ja osallistumisen mahdollistavien sovellusten paljouteen sekä siihen, että tietyt sovellukset, verkkopalvelut ja blogit ovat vakiintuneet systeemin suosituiksi solmukohdiksi. Tässä systeemissä merkityksetön tieto Lintulahden mukaan hautautuu, koska se ei kiinnosta ketään ja koska kukaan ei sitä kommentoi. Sen sijaan merkityksellinen tieto alkaa nopeasti levitä: sitä kommentoidaan ja siihen viitataan hyperlinkeillä. Mitä enemmän yksittäinen tieto ja sen esittäjä saavat ystäviä, menestystä ja vaikutusvaltaa, sitä olennaisempi esitetty väite internetyhteisön kollektiivisen vakaumuksen mukaan on.

Vertaismediayhteisöjen suorittama kollektiivinen filtteröinti-, kommentointi-, virheenkorjaus- ja muu toimitustyö antaa usein merkittävää lisäarvoa tiedonhakijalle. Hyödynnämme kollektiivista filtteröintiä – tai suosioon perustuvaa auktoriteettia – joka kerta käyttäessämme Googlea (jossa hakutuloksen esittämisjärjestys perustuu mm. verkkodokumenttien linkkaustilastolliseen suosioon), Technoratia (jonka rankkaa blogeja ja antaa niille auktoriteettinumeron linkitysten perusteella) tai vaikkapa Digg.com -uutispalvelua (jossa uutisviestit valikoituvat palvelun etusivulle sen mukaan, kuinka paljon käyttäjäyhteisö niitä äänestää tai kannattaa).

Vaikka kollektiivinen laatufiltteröinti on usein tehokasta ja edullista, en kuitenkaan olisi valmis hylkäämään perinteisiä, jo painettujen dokumenttien maailmasta tuttuja, arviointikriteereitä blogienkaan laadunarvioinnissa. Edelleenkin on hyvä tutkia blogiviestin kirjoittajan taustoja ja esitettyjen argumenttien johdonmukaisuutta yhtä lailla kuin blogin teknistä toteutusta tai sen yleistä kieli- ja ulkoasuakin. Voi olla myös hyödyllistä kysyä, miksi tietty viesti näyttää keräävän kollektiivista arvonantoa: onko se esimerkiksi hauska tai viihdyttävä vai onko sen tietosisältö uusi ja korkeatasoinen? Linkkaajien ja diggaajien motiivit voivat olla monenlaiset – ja verkkoyhteisökin voi olla väärässä. Ei ole suinkaan aina selvää, että verkkoyhteisön "parviäly" nostaisi suosioon vain kaikkein laadukkainta informaatiota, joka korjaisi itseään jatkuvasti ja kehittyisi yhä paremmaksi ja totuudellisemmaksi. Toisinaan parviäly kenties toimii näin, mutta yhtä usein se voi pikemminkin haudata tiedonhakijan kaipaaman laadukkaan ja relevantin informaation unohduksen suohon. Lintulahden kuvaama uudenlainen mediaekosysteemi ei ehkä aina kehitykään evolutionaarisesti, vaan pitäytyy vanhaan ja ennalta tiedettyyn. Ryhmä voi olla yhtä lailla tyhmyyden kuin viisaudenkin lähde. "Mitä useampi kokki sitä huonompi soppa", sanoo vanha kansakin. Erilaisten suosittelu- ja äänestyssovellusten yleistyessä lisääntyy motivaatio myös niiden epäeettiseen tai jopa rikolliseen manipulointiin.


Scoble kertoo haastattelussaan, että hän käy läpi myös vähän käytettyjä webbisivustoja ("low traffic sites"), eli blogeja, jotka eivät ole seuloutuneet kovin suosituiksi. Tiedonhakijan tulee siis edelleen nähdä vaivaa, eikä tyytyä vain välittömimmin läsnä olevaan informaatioon, jos hän mielii päästä hyvään lopputulokseen.

RSS:n problemaattisuus laadunarvioinnin kannalta

Vaikka RSS-lukuohjelmat ovat hyvin käteviä, ne voivat joskus pikemminkin haitata kuin helpottaa blogien laadunarviointia. Tietokoneen näytöllä ja erityisesti RSS-sovelluksissa tieto litistyy ja tuottaa kontekstin katoamisen ilmiön. Tällöin selaamme grafiikasta, identiteetistä ja tekijyydestä riisuttua syötevirtaa, joka näyttää olevan blogiyhteisön pikemminkin kuin yksittäisten asiantuntijoiden tuottamaa. Vaikka RSS-syötteestä päädyttäisiin varsinaiselle verkkosivullekin, voi käydä niin, että tekijä on valinnut anonyymiuden, jolloin emme saa lainkaan tietää hänen henkilöllisyyttään, koulutustaan, mahdollisia intressejään ja taustaorganisaatiotaan. Lisäksi blogien kaltaisten verkkodokumenttien dynaamisuus voi vaikeuttaa niiden arviointia jonakin tiettynä hetkenä: emme tänään tiedä, kuinka tietty blogi kehittyy huomenna. Kerran kirjoitettua tekstiä on myös täysin mahdollista muuttaa – parempaan tai huonompaan suuntaan. Kirjan sivuilla teksti pysyy samana, mikä tietenkin helpottaa lähdekritiikin toteuttamista.

Yhtä lailla kuin parviälyn rinnalla tarvitaan edelleen myös asiantuntijayksilöitä ja -yhteisöitä, tarvitaan suosioon perustuvan auktoriteetin lisäksi muunkinlaisia blogitiedon laadun arvioinnin keinoja. Myös informaatio- ja medialukutaitoja vaaditaan tiedonhakijalta edelleen, kuten Lintulahtikin artikkelissaan toteaa.

Yksittäisen blogiviestin tai RSS-syötteen laadun arviointi voi kysyä aikaa ja taitoa. Vaikka taitoa monilla varmasti riittäisikin, aikaa ei tahdo olla kenelläkään tarpeeksi.

Mutta ajan puute on myöhempien blogiviestien aihe.


Kimmo Tuominen


PS: Parlamenttikirjasto on Eduskunnan kirjaston henkilökunnan tuottama blogi, jonka ensi askel on tänään otettu kansainvälisen Kirjasto 2.0-viikon kunniaksi.