Wikipedia lyfts ofta fram som en av vår tids stora underverk. Ett enormt uppslagsverk som vem som helst kan bidra till. Miljoner artiklar skrivna av människor som bidragit med sina expertkunskaper, helt utan ersättning och med det enda syftet att samla all världens kunskap på ett och samma ställe.

Verkligheten är, åtminstone delvis, en annan. Faktum är att långt ifrån alla artiklar på Wikipedia är skrivna av människor. Istället är det robotar, kodsnuttar som automatiskt samlar in och ordnar data i läsbar form, som under lång tid stått för en stor del av innehållet i uppslagsverket.

En av de mest framstående kommer från Sverige, och är skapad av Sverker Johansson. Han är naturvetare och lingvist och arbetar till vardags vid högskolan Dalarna. I Wikipedia-kretsar är han känd som mannen bakom Lsjbot, en robotskribent som sedan hösten 2012 arbetat med att uppdatera Wikipedia med artiklar om olika växt- och djurarter.

Relaterat: Wikipedia skärper reglerna för varumärken

Lsjbot hämtar information från vetenskapliga källor och använder dem för att skapa Wikipedia-artiklar i en rasande fart. Sedan starten har den skrivit drygt 2,7 miljoner artiklar på tre språk: svenska och de filipinska språken cebuano och waray-waray (“min fru kommer från Filippinerna”, säger Sverker Johansson).

Knappt en miljon av de drygt 1,7 miljoner artiklar som finns på svenskspråkiga Wikipedia är alltså skapade av Lsjbot.


Sverker Johansson är mannen bakom Lsjbot, roboten som skrivit hälften av artiklarna på svenska Wikipedia. Foto: Tommy Kronqvist, CC 3.0 

– Den skriver framförallt om biologi och levande varelser. Det är både för att jag tycker det är intressanta ämnen och för att det är områden som fungerar bra för en bot, säger Sverker Johansson till Internetworld.

Han började intressera sig för botprogrammering under hösten 2011. Ett år senare, hösten 2012, var Lsjbot klar och sattes i arbete.

– Grunden är rätt enkel, men sen är det alla komplikationer och specialfall och undantag som tar tid. Det handlar väl om sammanlagt ett par månaders programmeringsarbete, säger Sverker Johansson.

Artiklar skapade av Lsjbot bygger alla på samma textstam, där nyckelord och vissa data anpassas efter just det som beskrivs i artikeln.

Relaterat: Nio av tio på Wikipedia är män

– Den kan variera texten litegrann, lägga till eller ta bort en mening beroende på vad man hittar i databasen. Men i princip bygger allt på färdiga textsnuttar.

– Den hämtar information från flera olika biologiska databaser. En internationell som heter Catalogue of life, IUCNs lista över utrotningshotade djur och den svenska artdatabanken. Sen har jag lite annat smått och gott, men de är de största källorna, säger Sverker Johansson.


Lsjbot använder olika vetenskapliga databaser som källor, och skapar läsbar text av grunddatan. Alla artiklar följer ungefär samma mall.

I vissa kretsar är många skeptiska till robotskrivna artiklar. Sådana blir för torra, för tråkiga och kan aldrig fånga upp de mer “mänskliga” sidorna av en text, lyder kritiken. En robot kan till exempel aldrig beskriva i detalj hur ett djur ser ut eller driva komplicerade resonemang om ett visst ämne.

Sverker Johansson håller med om att robotskribenter bara är lämpade för vissa sorters ämnen. Lsjbot skapar bara artiklarnas grundstomme. Sen är det upp till mänskliga skribenter att fylla på och förbättra.

– En bot måste ha många snarlika artiklar att jobba med, så att man kan utgå från en standardiserad text och sen fylla i, säger han.

Så här långt har Lsjbot bland annat skapat artiklar om ungefär 8 000 fågelarter och alla världens drygt 55 000 svamparter. Målet är den ska skapa artiklar för alla världens kända växt- och djurarter, vilket Sverker Johansson tror kommer vara färdigt någon gång under 2014.

Vad boten får i uppgift att göra sen återstår att se.

– Jag funderar på lite olika saker. En möjlighet är att göra samma sak på flera språk. Det är ganska rättframt. Sen finns det ju helt andra ämnesområden också.

– Till exempel skulle det gå att läsa av Kungliga Bibliotekets katalog och ur det skapa artiklar om i princip alla svenska författare. Jag skulle behöva skriva ett nytt program för det, men med samma principer, säger Sverker Johansson. 


Daniel Goldberg är redaktionschef på Internetworld. På Twitter är han @danielg0ldberg.


Missa inte nya Internetworldpodden - allt om veckans stora nätsnackisar. Lyssna på veckans avsnitt här: