Gå direkt till kursmenyn Gå direkt till innehållet

Med länkar skall uppslagsverk byggas – Wikipedia och kunskapsorganisation

Ett tydligt men inte så omdiskuterat överlapp mellan Wikipedia och bibliotek är hur informationen organiseras. Sett till de nästan ändlösa möjligheterna att expandera uppslagsverket (och även de övriga Wikimediaplattformarna), hur är informationen kategoriserad, avgränsad och länkad? Finns det några kontrollerade vokabulärer och varifrån kommer auktoritetsinformationen? Detta stycke tar upp några forskningsexempel på hur produktion, citering och klassifikation av kunskap kan se ut i Wikipedia och hur det relaterar till bibliotekens och kulturarvsinstitutionernas kunskapsorganisation. 

Wikipedias kunskapsorganisation

I detta stycke beskrivs framför allt kunskapsorganisationen i uppslagsverket Wikipedia, men det är värt att notera att Wikimediarörelsen har många underprojekt med olika informationspraktiker. I boken Wikipedia inifrån beskrivs kortfattat och informativt – om än något personligt – Wikipedias historia, struktur och utveckling. I korthet är Wikimedia ett paraply framför allt för ett stort antal webbsidor som är baserade på programvaran Mediawiki: uppslagsverket Wikipedia är störst och mest berömt, Wikimedia Commons är en databas för ljud, bild och andra mediefiler, Wiktionary är en ordbok, Wikisource samlar texter och så vidare – en komplett förteckning på Wikimedia-projekt och olika wikianvändargrupper (till exempel Wikimedia Sverige) finns på Metawiki

Uppslagsverket Wikipedia följer en klassisk encyklopedisk modell på så vis att artiklarna ska vara av allmänt intresse och neutrala. Till skillnad från encyklopedier som trycks på papper så har dock Wikipedia inga platsbegränsningar i mängden information som kan samlas, och författarmodellen – att vem som helst kan bidra – innebär att det inte finns några redaktionella begränsningar (till exempel antal tecken i en text). 

Ett utmärkande drag för uppslagsverket är att det går att se redigeringshistoriken för alla artiklar, vilket bjuder in till källkritisk granskning på ett sätt som traditionella uppslagsverk och bibliotekskataloger inte gör, oavsett om de är fysiska eller digitala. I en artikel om bibliotekskataloger och Wikipedias kunskapsorganisation menar författaren att Wikipedia skulle kunna vara modell för framtidens bibliografier och kataloger som då bör vara strukturerade på ett sådant sätt att de möjliggör historisk granskning, till exempel av förändringar i klassifikationen.

I Wikipedia finns olika kategorier som används för att underlätta navigering i uppslagsverket. Kategorierna underlättar också automatisk läsning av uppslagsverket. I en studie undersöks hur uppslagsverkets kategorier kan användas för en förenklad manuell indexering av öppna textresurser (i stället för att använda ett mer avancerat klassifikationssystem av den typ som används i bibliotek). Resultatet visar dock att den automatiskt extraherade taxonomin inte var tillräcklig för att stödja ett arbete med manuell indexering. 

Källhänvisningar och citering

Användandet av Wikipedia som en trovärdig källa i vetenskapliga artiklar är en omdebatterad fråga. Medan debatten pågår har forskare undersökt hur Wikipedia faktiskt citeras i vetenskapliga texter genom att söka igenom referentgranskade publikationer mellan 2002 och 2015 i databasen Web of Science (en av världens största forskningsdatabaser). Resultaten visar att citering av Wikipedia ökar och artikelförfattarna frågar sig om detta beror på sämre publiceringsstandarder i öppet tillgängliga tidskrifter eller om det används mer av ”forskare från institutioner av lägre kvalitet eller från utvecklingsländer, där tillgången till auktoriserade informationskanaler är begränsad”. Artikelförfattarnas syfte är att bidra till en välinformerad diskussion om ämnet för att förbättra vetenskaplig kommunikation i stort.

En annan studie undersöker citering åt andra hållet, det vill säga forskning som citeras i Wikipediaartiklar. Studien undersöker hur biblioteks- och informationsvetenskaplig litteratur publicerad mellan 2001 och 2010 citeras på Wikipedia och hur citeringar mäts på Wikipedia. Forskarna kom fram till att det finns begränsningar för att använda Wikipedia-citeringar i forskningsutvärderande syfte, bland annat på grund av bristande standardisering och ofullständighet i referenserna. Detta relaterar bland annat till Altmetrics (ett verktyg som används som alternativ eller komplement till bibliometri) som endast spårar citeringar från vissa språkversioner av Wikipedia (svenskspråkiga Wikipedia ingår till exempel inte). 

Ytterligare en studie som undersöker referenser i Wikipedia djupdyker i ett exempel från polskspråkiga Wikipedia. Källorna till 50 slumpmässigt utvalda artiklar om historiska personer kopplade till den österrikiska delningen av Polen har samlats in, kategoriserats och undersökts med hjälp av R (ett programmeringsspråk för dataanalys). Majoriteten av källorna visade sig vara primärkällor (till exempel myndighetsdokumentation, nyhetsartiklar och liknande material som finns tillgängligt i digitala bibliotek) och de sekundärkällor som används är framför allt böcker, webbsidor och bokkapitel. Även denna forskare kom fram till att det var svårt att analysera referenser i Wikipedia. 

Genrer och ämnesord

En studie från 2020 analyserar bibliotekariers roll i projektet WikiProject COVID-19 som syftar till att tillse att informationen på Wikipedia om det högaktuella och (under studiens gång) snabbt föränderliga ämnet är korrekt. Bibliotekariernas kunskaper om standardiserad resursbeskrivning och metadata presenteras som en viktig förutsättning för projektet. En fallstudie görs om universitetsbiblioteket i Salerno, där bibliotekarierna utgått från tidigare Wikipediakunskaper (från deltagande i till exempel #1lib1ref och lokala Wikipediainitiativ) för arbete med kvalitetsgranskning av de källor som använts i Wikipediaartiklar om Covid-19, med hjälp av till exempel unika identifierare, korrekta referenser och kategorisering i ämnesord. 

I en studie från 2019 berättas om hur ämnesord som används i Cochrane Library (en samling av medicinska databaser) har länkats automatiskt till Wikipedia genom maskinläsning och identifiering av koncept i uppslagsverkets innehåll som motsvarar ämnesorden. På grund av engelska Wikipedias storlek bedömer forskarna att manuell kategorisering av artiklar skulle kräva för mycket tid och arbete. Studien är ett exempel på hur det går att försöka koppla ihop Wikipediaartiklar med biblioteksdatabasers kontrollerade vokabulärer.

Länkade bibliotekskataloger

I en spansk artikel framställs fördelen med att synliggöra kulturarvsinstitutioners kataloger på Wikipedia, att användare kan hitta till institutionerna via Wikipediaartiklar där de nämns. För att det ska vara möjligt att göra behöver kataloger åtminstone en permanent länk (URL) men ännu hellre URI:er som används i länkad öppen data. I projektet som artikeln beskriver används ett program för att automatiskt hitta och skapa länkar mellan Wikidata och kataloger. Artikelförfattarna ser detta som en naturlig utveckling från stängda OPAC:er till öppna kataloger. 

Wales nationalbibliotek initierades projektet WiciLlên project/Sum of all Welsh för att dela data om alla böcker av walesiskt intresse som någonsin publicerats i Wales via Wikidata. Ett dataset bestående av information om ungefär en halv miljon böcker, deras författare och förlag gjordes tillgängligt och 50 000 av katalogposterna delades via Wikidata för att öka tillgängligheten och skapa möjligheter för forskare och utvecklare att använda dessa.27 

På University of Pittsburgh anlitades hösten 2013 två historiestudenter för att koppla ihop universitetets digitala samlingar med Wikipedia genom att länka till samlingarna i relevanta artiklar samt redigera artiklarna om det fanns information att utöka artiklarna med. I University of Houstons bibliotek gjordes ett liknande initiativ våren 2010 och drivkraften var en OCLC-rapport från 2005 som konstaterade att endast två procent av studenterna inledde sin forskning med en sökning i biblioteksresurserna. Strategin visade sig fungera och universitetets digitala samlingar användes i högre grad efter att de länkats till via Wikipedia som bland annat källmaterial.