En kort introduktion till AI på bibliotek
Vad är egentligen AI och vilken funktion skulle denna så omtalade teknik kunna fylla på våra bibliotek? Utifrån en relativt färsk rapport från Library of Congress försöker vi utreda frågan och samtidigt spekulera lite om framtiden, något som känns naturligt när det handlar om AI.
Observera att denna artikel skrevs innan generativ AI:s genomslag, det vill säga innan vi alla fick möjlighet att skapa bilder och texter med verktyg som ChatGPT och Midjourney med flera. Det går fort i teknikutvecklingen gällande AI och en hel del innehåll i artikeln kan säkert upplevas som daterat. Nya AI-resurser på Digiteket kommer!
Vad är egentligen AI? Hur avmystifierar man denna spännande teknik som vi alla har en bild av, delvis färgad av science fiction och delvis av en mängd teknikoptimistiska röster som vi möter i media. Röster som ofta målar upp futuristiska bilder där AI är lösningen på en mängd av våra samhällsproblem.
En utgångspunkt i att förstå vad AI kan vara är att utgå från vad det inte är. Det är i dagsläget inte något som liknar vår mänskliga hjärnas intelligens. Tänk er AI istället som ett sätt att hantera stora mängder data som den kan lära av på egen hand. En AI-utnyttjande teknik som är nära en kommersiell lansering är autonoma fordon i form av självkörande bilar. Ett sätt att närma sig en uppfattning av hur komplex tekniken är är att fundera på hur många val du gör när du kör bil. Du väljer att titta i speglar, du anpassar din fart efter medtrafikanter, du reagerar på oväntade händelser som en ambulans i backspegeln, du krypkör i villaområdet när du hör barnskratt genom rutorna. Alla dessa parametrar måste en AI kunna ta hänsyn till och reagera på. Att härma vårt mänskliga beteende i programmeringskod är (i nuläget) på tok för komplext. Det går inte att mata in alla olika typer av händelser och reaktioner på dessa som sker när man kör. Istället har ett AI fått öva på samma sätt som vi lärt oss köra bil genom att övningsköra. Utifrån olika regler (trafikregler) och instruktioner (kör vänligt) har AI:n övningskört och lärt sig hantera olika komplexa trafiksituationer.
Ett annat sätt att få en uppfattning om tekniken är att titta när företaget OpenAI:s avatarer blir allt bättre på att leka virtuell kurragömma. I videon ser vi datorn spela kurragömma mot sig själv och efter en mängd rundor så lär sig de blå spelarna att gömma sig genom att blockera dörrarna. Letarna lyckas dock lära sig att klättra över väggarna och kapprustningen är igång. Detta kan tjäna som ett exempel på vad AI är och hur den fungerar. Avatarerna lär sig autonomt, ingen har programmerat dem och de är adaptiva, de anpassar sig efter hand.
Länk till filmen Multi-Agent Hide and Seek av Open AI på YouTube.
Bibliotek och AI
En bibliotekssjälvklar aspekt av AI är att tekniken är ypperlig för att hantera, analysera och använda stora mängder digital data, något som stora bibliotek har tillgång till i och med digitiserade samlingar.
Library of Congress sammanfattar AI, maskininlärning (ML) och bibliotekens roll och uppgift i den relativt nya rapporten Machine Learning + Libraries A Report on the State of the Field
Rapporten använder genomgående begreppet maskininlärning men vi växlar mellan maskininlärning och AI synonymt i denna text.
Bibliotekens roll i förhållande till AI och maskininlärning beskrivs i tre punkter:
- Ett verktyg för att hantera, analysera och använda digitala samlingar
- Att biblioteksspecifika uppgifter och arbetsflöde skulle kunna förbättras av maskininlärning
- Undervisning och samtal om algoritmkunskap och AI-litteracitet, på samma sätt som att biblioteken jobbar med MIK
De flesta försök med maskininlärning på bibliotek handlar om att det tar för lång tid för oss människor att hantera och katalogisera stora mängder data. Maskininlärning skulle kunna vara ett sätt att berika, “enrich”, digitiserade samlingar och göra dem mer användbara för forskare, studenter och allmänhet.
Biblioteken måste dock vara varsamma och gå långsamt fram i en värld där de stora nätverks- och teknikföretagens mål sällan är samstämmiga med bibliotekens. Algoritmer påverkar allt fler aspekter av våra liv och vi kan se framför oss en värld med algoritmskrivna texter och bildkulturer som helt härstammar från maskininlärningsteknik.
Rapporten menar att genom att sätta etik, transparens, diversitet, integritet och inkludering i centrum så kan bibliotek ta en ledarroll i denna fråga som rapporten menar kommer att bli den centrala kulturella debatten i det tjugonde århundradet.
“By centering ethics, transparency, diversity, privacy and inclusion, libraries can take a leadership role in one of the central cultural debates of the twenty-first century.”
Vad är maskininlärning?
Maskininlärning handlar om ett antal olika metoder som låter datorer lära från data utan att de blivit explicit programmerade att göra något specifikt. Den är i visst mått autonom. Man brukar skilja på övervakad och oövervakad maskininlärning. Den förstnämnda metoden handlar om att man förser algoritmerna med ett facit innan den börjar jobba. Om man vill att AI:n ska identifiera alla science fiction-texter som finns i KB:s arkiv börjar man med att lära den vad en science fiction-text är. Den får öva på texter av Sam J. Lundwall, Isaac Asimov och Margaret Atwood innan den släpps lös på hela beståndet.
Med oövervakad maskininlärning menas att att AI:n själv hittar mönster och strukturer i texter (eller vilken typ av data AI:n jobbar med) och själva klassificerar materialet. Kanske hittar den mönster mellan ovannämnda författare och klassificerar dem på samma sätt, eller så kanske det gör helt andra kopplingar.
Båda metoderna är beroende av vilket testmaterial de har att jobba med och lära sig av, resultaten skulle se markant annorlunda ut om du stoppat in Serietekets, Världens bibliotek eller Stadsarkivets textutbud. Tillgången till data och vilken man använder för att träna sin AI på är en av de stora källorna till mänsklig påverkan på slutresultatet.
Algoritmisk bias
Eftersom det är vi människor som skapar maskininlärningsalgoritmerna som jobbar med materialet, väljer ut vilket material som algoritmerna ska träna på och sluligen tolkar resultatet är tekniken på intet sätt objektiv eller neutral och det är viktigt att vara medveten om detta.
Det finns många etiska effekter av maskininlärning som är viktiga att hålla i bakhuvudet vid AI-projekt. Padilla har skrivit mycket om dessa i sin läsvärda rapport. Alla typer av datorsystem kommer alltid fulladdade med sina skapares bias och fördomar vilka sen på olika sätt kommer att avspegla sig i tillämpningen av tekniken. Det är viktigt att ha med sig detta initialt vid skapandet av AI-projekt.
Padilla, Thomas. 2019. Responsible Operations: Data Science, Machine Learning, and AI in Libraries.
Dessa aspekter är inte lika tydliga när man pratar AI/maskininlärning i förhållande till biblioteks kulturella arv-samlingar (cultural heritage). Biblioteken kan dock sägas i sin roll som samhällsinstitution vara ålagda att leda detta etiska arbete och agera som förebild enligt rapportens författare.
En aspekt av att källmaterial som AI lär sig av inte är objektivt är att det alltid har skett ett urval i vad som digitiserats. Vilken typ av material finns representerat på biblioteket och vilket har gjorts digitalt? De stora mainstream-tidningarna eller de små lokala på ursprungsspråk?
Data in påverkar data ut.
Vad kan man använda maskininlärning till?
Den vanligaste användningen av ML-teknik i biblioteksvärlden är underlättandet av upptäckande i stora samlingar. Det är som människa svårt att överblicka och hitta i stora digitala samlingar med miljontals textobjekt. Algoritmerna kan också göra kopplingar som vi människor hade förbisett eller aldrig hade haft förmåga att göra.
Maskininlärning har visat sig användbart i projekt som:
- identifiering av ämne, tema eller idéer över olika dokument och källor
- extraherande av metadata från digitiserade objekt
- taggning av innehåll i digitala samlingar
- gruppering av liknande material (text, bild eller ljud)
- identifiering av geografiska egenheter i kartor.
Den vanligaste ML-teknologin i bibliotek är i nuläget OCR (Optical Character Recognition). Detta är ett antal algoritmer designade att efterlikna det mänskliga ögat och hjärnan när den läser och tolkar bokstäver och översätter sen dessa till maskintext. OCR är oftast en övervakad ML-metod som först tränas på en mängd text som man sen granskar för att se hur bra den betett sig. OCR som teknik har tillgängliggjort enorma mängder text som innan var i princip otillgängliga då tekniken är så enormt mycket snabbare än en människa på att transkribera text.
Gruppering och klassifikation
ML nämns ofta som användbart för dess förmåga att identifiera samband mellan material som kanske inte hade varit uppenbart för ett mänskligt öga. Alan Turing-institutet använde till exempel denna teknik för att hitta litterära exempel på när maskiner representeras som levande entiteter i skönlitteratur i en större mängd digitiserade samlingar.
Samuel Butler publicerade 1872 boken Erewhon där han beskriver en dystopi där maskiner utvecklar medvetande i en parallell till Darwins evolutionslära.
ML-metoder är inte begränsade till text utan går också att använda på bild, ljud och videomaterial. Det pågår nu en uppsjö olika ML-projekt där man kategoriserar videomaterial: Vad syns i olika scener? Vem är med var? Vad återkommer på flera ställe? Tänk er en maskininlärd inventering av SVT:s arkiv, du hade till exempel kunnat söka efter “man i rock med hatt och mustasch” och algoritmen hade redovisat alla träffar för dig med tidskoder när någon som passar in på beskrivningen förekommer. Även ljudinspelningar kan med teknikens hjälp taggas och sorteras och då i förlängningen bli sökbart på ett helt annat sätt än det är idag.
All typer av data kan sorteras, klustras och katalogiseras men också korslänkas och refereras vilket gör att man kan upptäcka kopplingar mellan olika typer av objekt som man annars aldrig hade upptäckt manuellt: Den typen av kniv som användes av den här stenålderskulturen liknar en kniv som har använts av en helt annan stenålderskultur, tusentals mil därifrån.
Administration och beståndshantering
Mycket av exemplen ovan är mest relaterade till stora forsknings- eller kulturarvsbibliotek som till exempel KB men det finns också en del mer konkreta användningsområde för folkbibliotek. Maskininlärning kan till exempel användas för att välja ut material för gallring. Algoritmerna gör företrädesvis förarbetet och föreslår titlar som en bibliotekarie sedan tar beslut om. Man kan också tänka sig att ett AI-system skulle kunna lära av utlåningsstatistik och föreslå olika typer av inköp beroende på vilket bestånd man vill ha. Man kan vidare tänka sig att systemet, om det matats med och tränats på tillräckligt mycket data, kan föreslå var och hur böcker ska skyltas för bästa effekt.
Bibliotek som utbildare i AI-literacitet
AI-tekniken har också fört med sig möjligheten att skapa mycket trovärdiga fejkade videoklipp, så kallade deep fakes, möjligheten att skapa ansiktsbilder på människor som inte finns och snart också trovärdiga fejkljudalgoritmer. AI kommer öka mängden text, bild, film och ljud som är artificiellt skapade och med detta kommer det också behövas en ökad utbildningsinsats. Biblioteket med dess folkbildande uppdrag gällande demokrati kommer få ett utökat uppdrag: AI-litteracitet. Man kan se detta som en parallell till och vidgning av biblioteks MIK-utbildningsarbete.
Denna artikeln i Guardian har helt skrivits av en AI och vi kommer framöver får ta ställning till och hantera en uppsjö av maskinskrivna texter (i en helt ny betydelse):
A robot wrote this entire article. Are you scared yet, human?
Hur ska till exempel bibliotek hantera algoritmskrivna böcker?
Det är också relaterat till frågor om integritet, vem äger, har tillgång till och använder min data? Insamling av data är inte i sig en form av artificiell intelligens men ihopkopplad med AI kan den dock utgöra ett hot mot medborgares integritet. En AI kan få fram uppgifter som inte en vanlig människa hade lyckats med genom att göra kopplingar mellan data som är för komplext för en mänsklig hjärna.
Kommuner har börjat använda algoritmstyrda beslutssystem och vi kommer troligtvis snart få se olika AI-system för administration som praktiskt påverkar kommuninvånarna. Vem får försörjningsstöd? Vem är berättigad till bidrag? Hur ska man som medborgare förhålla sig till detta? Här kommer biblioteken framöver behöva förhålla sig till medborgarnas utbildningsbehov.
Vanliga utmaningar för bibliotek och AI
Ett antal utmaningar har utkristalliserats vad gäller ML-projekt på bibliotek. Ett är tillgången till tillräckligt mycket digitiserad data. Digitiserat material är bara en bråkdel av biblioteks samlingar. Det kan också vara problematiskt vilken typ av material som digitiserats. Om en AI till exempel bara tränats på Svenska Dagbladet så skulle den lära sig helt andra saker än en AI tränats på Norrskensflamman eller Dala-demokraten.
Ett av problemen med AI som diskuteras mycket är hur man lär den utan att alla våra mänskliga bias och fördomar följer med. AI-system har visat sig kunna kan leda till så kallad algoritmisk diskriminering, det vill säga att beslut blir ojämlika utifrån etnisk bakgrund, kön eller andra faktorer till exempel vid anställning eller lånebeslut.
Mer om etiska utmaningar för AI står att finna i Padillas ovan nämnda rapport.
Några frågor som åtminstone jag börjar fundera på relaterat till AI och bibliotek är
- Vad skulle vi kunna göra med all bibioteksstatistik?
- Vem äger och har tillgång till all data som bibliotek genererar?
- Finns det ett ekonomiskt värde i detta?
- Bibliotek använder diverse rekommendationsalgoritmer på sina digitala tjänster, vilka finns, hur funkar de, vem äger datan, vem äger algoritmerna?
- Skulle ett klassiskt folkbibliotek kunna ha AI-lösningar? I så fall vilka?