Gå direkt till kursmenyn Gå direkt till innehållet

Big data och kategoriernas betydelse

För den enskilda användaren är det omöjligt att överblicka hur användargenerade data från olika tjänster används och förs vidare. Vid varje enskilt tillfälle där information om en själv förmedlas vidare kanske det inte upplevs som problematiskt, men när data från flera tjänster sammanställs kan de enskilda delarna bilda ett mönster som vi inte kunnat förutse. Den sammanställda mängden data kan föra med sig så kallad ”algoritmisk skada”. Det betyder att algoritmer kan användas av företag eller myndigheter på ett sätt som kan utsätta människor för problem (se vidare i kapitlet om Informationsinfrastruktur). Fenomenet att sammanställa och analysera stora datamängder från olika källor för att hitta mönster och samband kallas ofta för Big data.

Big data hanterar, som namnet antyder, stora mängder data, men syftar i sin betydelse snarare på hur man sammanför olika data för att kunna urskilja mönster. Man använder då algoritmer för att utföra så kallade förutsägande (predikativa) analyser genom att förstå hur olika skeenden hänger ihop. Det handlar inte minst om att förutspå konsumentbeteenden och individers preferenser, men andra användningsområden är också tänkbara. Exempelvis kan de ord vi söker på i Google Sök användas för att bedöma allmänhetens intresse för olika politiska frågor, för att förutse valresultat eller hur en influensaepidemi sprider sig. (Google Flu Trends, GFT).

Ett exempel på hur Big data kan påverka människors liv rör en kvinna som under nio månader försökte undvika att förmedla information om sin graviditet på nätet. Hon använde metoder för att undvika att information om henne sparades och sammankopplades. Hon lät exempelvis bli att betala med sina kreditkort, hon använde webbverktyg med kryptering och hon använde olika anonymiseringstjänster. På det sättet kunde hon dölja sin graviditet på nätet. Däremot framstod hennes samlade nätbeteende som misstänksamt i omvärldens ögon och ansågs ha stora likheter med hur en kriminell agerar för att undvika att bli upptäckt. Att utnyttja nätet samtidigt som man inte genererar data åt tjänster är mycket svårt.

Personalisering betyder inte enbart individanpassning av sökresultat eller nyhetsflöden utan även att information som samlas in om en person kan möjliggöra att personer delas in i på förhand bestämda kategorier. Samtidigt som internetföretagen personaliserar sina tjänster använder de sig av marknadsföringens indelning av konsumenter i kundsegment: gravida, ensamstående män, storstadsbor och så vidare. Användardata placerar automatiskt in användare i sociala kategorier för marknadsföring. Vi kan jämföra det med hur användare som bor i ett område med många låginkomsttagare ”översätts” till en kategori tillsammans med andra i området, oavsett enskilda individers inkomster.

Denna kategorisering går att jämföra med hur man i USA har börjat använda algoritmer som sammanför sociala kategorier med persondata för att fatta beslut om hur en misstänkt eller dömd person ska behandlas i rätten. De här algoritmerna används för att beräkna vilka risker det finns för att personen ska återfalla i brottslighet eller avvika om hen släpps fri mot borgen. På så sätt kan de kategorier som algoritmer bidrar till ses som ett slags klassifikationssystem som kan få direkta konsekvenser för människors liv. De kan bekräfta fördomar och de kan till och med bidra till att förstärka dem.

Övning

Undersök hur väl du stämmer in på den data som finns om ditt bostadsområde genom Hittas livsstilskarta som sammanställer diverse publikt tillgänglig data för att bygga en bild över hur de som bor i ett visst område är. Passar du in i kategorin?