Je bevindt je hier:

De kansen van data (deel 2)

Rebecca Haselhoff, projectassistent bij Beeld & Geluid, onderzoekt waarom databronnen zo belangrijk zijn voor onderzoeksjournalisten. In het tweede deel van de blogreeks "De Kansen van Data" spreekt ze met Stijn Peeters, onderzoeker en docent Media Studies aan de UvA, over de waarde van data-analyse in journalistiek onderzoek en de bijbehorende mogelijkheden en uitdagingen.

Rebecca Haselhoff, projectassistent bij Beeld & Geluid, onderzoekt waarom databronnen zo belangrijk zijn voor onderzoeksjournalisten. In het tweede deel van de blogreeks "De Kansen van Data" spreekt ze met Stijn Peeters, onderzoeker en docent Media Studies aan de UvA, over de waarde van data-analyse in journalistiek onderzoek en de bijbehorende mogelijkheden en uitdagingen.

Mensen in een zaal die de cursus Data als Kans volgen

Foto: Een cursusdag van Data als Kans, 2023

Stijn doet dagelijks onderzoek naar data op social media: “Ik analyseer wat mensen online delen en hoe onderzoekers het beste met sociale media kunnen werken. Erg interessant, want sociale media veranderen constant." Hij benadrukt dat alles wat mensen op sociale media delen data is. “Dit werpt meteen vragen op: hoe kunnen we die data van het internet halen, structureren en analyseren om betekenisvolle conclusies te trekken? Maar ik houd mij ook bezig met ethische vraagstukken, bijvoorbeeld wanneer mensen niet op de hoogte zijn van hoe hun informatie wordt ingezet.”

Multimediale bronnen 

Het onderzoek waar Stijn momenteel mee bezig is, richt zich voornamelijk op politieke subculturen op sociale media, zoals de 'alt-right' beweging en extreemrechtse complotdenkers. Hij analyseert taalgebruik, discussies en bondgenootschappen binnen deze groepen. Stijn benadrukt dat sociale media een interessante bron zijn om te begrijpen wat er speelt in de samenleving, hoewel het geen volledig representatief beeld geeft. “Maar het is erg interessant om te zien hoe allerlei bewegingen die normaal meer aan de randen van het politieke spectrum zitten, op dit soort sociale platforms samenkomen.”Stijn legt uit dat multimediale bronnen en data-analyse een belangrijke rol kunnen spelen voor onderzoeksjournalisten. “Het verzamelen en analyseren van online data is vaak sneller en gemakkelijker dan traditionele bronnen of interviews. Hoewel ze geen volledig beeld van de samenleving geven, kunnen sociale media journalisten wel helpen bij het vinden van relevante bronnen of gesprekspartners. Het kan het dus een ingang bieden naar een verhaal.”

Pixplot

Voorbeeld van een onderzoek uitgevoerd door Luuk Ex, waarbij PixPlot wordt gebruikt om online Tiktok video’s met behulp van een algoritme te sorteren op visuele kenmerken. Afbeeldingen die veel op elkaar lijken worden dichter bij elkaar gezet.

Lees meer over het onderzoek hierboven waarbij PixPlot wordt gebruikt. 

Artificial Intelligence

Vervolgens bespreken we de toenemende populariteit van kunstmatige intelligentie (AI) en de effecten ervan op online data, datajournalistiek en data-onderzoek. Stijn denkt dat AI een nuttige tool kan zijn bij het werken met data, omdat het kan helpen bij het terugbrengen van grote datasets tot de essentie van een onderwerp. “AI-modellen kunnen hier helpen bij het begrijpen van de structuur van tekst en het identificeren van bepaalde patronen, waardoor het proces efficiënter wordt. Het is hierbij wel belangrijk om een zekere mate van controle te behouden en de uitkomsten te verifiëren, aangezien AI er net als mensen naast kan zitten of vooroordelen kan hebben, en we vaak niet weten hoe AI tot conclusies komt.”

Een voorbeeld waarin duidelijk wordt dat AI vooroordelen kan hebben, is te zien op de website van ‘Hugging Face, een AI text-to-image generator, die laat zien hoe een combinatie van woorden kan leiden tot een vertekend en bevooroordeeld resultaat (‘bias’). Uit onderzoek is gebleken dat bepaalde woorden als meer mannelijk of vrouwelijk worden beschouwd door de AI op basis van hoe aantrekkelijk bepaalde functiebeschrijvingen met deze woorden leken voor mannelijke en vrouwelijke onderzoeksdeelnemers en in hoeverre de deelnemers het gevoel hadden dat ze in dat beroep 'thuishoren'.

voorbeeld van ‘Hugging Face’ waarin gezien kan worden dat de AI verschillende resultaten genereert afhankelijk van de woordencombinatie

Hierboven een voorbeeld van ‘Hugging Face’ waarin gezien kan worden dat de AI verschillende resultaten genereert afhankelijk van de woordencombinatie: bij de combinatie “emotioneel” en “CEO” zijn enkel mannen gegenereerd, terwijl er bij de combinatie “emotioneel” en “childcare worker” enkel vrouwen zijn gegenereerd.

Data als Kans

De training ‘Data als Kans’ kan journalisten waardevolle inzichten bieden. “Het is belangrijk om een gevoel te krijgen voor het werken met data en rekening te houden met verschillende aspecten, afhankelijk van het type data, de interpretatie ervan en de context,” zegt Stijn. “Een basiskennis van het internet en het bijhouden van trends en ontwikkelingen op online platforms zijn hierbij van belang. Het is een doorlopend proces om op de hoogte te blijven van trends en ontwikkelingen op platforms zoals TikTok. Mijn insteek is om de cursisten niet alleen over tools en technieken te leren, maar om ook te praten over de denkwijze die past bij het werken met bronmateriaal voor artikelen en onderzoek. Het is noodzakelijk om deze gedachtegang tot op zekere hoogte eigen te maken om succesvol met data aan de slag te gaan.”