Datadeling voor iedereen
Steeds meer organisaties binnen de culturele en creatieve sectoren (CCI's) verzamelen data over hun digitale collecties en publiek, met de ambitie om data-gedreven te werken. Binnen het CCI-thrive project onderzoekt Beeld & Geluid hoe we data kunnen delen en inzetten, zodat de hele sector en de samenleving hiervan profiteren. Ik schreef hier een blogreeks over en in dit derde blog ga ik in op de infrastructuren en processen die datadeling beïnvloeden, en de normen die hierbij belangrijk zijn.
Steeds meer organisaties binnen de culturele en creatieve sectoren (CCI's) verzamelen data over hun digitale collecties en publiek, met de ambitie om data-gedreven te werken. Binnen het CCI-thrive project onderzoekt Beeld & Geluid hoe we data kunnen delen en inzetten, zodat de hele sector en de samenleving hiervan profiteren. Ik schreef hier een blogreeks over en in dit derde blog ga ik in op de infrastructuren en processen die datadeling beïnvloeden, en de normen die hierbij belangrijk zijn.

In de vorige blogs beschreef ik hoe je met de good practices van de cultureel erfgoedsector – data publiekelijk delen en collectiedata linken – de uitdagingen kan aanpakken om de bereidheid, capaciteit en businesscases voor datadeling binnen CCI's te stimuleren. Een mindset om data standaard te delen (Blog 1) en de waarde van data begrijpen (Blog 2), zijn belangrijke onderdelen voor succesvolle datadeling. Deze derde blog gaat in op een belangrijke uitdaging: de infrastructuur om data te kunnen delen en verwerken en of dit in lijn is met de normen van CCI's.
Uitdaging 3 - Ik kan pas data delen als er een infrastructuur is
Het gebrek aan digitale infrastructuur voor datadeling draagt bij aan de bezwaren en belemmeringen die CCI's ervan weerhouden om data te delen. Zelfs als de hele sector datadeling omarmt, middelen wil investeren en mensen in meerdere organisaties de mogelijkheden van data zien – is er een digitale infrastructuur nodig.
Idealiter zijn er datastandaarden, opslag voor data, juridische kaders om data makkelijk te kunnen delen en de computerkracht om ermee te werken. Hoewel datadeling binnen sectoren vaker voorkomt (zoals de European Data Spaces voor Cultureel Erfgoed en Media), zijn er nog steeds maar weinig digitale infrastructuren voor datadeling en -analyse tussen sectoren.
In de culturele erfgoedsector zien we dat het zinvol is om met bestaande infrastructuren en databases te experimenteren. Door kleinschalig, gericht en vaak lokaal met datadeling te experimenteren, weten we door samenwerkingen beter wat de behoeften voor datadeling zijn, hoe we data willen gebruiken, en hebben we zelfs bepaalde infrastructuren ontwikkeld. Experimenteren bevordert niet alleen de praktijk en zichtbaarheid, maar hierdoor maakt de culturele erfgoedsector ook actief deel uit van de discussie over dataspaces, open source en auteursrecht.
CCI’s kunnen niet wachten tot de perfecte infrastructuur is ontwikkeld en moeten verder kijken dan wat nu mogelijk is. Datadeling kan kostbaar zijn, maar levert waardevolle input voor het dagelijkse werk en de bedrijfsstrategie. Het gebrek aan digitale infrastructuur kan deels worden opgelost door te experimenteren en oefenen.
Uitdaging 4 - Van 'grote data schaadt de samenleving en het milieu' naar 'waardegedreven dataverzameling en -deling'
Er wordt vaak aangenomen dat problemen sneller en beter kunnen worden opgelost met meer data. Er zijn echter belangrijke ethische overwegingen bij onbeperkte datagroei die relevant zijn voor iedereen binnen CCI's, waaronder de cultureel erfgoedsector:
- Van wie verzamel je data en voor welk doel? Zijn er (onvoorziene) gevolgen?
- Wie produceert, verwerkt en analyseert data? Krijgen zij een eerlijke vergoeding? (Zie ‘AI is a Lot of Work’ en ‘The $2 Per Hour Workers Who Made ChatGPT Safer’)
- Wat is de milieu-impact om deze data op te slaan en te verwerken? (Zie ‘The Staggering Ecological Impacts of Computation and the Cloud’)
De culturele erfgoedsector denkt na over hun eigen ethische verantwoordelijkheid bij datadeling en -verzameling. We kunnen of willen niet alle erfgoedcollecties digitaliseren vanwege de benodigde middelen (financieel en ecologisch). (Meta)data zijn niet neutraal en kunnen vooroordelen herhalen of versterken. Meer culturele erfgoedorganisaties doen mee met de groeiende Green ICT-beweging en nemen maatregelen om duurzamer te worden. Hoewel de sector natuurlijk niet als enige moet voldoen aan de privacyregels en ethische richtlijnen, wordt er gewerkt aan een missie-gedreven aanpak voor datagebruik.
Het is belangrijk om de kosten af te wegen tegen de baten bij het werken met data. Veel culturele erfgoedinstellingen ontwikkelen innovatieve manieren om hun impact te meten, waarbij ze kwantitatieve én kwalitatieve data verzamelen (zoals deelnemersaantallen, netwerkgroei, enquêtes en getuigenissen). Met zinvol datagebruik kun je bijvoorbeeld meten of een bibliotheekprogramma of expositie ook écht ondervertegenwoordigde doelgroepen bereikt, en achterhalen welke barrières inclusieve cultuurdeelname nog in de weg staan. De ambitie is om data zo goed mogelijk te benutten zodat de maatschappelijke waarde van cultuur, erfgoed en creativiteit zichtbaar wordt.
Deze blogreeks gaat over vier belangrijke uitdagingen voor datadeling tussen CCI's en laat zien hoe je met good practices van de culturele erfgoedsector vooruitgang kan boeken. Er is geen kant-en-klare oplossing, maar wel de juiste mindset om anders naar data te kijken: waarom verzamel je data, met wie deel je het en hoe gebruik je het om beslissingen te nemen. Of het nu een cultureel erfgoedinstelling is of een andere CCI die workflows ontwikkelt om data te verzamelen. Wees ambitieus, creatief en persoonsgericht als je nadenkt over wat data voor jou kan betekenen.


