Je bevindt je hier:

Samen werken aan data: lessen uit de erfgoedsector

Steeds meer organisaties binnen de culturele en creatieve sectoren (CCIs) verzamelen data over hun digitale collecties en publiek, met de ambitie om data-gedreven te werken. Binnen het CCI-thrive project onderzoekt Beeld & Geluid hoe we data kunnen delen en inzetten, zodat de hele sector en de samenleving hiervan profiteren. In deze blogreeks deel ik inspirerende voorbeelden van datadeling binnen de erfgoedsector en hoe CCIs hiervan kunnen leren.

Steeds meer organisaties binnen de culturele en creatieve sectoren (CCIs) verzamelen data over hun digitale collecties en publiek, met de ambitie om data-gedreven te werken. Binnen het CCI-thrive project onderzoekt Beeld & Geluid hoe we data kunnen delen en inzetten, zodat de hele sector en de samenleving hiervan profiteren. In deze blogreeks deel ik inspirerende voorbeelden van datadeling binnen de erfgoedsector en hoe CCIs hiervan kunnen leren.

Grafische afbeelding van digitale cultuur

CC-BY license, Clara Juliano, clarote.net

Waarom is datadeling belangrijk voor CCIs?

Beeld & Geluid doet mee met het CCI Thrive-project, gefinancierd door Creative Europe. Hierin onderzoeken we hoe datadeling tussen verschillende CCI's, waaronder cultureel erfgoed, eruit kan zien en delen we praktische inzichten hoe daardoor de samenwerking in Europa kan verbeteren. Dit project deelt de visie dat datasets waardevoller worden als ze openlijk gedeeld en gepresenteerd worden in een bredere datacontext om nieuwe verbanden te leggen. Ook de Europese Unie en nationale overheden volgen deze visie bij grote investeringen om grootschalige strategieën, infrastructuren en wetgeving voor datadeling te ontwikkelen.

Uit dit project komen interessante resultaten, waaronder een rapport over verschillende digitale oplossingen voor het genereren en analyseren van data en een demonstrator voor gebruiksscenario's van datadeling. Een belangrijk inzicht is daarnaast dat de cultureel erfgoedsector veel goede voorbeelden en good practices van datadeling heeft. Gedeelde terminologieën en verklaringen voor rechtenbeheer zijn sectorbreed ontwikkeld. Zoals in het Europeana Initiatief dat cultureel erfgoeddata in heel Europa verzamelt. Of meer lokaal, thematisch of nationaal zoals het Netwerk Digitaal Erfgoed en de Koloniale Collecties Datahub (Nederland), CultureSampo (Finland) of Gallica (Frankrijk). 

De vraag is: hoe relevant zijn deze projecten voor CCIs? In plaats van datasilo’s per domein te creëren, bedachten mijn collega's en ik scenario’s om data uit film, gaming, uitgevers, nieuwe media, cultureel erfgoed en andere CCI’s samen te voegen. We ontdekten dat de bereidheid om data te delen binnen CCI's erg verschilt en dat inzicht in verschillende zakelijke doelstellingen – vooral bij publieke waarde en commerciële haalbaarheid – een belangrijke rol speelt om infrastructuren voor gedeelde data te ontwikkelen. Ook bleek dat andere CCI's veel kunnen leren van de manier waarop de cultureel erfgoedsector data deelt. Zowel bij technische uitdagingen als bij het bevorderen van een cultuur van datadeling. In deze blogserie komen vier uitdagingen aan bod.

Uitdaging 1: Van "Ik kan deze data niet delen" naar "Waarom delen we dit niet?"

De voorwaarde om data te delen is natuurlijk de beschikbaarheid van – vooral betaalbare, betrouwbare en relevante – data, wat niet vanzelfsprekend is in CCI’s. Verschillende CCI-sectoren hebben andere niveaus van datavaardigheid. Als ze gegevens verzamelen is dat vaak specifiek voor hun sector. Dan moet de gegevenshouder dit soort data ook willen en kunnen delen.

Kijkend naar de culturele erfgoedsector, vooral hoe digitale collecties, catalogi en metadata steeds meer openbaar toegankelijk en verbonden zijn met Linked Open Data, zien we een groeiende mindset dat datadeling de standaard is. Vaak genoemde voordelen zijn een betere gebruikerservaring door de vindbaarheid, ontdekbaarheid en hergebruik van cultureel erfgoed te vergroten. Net als meer mogelijkheden voor grootschalige onderzoeksvragen met gecombineerde datasets. Je kan bijvoorbeeld hier de beschikbare datasets van Beeld & Geluid bekijken. 

Uit ons onderzoek blijkt dat relevante data voor CCIs vaak gaat over:

  • Data over eerdere en toekomstige producties, met nuttige metadata zoals land, genre of doelgroep. Door trends en samenwerkingsmogelijkheden te ontdekken, weten CCI's wat er in andere CCI-sectoren gebeurt en kunnen ze erop inspelen.
  • Data over doelgroepen, hun consumptie en engagement met culturele producten/diensten om 'zwakke signalen' tussen CCI's op te vangen. Dit is vooral belangrijk voor langetermijnbeslissingen over toekomstige investeringen en marketing.
  • Data die gecombineerd kan worden met demografische en arbeidsmarktgegevens om de impact van interventies in CCI-sectoren te tonen. 

Veel van deze data is nu echter verspreid over meerdere CCI-organisaties. 

De bereidheid tot datadeling verschilt zeker per CCI. Soms kampen ze met een gebrek aan middelen, infrastructuur of normen, maar we zien ook terughoudendheid of weerstand tegen datadeling. Dit komt voort uit het idee dat data waardevoller is als deze wordt behouden, omdat data delen de concurrentie ‘te veel’ helpt of weinig oplevert. In CCI-Thrive onderzochten we eerst hoe en waarvoor we data met een 'laag risico' konden delen; openbare, betrouwbare en blijvend relevante data zonder concurrentiegevoelige of gevoelige informatie. Hoewel de vaak door de overheid gefinancierde bedrijfsmodellen van de cultureel erfgoedsector sterk van commercieel gerichte CCI's lijken te verschillen, zou de wijze les moeten zijn dat de waarde en impact (sociaal, economisch, etc.) van data ook toeneemt als deze gekoppeld is aan andere data. Bekijk de indrukwekkende resultaten van de HackaLOD van het Netwerk Digitaal Erfgoed om een idee te krijgen van de mogelijkheden. Hier gebruiken teams cultureel erfgoeddatasets die gekoppeld zijn via linked open data.

In volgende blogs bekijk ik verder hoe datadeling van de cultureel erfgoedsector de bredere CCI's kunnen inspireren om technische uitdagingen en strategieën voor datadeling aan te pakken.