Je bevindt je hier:

Linken met Wikidata: Deel 1 - Wat is Linked Data?

Linked Data is al jaren een hype, ook binnen erfgoedland. Er worden pagina’s vol geschreven in beleidsdocumenten over het linken van data van erfgoedinstellingen. Tegelijkertijd ontbreekt het vaak nog aan laagdrempelige, praktische toepassingen. In een serie blogposts lees je de komende weken meer over wat Linked Data is en nemen we je mee in een pilotproject waarmee Beeld & Geluid haar thesaurus (de Gemeenschappelijke Thesaurus Audiovisuele Archieven, GTAA) linkt met Wikidata. Vandaag deel 1: Wat is Linked Data?

Linked Data is al jaren een hype, ook binnen erfgoedland. Er worden pagina’s vol geschreven in beleidsdocumenten over het linken van data van erfgoedinstellingen. Tegelijkertijd ontbreekt het vaak nog aan laagdrempelige, praktische toepassingen. In een serie blogposts lees je de komende weken meer over wat Linked Data is en nemen we je mee in een pilotproject waarmee Beeld & Geluid haar thesaurus (de Gemeenschappelijke Thesaurus Audiovisuele Archieven, GTAA) linkt met Wikidata. Vandaag deel 1: Wat is Linked Data?

In deze serie blogposts worden vragen beantwoord als: hoe word je als cultureel erfgoed instelling onderdeel van dat gelinkte web? En hoe maak je op een slimme manier gebruik van de informatie die op het internet beschikbaar is? 

Linked Data?

Van meet af aan is het internet bedacht als één groot web van informatie met onderlinge relaties tussen de stukken informatie. De hyperlink is daar het duidelijkste voorbeeld van. Die links worden over het algemeen gemaakt door mensen. Als er behalve hyperlinks, ook nog bepaalde structuur aan informatie wordt gegeven, wordt het ook mogelijk voor applicaties die deze gestructureerde data kunnen lezen om informatie uit te wisselen. Hierdoor kunnen allerlei dwarsverbanden, statistieken en visualisaties op basis van deze data worden gegenereerd. Ook kan data uit verschillende bronnen eenvoudiger met elkaar verbonden worden.

Voor erfgoedinstellingen is Linked Data dé manier om zich te verbinden aan andere informatiebronnen en collecties van derden. Daarmee worden collecties niet alleen beter vindbaar, maar wordt ook waardevolle contextinformatie toegevoegd. Daarom heeft linked data ook de volle aandacht van het werkpakket Bruikbaar in het Netwerk Digitaal Erfgoed.

Bij Beeld & Geluid is de thesaurus een logisch aanknopingspunt voor het linken van data. De GTAA bevat een lijst van termen waarmee catalogus beschrijvingen uniform worden geschreven. De GTAA dient als tussenlaag om onze collectiecatalogus te verbinden aan externe bronnen.

Op weg naar Linked Data

Hoe kun je als erfgoedinstelling onderdeel worden van het Linked Data netwerk? Dat kan al door de eerste stappen van het vijf-sterren model van Tim Berners Lee te doorlopen. Tim-Berners Lee, de oprichter van het World Wide Web bedacht in 2010 deze vijf sterren om een waardering te kunnen geven voor hoe ‘open’ en ‘linked’ data op het internet is (Bron: http://5stardata.info/en/).

  • 1 ster: data staat onder een open licentie online. Daarvoor is het noodzakelijk dat je zelf rechthebbende van deze (meta)data bent, of toestemming hebt van de rechthebbende. Voorbeeld: een museum maakt de keuze om geen auteursrecht te claimen over haar catalogus data door een CC-0 licentie te hanteren.

  • 2 sterren: data is gestructureerd online gepubliceerd. Voorbeeld: een excel sheet van collectie metadata is online beschikbaar.

  • 3 sterren: de gestructureerde data staat online in een ‘open’ format, d.w.z. dat het door meerdere programma’s geopend kan worden dan alleen het programma waarin het is gemaakt. Voorbeeld: een .csv bestand, dat zowel door Excel als andere spreadsheet-programma’s geopend kan worden.

  • 4 sterren: de gestructureerde data voldoet aan de open standaarden van W3C, het World Wide Web Consortium. Dit betekent onder meer dat de data door middel van een ‘persistent identifier’ (een zgn. URI) altijd op dezelfde plek beschikbaar is. Voorbeeld: Een DBpedia URI.

  • 5 sterren: de gouden standaard. Aan al het bovenstaande is voldaan, met bovendien het maken van links naar andere data om context te creëren. Denk hierbij aan linken naar Wikidata of Geonames.

Richting een gelinkte thesaurus

Per instelling en per deelcollectie zal de mate van Linked Data beschikbaarstelling verschillen. Beeld & Geluid heeft bijvoorbeeld haar thesaurus online gepubliceerd in de SKOS-structuur én elk stukje data is altijd via dezelfde link (URI) te benaderen. Bijvoorbeeld: http://data.beeldengeluid.nl/gtaa/95024 verwijst altijd naar André van Duin. Daarmee voldoet de GTAA aan vier sterren. Momenteel proberen we de thesaurus te verbinden aan de externe database Wikidata, maar ook aan andere thesauri. Zo maken we stappen richting de ‘gouden standaard’ van vijf sterren.

In de volgende linked data blogs lees je waarom we kiezen voor Wikidata, hoe we koppelingen met Wikidata realiseren én wat mogelijke gebruiksscenario's zijn met deze gekoppelde informatie. 

  • Wil je meehelpen bij het linken van de GTAA met Wikidata? Het is heel eenvoudig, hier lees je meer.

  • Meer leren over Linked Data? Er zijn uitgebreide Online Leeromgevingen over Linked Data. Bijvoorbeeld de cursus Linked Data Engineering van OpenHPI.

  • De GTAA wordt ook gebruikt door diverse andere instellingen in Nederland. De verrijkingen van de GTAA met Wikidata komen op termijn ook voor die gebruikers beschikbaar. Ben je als collectiehouder geïnteresseerd in het gebruiken van de GTAA als thesaurus? Neem dan contact met ons op! Stuur een e-mail naar: thesaurus@beeldengeluid.nl