Is collectiedocumentatie tegenwoordig nog belangrijk?
Bron: www.factminers.org
Over nut en noodzaak van documentatie van collecties wordt veel gediscussieerd binnen het Comité International pour la Documentation (CIDOC), een afdeling binnen het International Council of Museums (ICOM). Dat klinkt saai en traditioneel, maar documentatie is volgens CIDOC nog altijd de basis van elk modern museum (of in elk geval net zo belangrijk als conservering, educatie of presentatie).
Zonder documentatie kunnen we objecten namelijk niet duiden of plaatsen, is de waarde (en daarmee het benodigde beheer) onbekend en is educatief gebruik niet mogelijk. En juist in deze tijd van snelle digitale ontwikkelingen is documentatie erg belangrijk zullen we zien. Musea zouden verder meer oog moeten hebben voor duurzame ontsluiting in plaats van bezoekersaantallen. Op de lange termijn levert dit meer op.
Steeds meer geldt het principe dat alles wat niet online te vinden is ‘niet bestaat’. Technologie verandert snel, uiteraard ook in de erfgoedsector. Nieuwe technologieën komen en gaan, en we vragen ons vaak af of we wel bij zijn en bij welke we zullen ‘instappen’. We moeten echter stoppen ons daarover zorgen te maken, leert CIDOC, en gewoon verder gaan met het beheren en documenteren van onze collecties. Zolang we dit systematisch en consequent blijven doen, zal de informatie die we genereren altijd nuttig en bruikbaar blijven.
Anderzijds hebben de huidige ontwikkelingen wel laten zien dat alleen netjes ontsluiten niet genoeg is voor digitaal gebruik. Rijke beschrijvingen en relaties met andere bronnen zijn ook nodig, om te kunnen contextualiseren en een verhaal op te bouwen. De huidige bezoeker kan wellicht verleid worden met allerlei technische innovaties, maar uiteindelijk moeten we toch uitgaan van de kracht en inspiratie van het erfgoed zelf.
Metadata
Hoe belangrijk is dan metadata? Er zijn vaak wel voldoende gegevens aanwezig voor het voldoen aan actuele datamodellen als basis van uitwisseling maar de werkelijke meerwaarde zit hem in rijke, goed gestructureerde en gestandaardiseerde metadata. Door jarenlange goed opgebouwde documentatie kan er vrijwel altijd een goede mapping gemaakt worden (naar bijv. het Europeana Data Model). Ook linken aan andere (externe) bronnen als Linked Data en verrijkingen zoals vertalingen zijn dan veel makkelijker uit te voeren, bijvoorbeeld door gebruik te maken van authority files.
Een reden terughoudend te zijn met het openstellen van metadata van de eigen collectie of thesaurus kan de vermeende rol van autoriteit zijn die men denkt te moeten zijn. Er kan inderdaad ook best wel wat ‘rommel’ omhoog komen als spelfouten en inconsequent gebruik. Door open te stellen en te koppelen komen dingen nu eenmaal aan het licht. Andere instellingen hanteren echter juíst bewust het beleid om open te gooien en met hulp van publiek of collega's fouten op te sporen of accepteren eenvoudigweg de momentele matige kwaliteit. Beter iets dan niets!
CIDOC-CRM
CIDOC houdt zich bezig met allerlei aspecten van documentatie, zoals ook de technische discussie rond de datamodellen CIDOC-CRM (CIDOC Conceptual Reference Model)[1] en LIDO (Lightweight Information Describing Objects; een XML schema bedoeld voor uitwisseling)[2]. Beiden zijn nog in ontwikkeling (en zullen dit nog wel even blijven), maar worden toch ook al succesvol in de praktijk toegepast. Zo zijn er al verschillende implementaties van LIDO, o.a. in de MINT mapping tool en in de Europeana Inside connection kit[3].
Beide datamodellen zijn event gebaseerd en hiermee waardevoller voor publiekstoepassingen dan objectgerichte metadata. Hiermee wordt bedoeld dat door een beschrijving vanuit de gebeurtenis een object weer een historische plaats krijgt in plaats van slechts als artefact (bij musea) op zichzelf te staan.
Afgelopen jaar is het paper "The synergy reference model of data provison and aggregation" verschenen waarin uitgelegd wordt dat door gebruik te maken van terminologiebronnen metadata cyclisch verbeterd kan worden en collecties en gepubliceerd kan worden als Linked Open Data. Er is bij CIDOC CRM reeds een samenwerking aangegaan met de IFLA (International Federation of Library Associations and Institutions)[4] wat betreft het FRBR datamodel (Functional Requirements for Bibliographic Records). Juist vanuit het event gebaseerde model is erfgoedbrede samenwerking mogelijk (en wenselijk!).
Belang van contextualisering
In event gebaseerde datamodellen is contextuele data dus erg belangrijk. Veel van wat er vastgelegd wordt over museumobjecten is al contextueel: mensen, plaatsen, gebeurtenissen en concepten (wie, wat, waar en wanneer) die worden geassocieerd met de objecten. Dit gebeurd zowel elders als in de eigen organisatie. Vaak weten de eigen experts de eigen objecten echter het beste te duiden. Deze informatie wordt vaak vastgelegd in thesauri. Indien een instelling zelf bepaalde expertise heeft kunnen thesaurustermen in Linked Open Data erkend worden als 'authority files'.
Goede contextualisering kan intern door het linken van de objecten aan de authority files. Het linken aan externe thesauri vergt iets meer moeite, waarbij het gaat om de technieken en concepten van Linked Open Data.
Een aantal issues komt naar voren. software leveranciers zouden binnen hun systemen moeten zorgen voor verwijzingen van de interne vocabulaire van erfgoedinstellingen naar gezaghebbende externe bronnen, opdat concepten gekoppeld zijn aan breed gedeelde thesauri als de Art and Architecture Thesaurus (AAT) van het Getty Research Institute. Vaak zijn echter de eigen thesauri of woordenlijsten niet correct en consequent gebruikt wat betreft spelling en betekenis, en bevat hiaten of duplicaten.
CIDOC conferentie 2014
In Dresden werd afgelopen september de jaarlijkse CIDOC conferentie gehouden met als onderwerp Access and Understanding – Networking in the Digital Era. De discussies en de papers op de conferentie gingen daarom voornamelijk over de rol van documentatie in de digitale toegang tot museumcollecties en cultureel erfgoed. Een greep uit de sprekers:
Richard Light (museumconsulent, VK) over het ‘historical framework’: CIDOC-CRM is goed op weg om historische informatie te kunnen uitdrukken als reeks van gebeurtenissen. Twee andere ontwikkelingen zijn hierin nodig: frameworks van URL’s voor standaard informatie (zoals personen en plaatsen) moeten worden gebruikt; en museumdata moet worden uitgedrukt in termen van deze gedeelde frameworks.
Volgens Jeff Malliet (Erfgoedplus.be) moet voor erfgoedobjecten voldaan worden aan bepaalde kwaliteitseisen om te komen tot een nuttige Linked Data omgeving. Hoewel al jarenlang onderzoek is gedaan naar kwaliteit van informatie is het nog onduidelijk wat het betekent voor het semantische web. Verder wordt erfgoed metadata normaliter gecreëerd voor collectiebeheer doeleinden en niet voor het delen of voor publicatie, laat staan voor linken. Er is veel verwarring over waar in de informatieketen de vereiste kwaliteit kan of moet worden gemaakt en door wie.[5]
De meeste issues kunnen niet opgelost worden door techniek alleen; techniek is nodig maar precisie komt van menselijk werk. Zoals iedereen weet vergroot betere kwaliteit van metadata hergebruik en duurzaamheid en dat is meer werk dan je verwacht, maar kwaliteit heeft verder geen nieuwe vereisten want standaarden bestaan al reeds jaren.
Murtha Baca (Getty Foundation, VS) hield een lezing over het belang van meertalige terminologieën en de AAT (Art & Architecture Thesaurus). Er was véél aandacht voor de AAT op de conferentie, zoals diverse werkgroepen. De gebruikelijke digitalisering van bibliotheek, archivering en museumcollecties voorziet niet in een gemakkelijke toegang tot (of beter begrip van) de objecten. Er zijn belangrijke technische, culturele en vooral taalbarrières die moeten worden overwonnen.
Lees verder
Alle verdere conference papers van de CIDOC conferentie zijn te vinden op:
http://network.icom.museum/cidoc/archives/past-conferences/2014-dresden