Je bevindt je hier:

Metadata

Pixels en samples, de informatie waaruit audiovisuele data is opgebouwd, kunnen we niet ‘lezen’, ze hebben geen directe betekenis. Er is een extra stap nodig om de zogenaamde semantic gap te overbruggen tussen vorm en inhoud en audiovisuele data inhoudelijk, met woorden, te archiveren en doorzoekbaar te maken. Deze extra stap werd traditioneel handmatig gezet, bijvoorbeeld door documentalisten. Recentelijk worden ook steeds meer brokjes inhoudelijke informatie, die op verschillende plaatsen in de productieketen worden opgeslagen, op een gestructureerde manier benut. De laatste jaren zien we ook langzaam aan steeds meer gebruik van automatische technieken als hulpmiddel.

Een computerscherm met selectie van files

      Foto: Sebastiaan ter Burg, CC-BY-2.0

De handmatige en automatische beschrijvingen zijn welbeschouwd ‘representaties’ van data. Ze representeren een bepaalde ‘kijk’ op data. De kijk van een persoon vanuit een bepaalde achtergrond (omroepredacteur, documentalist), een automatisch algoritme gericht op een modaliteit (spraak, beeld), of gericht op een bepaald onderdeel binnen een modaliteit: geluiden, woorden, de spreker of emoties in audio, en gezichten, objecten en acties in beeld. De beschrijvingen zijn gestructureerd vastgelegd in de metadata of apart opgeslagen als specifieke beschrijvingsvorm. Uitdaging daarbij is hoe je het beschrijvingsproces zo efficiënt mogelijk kunt inrichten, terwijl tegelijkertijd de kwantiteit en fijnmazigheid van de beschrijvingen zo groot mogelijk wordt. Bij het gebruik van geautomatiseerde processen spelen vragen rond de kwaliteit van de beschrijvingen en het monitoren ervan een prominente rol. Een zoeksysteem indexeert deze metadata en beschrijvingen om zoeken in audiovisuele content mogelijk te maken (meer hierover bij het kennisthema Toegang).

Metadata maken als het goed is deel uit van een intern en extern netwerk. Ze worden uitgewisseld binnen en tussen organisaties. Afspraken, standaarden en richtlijnen m.b.t. de vorm en inhoud van de metadata zijn dan ook cruciaal. Deze afspraken kunnen worden gemaakt binnen de organisatie, maar ook op nationaal en internationaal niveau.

Ten eerste zijn er beschrijvende metadata die worden gebruikt om de inhoud van het audiovisuele document te beschrijven. Voorbeelden zijn catalogusbeschrijvingen, trefwoorden, gebruikersannotaties, gecontroleerde woordenlijsten en thesauri.

Een tweede groep betreft de administratieve metadata. Deze worden ingezet voor het managen en administreren van collecties. Het gaat hier bijvoorbeeld om rechteninformatie, acquisitie- en conserveringsgegevens. Een steeds belangrijker categorie hierbinnen vormen de zgn. ´preservation metadata´, die de levenscyclus van een digitaal object vastleggen en zo de authenticiteit ervan aantonen, door allerlei dynamische bewerkingen en processen heen. Technische metadata beschrijven technische eigenschappen van het document maar omvatten ook bepaalde systeeminformatie. Voorbeelden: filelocaties, audiovisuele formaten, databaseschema's , compressiegegevens, authenticaties. Metadata worden georganiseerd in modellen. Hun definities liggen vast in metadata-dictionairies.

Thesaurus

Benieuwd met welke thesaurus wij audiovisuele collecties beschrijven? Hier vind je alle informatie over onze Gemeenschappelijke Thesaurus Audiovisuele Archieven (GTAA).

Wil je gebruik maken van de GTAA? Neem contact met ons op via thesaurus@beeldengeluid.nl

Meer over Metadata

Wil je weten in wat voor soort (inter)nationale projecten Beeld en Geluid samenwerkt op het gebied van Metadata, welke experts hierbij betrokken zijn en welke blogs er worden geschreven over Metadata?