Gemeenschappelijke Thesaurus Audiovisuele Archieven
Het Nederlands Instituut voor Beeld & Geluid heeft samen met enkele andere Nederlandse organisaties die audiovisueel cultureel erfgoed beheren de Gemeenschappelijke Thesaurus voor Audiovisuele Archieven (GTAA) ontwikkeld. De GTAA wordt gebruikt voor het doeltreffend karakteriseren van de inhoud van audiovisueel materiaal uit het archief met labels afkomstig uit een gecontroleerde en gestructureerde lijst van termen: een thesaurus.
De thesaurus wordt bij Beeld & Geluid onder andere ingezet in het handmatige beschrijvingsproces, maar ook meer en meer bij automatische annotatietechnieken, zoals sprekerlabeling en termextractie. Met behulp van linked data principes kunnen daarnaast verbanden worden gelegd tussen de eigen collectie en andere databronnen. Telkens fungeert de GTAA hierbij als kapstok en verbindingsmiddel.
Wat is een Thesaurus?
Een thesaurus is een gecontroleerde woordenlijst met onderlinge semantische relaties en verwijzingen tussen de termen, waardoor het zoeken in de catalogus gerichter en eenvoudiger kan plaatsvinden. Deze relaties tussen de termen zijn hiërarchisch of associatief van aard. Ze geven antwoord op vragen als: welke termen worden gebruikt die ruimer of juist specifieker het gewenste onderwerp aanduiden; op welke termen kan ik zoeken die met het onderwerp te maken hebben? Daarnaast wordt met behulp van de thesaurus voorzien in het vraagstuk van synoniemen, quasi-synoniemen, spellingsvarianten en homoniemen.
Wat voor soort Thesaurus is de GTAA?
De GTAA is een 'meer-assige' thesaurus, de termen (concepten) zijn ingedeeld in meerdere categorieën of assen, ook wel concept schema's genoemd. De categorieën van termen die voor het toegankelijk maken van het materiaal gebruikt worden, zijn: Onderwerpen, of wel begrippen (bijv. zwemmen, daklozen, binnenvaartschepen, audiovisuele archieven). Een variant op de as Onderwerpen is in gebruik voor het beschrijven van materiaal op het niveau van shots en geluiden, de as Onderwerpen beeld-geluid. Onderwerpen beeld-geluid bevat naast de begrippen uit de as Onderwerpen toegevoegde concepten voor specifiek beeld (shots en stockshots) en geluid. Voorbeelden: dorpsbeelden, blaffen, begroetingen, gapen, enz. Genres en programmasoorten: deze termen geven een typering of aanduiding van de productie als geheel, ze verwijzen naar de vorm, het genre of het type programma (bijvoorbeeld: korte film, lifestyleprogramma, hoorspel, politieserie). Persoonsnamen, dit zijn eigennamen van personen die als inhoudelijk element in een productie, of als Spreker, Cast-lid of Uitvoerende kunnen voorkomen. Makers, deze as bevat persoonsnamen van makers en medewerkers aan de totstandkoming van audiovisuele producties. Namen, eigennamen van o.a. organisaties, muziekensembles, bevolkingsgroepen, oorlogen, verdragen, feest(dag)en, prijzen, producten, en titels van o.a. tijdschriften, boeken, films, radio- en televisieprogramma's (bijvoorbeeld: KLM, Hindoestanen, Kerstmis, Golfoorlog, De aanslag). Geografische namen, namen van steden, dorpen, provincies, snelwegen, landen, etc. Classificatie, dit is een rubrieksindeling bij de schema's Onderwerpen en Onderwerpen beeld-geluid, die het systematisch zoeken op onderwerpen, ook van shots en quotes, mogelijk maakt.
Wie onderhoudt de GTAA?
Beeld & Geluid beheert de GTAA en is verantwoordelijk voor het regelmatig aanpassen van de thesaurus aan de actualiteit en het beschikbaar maken voor externe partijen. Voor meer informatie over (het gebruik van) de GTAA kun je contact opnemen met de afdeling Metadatabeheer van het Nederlands Instituut voor Beeld & Geluid.
Email: thesaurus@beeldengeluid.nl
Waar kan ik de GTAA vinden?
De GTAA wordt in een OpenSKOS repository opgeslagen en toegankelijk gemaakt. Sinds begin 2022 stelt het Nederlands Instituut voor Beeld & Geluid een gloednieuwe service layer beschikbaar voor de thesaurus.
In de thesaurus service layer maakt Beeld & Geluid meerdere endpoints beschikbaar om met de GTAA te werken. Ook kan een GTAA concept URI worden gebruikt om de bijbehorende data op te vragen in HTML of andere formaten als RDF/XML, JSON-LD of Turtle, etc.
Daarnaast is de GTAA een van de terminologiebronnen die beschikbaar is binnen het Termennetwerk van het Netwerk Digitaal Erfgoed.
Meer informatie over het gebruik van de GTAA vind je op deze pagina:
https://data.beeldengeluid.nl/nl/apis/gtaa
Wat is SKOS?
SKOS omvat de ontwikkeling van specificaties en normen voor het gebruik van kennis-organisatiesystemen (KOS), zoals thesauri, classificatieschema's, onderwerpregelsystemen en taxonomieën in het kader van het Semantic Web.
Welke rechten gelden er voor de GTAA?
Beeld & Geluid stelt de GTAA beschikbaar aan derden onder de Open Database License (OdbL).