You are here:

Europees Parlement doorgelicht

Begin dit jaar is Talk of Europe - Travelling CLARIN Campus (ToE) van start gegaan, een project waar het Nederlands Instituut voor Beeld en Geluid, de Erasmus Universiteit Rotterdam, DANS en de Vrije Universiteit Amsterdam samen aan werken. Talk of Europe maakt de notulen van de debatten in het Europese Parlement beschikbaar voor wetenschappelijke analyse en combineert ze met andere datasets.

Het project, dat tot eind 2015 loopt, bouwt voort op PoliMedia, een CLARIN-NL-project van dezelfde partners dat in mei 2013 werd afgerond. PoliMedia is een online zoekmachine waarin de notulen van de Tweede Kamer zijn gekoppeld aan de ANP-radiobulletins en het krantenarchief van de Koninklijke Bibliotheek. De datasets werden omgezet naar Linked Data, een datavorm die het mogelijk maakt verschillende datasets onderling te verbinden. Zo kan onderzocht worden hoe verschillende media berichten over politieke debatten. Je kunt bijvoorbeeld meten welk debat het meest in de kranten is besproken of welke politicus het meest aan het woord is in een bepaald debat.

Europarl gelinkt

In Talk of Europe zal Europarl, het corpus met notulen van de debatten in het Europees Parlement, worden omgezet naar het Linked Dataformaat. Deze dataset is beschikbaar in 21 verschillende talen, wat het mogelijk maakt de notulen te verbinden met andere datasets in deze talen. “Onderzoekers zullen deze Linked Dataset kunnen downloaden bij DANS en gebruiken voor hun eigen toepassingen”, aldus Max Kemman, als onderzoeker aan de Erasmus Universiteit betrokken bij het project.

Geesteswetenschappers zullen met de meertalige Europarl-notulen, gelinkt aan andere datasets, onderzoeksvragen kunnen stellen die voorheen moeilijk te beantwoorden waren. Doet de Poolse media bijvoorbeeld anders verslag van eenzelfde debat als de Nederlandse pers? En hoe zijn de onderwerpen van de nationale debatten gerelateerd aan de onderwerpen van de debatten in het Europees Parlement? Het ToE-team zal onderzoeken hoe de Linked Dataset het best bruikbaar wordt voor geesteswetenschappers bij het beantwoorden van hun onderzoeksvragen.

Creative camps en de CLARIN Campus

Gedurende het project zullen er drie creative camps georganiseerd worden op verschillende locaties in Europa. “Tijdens deze CLARIN Campus zal de ontwikkelde dataset worden gebruikt als uitgangspunt voor nieuwe tools”, aldus Kemman. Internationale teams van ontwikkelaars werken tijdens een CLARIN Campus gedurende een week samen aan de ontwikkeling van toepassingen waarmee wetenschappers Linked Datasets kunnen analyseren. “De eerste Campus zal in oktober plaatsvinden bij het Nederlands Instituut voor Beeld en Geluid”, vertelt Kemman. “De andere twee zullen in 2015 plaatsvinden in andere CLARIN-landen.”

Naast gastheer voor de eerste Campus is het Nederlands Instituut voor Beeld en Geluid ook actief betrokken bij de ontwikkeling van toepassingen voor de Linked Dataset met Europese debatten. Zo beschikt de instelling over televisie-uitzendingen over Europese debatten die aan de Europarl-dataset verbonden kunnen worden.

Meer info

ToE is een initiatief van CLARIN-NL en CLARIN ERIC, mogelijk gemaakt met financiële ondersteuning van NWO en OCW.