De dataset van het Nationaal Museum van Wereldculturen

Het Nationaal Museum van Wereldculturen heeft op zijn website zijn collectie beschikbaar gesteld in LOD-formaat. De dataset bevat de metadata over de objecten in de collectie en de termen in de NMvW-thesaurus. De data is gedownload en opgenomen in de data-omgeving van NDE zodat de data kan worden bevraagd via een SPARQL-endpoint. Daar is ook in detail uitgelegd wat de dataset is en waar deze te verkrijgen is. In deze datastory leggen we uit wat je in de dataset kunt verwachten en wat voor vragen je zou kunnen stellen. Om de onderliggende SPARQL-query te zien en desgewenst aan te passen, kun je klikken op dit symbool:

Wat voor dingen zitten er in het endpoint?

Het endpoint bevat verschillende "dingen". De belangrijkste zijn de objecten in de collectie (ruim 700.000) en de concepten in de thesaurus (ruim 20.000).

Wat voor data is beschikbaar over de objecten in de collectie?

Over een object in de collectie weten we vaak veel. Zo heeft een object vaak een titel, een type (bijvoorbeeld "Hoed"), een datum van creatie, een onderwerp en ... de verwijzing naar een afbeelding. De onderstaande query geeft een overzicht van de verschillende soorten predikaten waarmee informatie over een object in de collectie kan worden opgevraagd. De vijf belangrijkste zijn hierna uitgewerkt.

De titel van het object: dc:title

Bijna alle objecten hebben een titel. Deze kan in het Engels en/of in Nederlands zijn. Het object in de collectie en de titel zijn met elkaar verbonden door middel van het predikaat dc:title. Je kunt filteren op Nederland (ned) of Engelse (eng) titels.

Het type van het object: dc:type en edm:object

Bijna alle objecten hebben een type, bijvoorbeeld "foto" of "hoed". Het object in de collectie en het objecttype zijn met elkaar verbonden door middel van het predikaat dc:type.

Je merkt dat er allerlei termen door elkaar zijn gebruikt. Als je alle foto's wilt hebben, moet je dus eerst ontdekken welke termen er allemaal worden gebruikt.

Dat is niet handig. Eigenlijk wil je in de thesaurus kunnen opzoeken welke soorten foto's er allemaal zijn en op zoek gaan naar alle subcategorieen van "foto".

Daarna kun je op zoek gaan naar alle foto's op basis van de thesaurus.

Het plaats van het object: dct:spatial

Behalve de thesaurus-termen waarmee de types zijn verbonden met de objecten in de collectie, zijn ook de plaatsen via de thesaurus verbonden. Hiervoor is het predicaat "dct:spatial" gebruikt. Alle foto's uit Indonesie zijn bijvoorbeeld te vinden met deze query.

Het onderwerp van het object: dc:subject en edm:isRelatedTo

Behalve de thesaurus-termen waarmee de types zijn verbonden met de objecten in de collectie, zijn ook de onderwerpen via de thesaurus verbonden. Hiervoor zijn de predicaten "dc:subject" en "edm:isRelatedTo" gebruikt.

Een plaatje: edm:isShownBy

Aan het object in de collectie is een foto gekoppeld met het predikaat "edm:isShownBy". Het bevat een pad dat verwijst naar het plaatje op de server van het NMvW.