Het Nationaal Museum van Wereldculturen heeft op zijn website zijn collectie beschikbaar gesteld in LOD-formaat. De dataset bevat de metadata over de objecten in de collectie en de termen in de NMvW-thesaurus. De data is gedownload en opgenomen in de data-omgeving van NDE zodat de data kan worden bevraagd via een SPARQL-endpoint. Daar is ook in detail uitgelegd wat de dataset is en waar deze te verkrijgen is. In deze datastory leggen we uit wat je in de dataset kunt verwachten en wat voor vragen je zou kunnen stellen. Om de onderliggende SPARQL-query te zien en desgewenst aan te passen, kun je klikken op dit symbool:
Het endpoint bevat verschillende "dingen". De belangrijkste zijn de objecten in de collectie (ruim 700.000) en de concepten in de thesaurus (ruim 20.000).
Over een object in de collectie weten we vaak veel. Zo heeft een object vaak een titel, een type (bijvoorbeeld "Hoed"), een datum van creatie, een onderwerp en ... de verwijzing naar een afbeelding. De onderstaande query geeft een overzicht van de verschillende soorten predikaten waarmee informatie over een object in de collectie kan worden opgevraagd. De vijf belangrijkste zijn hierna uitgewerkt.
Bijna alle objecten hebben een titel. Deze kan in het Engels en/of in Nederlands zijn. Het object in de collectie en de titel zijn met elkaar verbonden door middel van het predikaat dc:title. Je kunt filteren op Nederland (ned) of Engelse (eng) titels.
Bijna alle objecten hebben een type, bijvoorbeeld "foto" of "hoed". Het object in de collectie en het objecttype zijn met elkaar verbonden door middel van het predikaat dc:type.
Je merkt dat er allerlei termen door elkaar zijn gebruikt. Als je alle foto's wilt hebben, moet je dus eerst ontdekken welke termen er allemaal worden gebruikt.
Dat is niet handig. Eigenlijk wil je in de thesaurus kunnen opzoeken welke soorten foto's er allemaal zijn en op zoek gaan naar alle subcategorieen van "foto".
Daarna kun je op zoek gaan naar alle foto's op basis van de thesaurus.
Behalve de thesaurus-termen waarmee de types zijn verbonden met de objecten in de collectie, zijn ook de plaatsen via de thesaurus verbonden. Hiervoor is het predicaat "dct:spatial" gebruikt. Alle foto's uit Indonesie zijn bijvoorbeeld te vinden met deze query.
Behalve de thesaurus-termen waarmee de types zijn verbonden met de objecten in de collectie, zijn ook de onderwerpen via de thesaurus verbonden. Hiervoor zijn de predicaten "dc:subject" en "edm:isRelatedTo" gebruikt.
Aan het object in de collectie is een foto gekoppeld met het predikaat "edm:isShownBy". Het bevat een pad dat verwijst naar het plaatje op de server van het NMvW.