Datasetregister - inzicht in erfgoeddatasets



Bij HackaLODs uit voorgaande jaren werd er steeds een mooie collectie datasets samengesteld en gepubliceerd op een webpagina. Dit jaar is de aanpak iets gewijzigd: we maken gebruik van het NDE Datasetregister. Via dit register zijn datasets te vinden die erfgoedinstellingen zelf publiceren. De datasetbeschrijvingen worden geharvest en samengebracht in een openbare triplestore. Het doel van het datasetregister is om de vindbaarheid van datasets (API's en bestanden/dumps) te vergroten.

Ben je op zoek naar een dataset, ga dan naar de triplestore van het Datasetregister en doorzoek de datasetbeschrijvingen via SPARQL. Op Requirements voor Datasets kun je lezen hoe een datasetbeschrijving (inclusief bovenliggende catalogus en onderliggende distributies) is opgebouwd.

Bedenk dat het resultaat van een query veelal een URI van een dataset is bij een erfgoedinstelling. Ben je bijvoorbeeld op zoek naar Linked Data (het datasetregister bevat ook "niet-Linked" Data), dan is één van de resultaten de URI https://data.spinque.com/ld/data/netwerkoorlogsbronnen/muziek_som/. Je kunt deze datasetbeschrijving veelal openen in je browser om de gehele datasetbeschrijving bij de bron te bekijken. In dit geval zal dat je ook leiden naar een bestand van 3MB aan N-triples.

SPARQL'n maar!

Wil je meer weten over Linked Data en SPARQL-queries, bekijk dan de tutorials. Deze tutorials zijn gemaakt om de beginnende gebruiker van SPARQL-queries op weg te helpen of als referentie om kennis op te frissen.

Om je op weg te helpen geven we je hier enkele voorbeeld SPARQL-queries. Klik bij hierbij op de blauwe pijl-omhoog om de betreffende SPARQL-query te tonen. Je kunt deze ook aanpassen en opnieuw uitvoeren!

NB: De onderstaande informatie is work-in-progress! Nog niet alle verwijzing zullen correct zijn, laat ons weten via tech@netwerkdigitaalerfgoed.nl als je fouten tegenkomt. In dat geval gaan we ons best doen om het bij de bron te laten aanpassen!


Welke Linked Dataset zijn als datadumps beschikbaar?

De onderstaande tabel geeft een overzicht van alle datasets die in een Linked Data format te downloaden zijn:

Welke Linked Dataset zijn via een SPARQL-endpoint bevraagbaar?

De onderstaande tabel geeft een overzicht van alle datasets die via een SPARQL endpoint bevraagbaar zijn:

Wanneer zijn de dataset beschrijvingen van de Linked Dataset voor het laatst succesvol opgehaald?

De onderstaande tabel geeft wat een algemene informatie over de beschikbare Linked Datasets inclusief de laatste keer dat de datasetbeschrijving succesvol opgehaald is:

Welke erfgoedinstellingen bieden hoeveel datasets?

Het volgende overzicht laat zien welke organisaties datasets (API/datadumps) beschikbaar stellen (in de rol van publisher):

Waar zijn de erfgoedinstellingen gevestigd?

De onderstaande kaart toont de vestigingsplaatsen van de erfgoedinstellingen(in de rol van creator of publisher):


Welke datasets worden er geboden?

Het volgende overzicht laat de titels zien van de beschikbare datasets:


Onder welke licentie worden de datasets beschikbaar gesteld?

Voor hergebruik van data zijn open licentievormen van belang, maar ook "gesloten" datasets (vanwege auteursrecht of privacy) kunnen opgenomen worden in het Datasetregister:


Hoe staat het met het aanbod van linked data?

Het volgende overzicht laat zien in welke linked data distributievormen de datasets beschikbaar worden gemaakt:


Welke musea bieden linked data?

Het volgende overzicht laat de linked data datasets zien van musea:


Welke data bevatten informatie uit bevolkingsregisters?

Het volgende overzicht laat datasets zien die als keyword (*) "bevolkingsregister" hebben:

(*) Het veld keyword wordt aangeraden om op te nemen, echter veel datasets hebben nog geen keywords.


Tevreden met het Datasetregister?

Dit is de eerste keer dat het NDE Datasetregister op deze wijze wordt ingezet. Het doel van het datasetregister is om datasets die beschikbaar zijn bij erfgoedinstellingen beter vindbaar te maken. Slagen we daar al in? Heb je als gebruiker vragen op opmerkingen, we horen het graag via Discord. Gebruik deze uitnodigingslink om je aan te melden Heb je je al eerder aangemeld? Log dan meteen in op het discord-kanaal van de HackaLOD.


Een dataset leveren als erfgoedinstelling?

Heb jij een interessante dataset die al ter beschikking is of die je ter beschikking zou willen stellen voor hergebruik, bijvoorbeeld tijdens de Hackalod? Zorg dan dat er een datasetbeschrijving online staat! Idealiter produceert je collectiebeheersysteem dit, maar de datasetbeschrijving kan ook handmatig gemaakt worden via een formulier. De resulterende datasetbeschrijving in JSON/LD moet daarna nog wel online beschikbaar gemaakt worden (en aangemeld worde). Als dit niet via de website van de organisatie kan, kan het wellicht via Github (let wel op dat je dan het adres opgeeft van de Raw versie).

Is je dataset al online beschikbaar én online beschreven, geef dan de URL van deze datasetbeschrijving op in het Datasetregister zodat je dataset vindbaar wordt.

Heb je hulp nodig bij de datasetbeschrijving, het online plaatsen en/of het aanmelden? Neem contact op met Bob Coret(bob.coret@netwerkdigitaalerfgoed.nl).