NDE Data Stories - Verrijken en Verbinden

Vervolg tutorial: wat kun je nog meer met SPARQL en hoe visualiseer je resultaten?

In Tutorial 1 hebben we kennis gemaakt met het schrijven van queries vanaf de opbouw tot en met het bevragen van meerdere databases. In deze vervolgtutorial kijken we eerst kort naar hoe we ook data kunnen maken met een SPARQL construct query. Vervolgens kijken we naar verschillende manieren om linked data met SPARQL te manipuleren en visualiseren. Een aantal opgeslagen queries staat op het Triply platform, waarbij een deel van de opmaak vooraf geconfigueerd is.

Data uitbreiden met een SPARQL construct query

Met SPARQL is het mogelijk om naast de select, waarin we een graaf patroon terug vragen, ook een construct query te schrijven om uit een stukje graaf matching ook nieuwe triples te genereren. We maken hier een simpel voorbeeld. We hadden al in de vorige tutorial gezien dat we door een federated query plaatjes konden ophalen uit wikidata van auteurs uit een KB database. Dit doen we nu weer, maar we genereren nu triples die direct vanuit de KB auteur identifier verwijzen naar het plaatje. Als we deze triples toevoegen aan de KB database hoeven we in de toekomst dus niet meer een federated query te doen om de plaatjes te vinden! Merk op dat we nu de response laten zien van de query, dit is de ruwe data die wordt teruggestuurd. Bij een construct query wordt een turtle file teruggegeven, oftewel een .ttl file. Deze kun je downloaden door op de download knop (pijl naar beneden) te drukken onder de query aan de rechterkant.

Visualisatie: charts

In de vorige tutorial hebben we gezien welke vrouwelijke auteurs schreven over dieren in de jaren 80. Dit kwam neer op een tabel met namen, maar het zou natuurlijk ook leuk zijn om statistieken te laten zien waar ze over schreven. Of nog, beter een visualisatie van die statistieken! Laten we de vragen beantwoorden over welke dieren vrouwelijke auteurs in de jaren 80 schreven. We gebruiken hier de zogenaamde bar chart voor, een staaf diagram dat de aantallen met lengte van de staven aanduidt.

Een andere visualisatie die we met de charts functie van YASGUI kunnen doen is de pie chart, het taartdiagram. We geven hier een kort voorbeeld met de top 20 van aantal vertaalde werken in de Short Title Catalogue Netherlands (STCN) (met dank aan Inger Leeman - VU)

Tenslotte kijken we nog naar een lijndiagram waarvoor we ook weer de chart functie gebruiken. Verken ook de customize knop, rechtsboven om de grafieken aan te passen We gebruiken hier een voorbeed uit de datastory over Rijkdommen in Florence. We zien de relatie tussen de grootte van een gezin (x-as) en hun rijkdommen (y-as).

Visualisatie: verdere mogelijkheden

Maar wat als we nou een stukje analyse van getallen willen laten zien? In de YASGUI interface zien we onderaan (de query) ook een knop Pivot table. Met deze functie kunnen draaitabellen maken en die ook visualiseren. We gebruiken hier een voorbeed uit de demo datastory over maritieme bronnen. We vragen de items op die worden verscheept en tellen hoeveel er van locaties naar elkaar worden verscheept.

Het is ook mogelijk om geodata, zoals locaties, die we ophalen met SPARQL direct te plotten op een kaartje. We maken nogmaals gebruik van de datastory maritieme bronnen. We kijken naar bemanningsleden en hun beroepen volgens de HISCO dataset.

Yasgui van Triply heeft sindskort ook een nieuwe functie genaamd timeline. Hiermee kunnen we bijvoorbeeld verschillende plaatjes op een tijdlijn tonen. We geven een simpel voorbeeld op basis van plaatjes uit de dataset van geheugen van Nederland (GVN)

Tot slot

We hopen dat jullie nu de mogelijkheid voor toevoegen van links aan je eigen data met de construct query kunnen toepassen en de basisvaardigheden voor visualiseren en presenteren van data onder de knie hebben. Er staan nog veel datastories online die dieper gaan dan deze tutorial, probeer vooral veel te leren van deze voorbeelden. Veel plezier tijdens HackaLOD!