db2triples : une implémentation de R2RML et DirectMapping en Open Source
Antidot apporte sa contribution au développement du Web de Données en ouvrant son implémentation des recommandations R2RML et DirectMapping du W3C.
Antidot est impliqué depuis de nombreuses années dans la mise en œuvre opérationnelle des recommandations et standards publiés par le W3C comme RDF, OWL, SKOS ou SPARQL. Ne se cantonnant pas à une approche purement académique, et fort de sa position sur le marché des solutions d’accès à l’information, Antidot a été l’un des premiers éditeurs de logiciels à confronter ces nouveaux outils du Web Sémantique aux besoins et contraintes de grands projets industriels.
Ainsi les dernières versions des solutions logicielles Antidot Information Factory et Antidot Finder Suite ont été parmi les tout premiers logiciels à intégrer nativement ces technologies, pour répondre aux problématiques concrètes de gestion de l’information en entreprise, et aux enjeux stratégiques qui les sous-tendent : réutilisation et urbanisation des données, création de données métier.
Antidot travaille depuis longtemps sur les enjeux de la valorisation des bases de données relationnelles, et en particulier de leur transformation en données sémantiques. C’est donc tout naturellement que nos équipes Recherche & Développement se sont penchées sur les recommandations R2RML et Direct Mapping [1] du W3C en cours de finalisation. Ces technologies apportent en effet une réponse normative à la problématique de la transformation de données relationnelles en graphes RDF pour le chargement automatique d’entrepôts.
Afin de confronter ces recommandations à la réalité opérationnelle de projets clients, Antidot a développé une implémentation à jour des dernières propositions de R2RML et DirectMapping. Et afin de faire bénéficier les communautés informatiques et académiques de nos avancées, nous avons décidé de publier ce composant logiciel en Open Source sous licence LGPL.
Appelée db2triples, cette implémentation en Java, qui s’adapte rapidement à toutes les plateformes. est disponible dès à présent sur la forge Github : http://github.com/antidot/db2triples
db2triples permet d’atteindre les trois buts fixés par le W3C :
- intégrer les données provenant des bases SQL dans le Web de données (Linked Data)
- donner la possibilité de les manipuler avec des langages standardisés tels que SPARQL
- et enfin les regrouper avec d’autres types de données : référentiels, bases de connaissances…
La puissance de cet outil transparaît lors de l’utilisation de données provenant de bases complexes, où il permet rapidement et facilement de trouver les liens entre les données éparpillées dans de multiples tables, et de les enrichir grâce à la puissance de SPARQL 1.1 : nous avons réalisé de nombreux projets de recherche et d’accès à l’information par simple paramétrage en SPARQL de cet outil, en particulier des indexations génériques de plateformes CMS basées sur WordPress et de sites e-commerce reposant sur la solution Magento.
Antidot a toujours baigné dans le monde de l’Open Source, et nous sommes heureux d’offrir à notre tour db2triples. Chacun peut immédiatement le mettre en pratique, et le modifier à sa guise, par exemple pour exposer immédiatement ses données selon les standards du Web de Données – Linked Data, ou tout simplement les voir sous un autre angle ! En effet, ce composant s’avère particulièrement intéressant dans le cadre de projet Open Data afin de permettre la publication de données vivantes, plutôt que la mise en ligne de fichiers Excel ou PDF dont la réutilisation automatique est complexe, voire impossible.
[1] Références : W3C Working Drafts (24 March 2011)
- R2RML – RDB to RDF Mapping Language :
http://www.w3.org/TR/2011/WD-r2rml-20110324/ - A Direct Mapping of Relational Data to RDF :
http://www.w3.org/TR/2011/WD-rdb-direct-mapping-20110324/
Bonjour
cette application permet-elle aussi de mettre à jour la base originelle (ou le CMS) via SPARQL UPDATE ?
Bonjour,
La mise à jour de la base via SPARQL UPDATE n’est pas disponible dans db2triples. Ce projet s’inscrit pour le moment seulement dans une logique de conversion des données relationnelles en RDF.
Le travail inverse, c’est-à dire la conversion d’une requête SPARQL en SQL, est une question difficile que nous étudions.