Web sémantique & E-Commerce – Enjeux
Face à la multiplication des acteurs et à l’accroissement du marché du E-Commerce, l’enjeu est clair pour les sites marchands : gagner en visibilité. Les solutions pour y parvenir sont connues :
- améliorer le référencement
- partager et valoriser son catalogue auprès d’un écosystème de partenaires (revendeurs, comparateurs de prix, places de marché).
En plus des techniques traditionnelles (Référencement naturel et API Web) émergent, aujourd’hui, des solutions normalisées (RDFa, Good Relations, Linked Data) issues des travaux menées depuis plus de 10 ans au sein du W3C sur le Web sémantique. Resté longtemps l’apanage des laboratoires de recherche, le Web sémantique est une réalité industrielle implémentée par des grands acteurs du Web tels que Facebook, Yahoo! ou Google, de même que des acteurs du E-Commerce tels que BestBuy, O’Reilly ou overstock.com. Ces initiatives ouvrent une nouvelle ère dans le domaine de la valorisation, du traitement et de la recherche des données du E-Commerce avec l’objectif d’améliorer l’expérience des utilisateurs.
L’essentiel de ce billet reprend les idées exposées dans la présentation « Web sémantique et E-Commerce » disponible sur Slideshare et donnée à l’occasion du salon du E-Commerce à Paris
Le catalogue de produits est la richesse du eCommerçant et le site Web en est la matérialisation, la vitrine « virtuelle » pour les utilisateurs. C’est pourquoi sa maintenance, son enrichissement et sa valorisation sont des facteurs clé de succès pour les sites marchands. La complexité de cette tâche est à la hauteur de l’enjeu et ce travail peut s’avérer rapidement fastidieux et lourd tant pour améliorer la visibilité des produits sur les moteurs de recherche grand public, les techniques dit de référencement naturel étant de plus en plus complexes à maintenir avec l’augmentation de la concurrence, que pour exposer les données du catalogue auprès des partenaires qui présentent chacun des particularités en l’absence de normalisation ou pour l’agrégation de données hétérogènes provenant des différents fournisseurs.
Face à ces difficultés, les technologies du Web sémantique proposent aujourd’hui des solutions.
Telle la tour de Babel, chaque site propose sa solution pour exposer
les données du E-Commerce
Qu’est-ce-que le Web sémantique ou le Web de données ?
Créé il y a plus de 20 ans, le Web constitue un cadre d’interopérabilité pour mettre à disposition, partager et lier des documents sur un réseau de machines connectées. Pour ce faire, il s’appuie sur un ensemble de briques technologiques qui va du langage de communication (HTTP) au langage de structuration d’une page Web (HTML). La force du Web réside dans un consensus né de la normalisation de ces briques ce qui assure l’interopérabilité. Dans le même état d’esprit, le W3C, l’organisme de normalisation du Web, et de nombreux laboratoires de recherche travaillent depuis plus de 10 ans à l’élaboration avec la même architecture technologique d’un cadre d’interopérabilité pour mettre à disposition, partager et lier des données structurées. Alors que les documents étaient à destination des humains, cette nouvelle étape dans l’histoire du Web a vocation à améliorer le traitement des informations et des données par les machines dans un contexte de réseau décentralisé.
S’appuyant sur l’architecture du Web (protocole HTTP, principe d’identification avec des URL), le Web sémantique propose lui-même un ensemble de briques technologiques (RDF, OWL/RDFS, SKOS, SPARQL).
Exposer la richesse de son catalogue dans les pages Web
A la différence d’un humain, une machine n’est pas en capacité de comprendre les différentes informations d’une fiche de caractéristique produit publiée sur une page Web. En particulier, les moteurs de recherche n’identifient pas directement le sens des différentes données et ne savent pas faire de différences entre l’intitulé du produit, sa marque, sa description ou encore son prix. En effet, le but poursuivi par HTML n’est pas d’encoder le sens des informations, mais la structure de la page Web en vue de sa lecture par un humain. A l’inverse, le modèle RDF poursuit précisément cet objectif. Afin de réconcilier les deux au sein d’une page Web, le W3C a mis au point une syntaxe, le RDFa, pour ajouter des assertions/triplets RDF dans le code HTML. Cette syntaxe se présente sous la forme d’attributs invisibles pour l’utilisateur, mais que la machine sera en capacité d’analyser.
Mais, si le W3C a normalisé le modèle (RDF) et la syntaxe (RDFa), c’est-à-dire la manière d’introduire du RDF dans le HTML, en revanche il ne s’occupe pas de normaliser tous les vocabulaires pour tous les domaines. Or, pour assurer toutes les conditions d’interopérabilité, il est nécessaire, comme pour les humains, d’utiliser le même vocabulaire. Dans le domaine du E-Commerce, le RDFa devient peu à peu un enjeu pour améliorer le référencement. Yahoo!, tout d’abord, avec le programme SearchMonkey, Google avec les Google Rich Snippets et, enfin, Facebook avec l’Open Graph Protocol ont annoncé le support de RDFa pour améliorer le rendu des résultats de la recherche ou des recommandations de leurs utilisateurs. Dans ce cadre, ils proposaient tous les deux des vocabulaires spécifiques. De manière parallèle, un chercheur allemand, Martin Hepp, a mis au point et initié la promotion d’un autre vocabulaire beaucoup plus complet, Good Relations.
L’annonce de l’arrêt de SearchMonkey suite à la décision de Yahoo! d’arrêter ces activités « Moteur de recherche » au profit de celui de Microsoft, Bing, et l’annonce récente par Google du support de Good Relations le propulsent comme le vocabulaire de référence pour décrire des produits. Même si le programme Google Rich Snippet n’est actuellement pas disponible dans sa partie « Produits » sur les déclinaisons européennes du moteur de recherche, Google a d’ors et déjà annoncé que ses équipes y travaillaient. Lorsqu’on voit un groupe comme BestBuy qui annonce une augmentation de 30% de son trafic suite à l’implémentation de RDFa et Good relations dans ses pages, on ne peut qu’inviter les sites marchands français à préparer l’avenir et à s’y mettre dès maintenant.
Exemple de Google Rich Snippet avec RDFa et Good Relations
Maintenant que nous avons exposé les enjeux et le contexte industriel, nous verrons dans le prochain billet comment concrètement ajouter du RDFa dans une page Web, ainsi que l’apport des solutions Antidot dans ce domaine.
En projetant l’apport du web sémantique au eCommerce on peut également le voire sous bien d’autres aspects que ce soit du point de vue consommateur en stockant tout les achats effectués chez les différents eCommerçant, pouvoir avoir une vision en terme de répartition de budget, de durée validité de garantie, de trouver des produits compatibles ou correspondant à un besoin spécifique, de connaître précisément les spécifications et les composants de ces produits, de pouvoir trouver un produit chez un commerçant ouvert à côté de chez soit.
Ou en terme de relation consommateur / producteur en permettant aux consommateurs d’ajouter des données que ce soit des spécifications,des utilisations dérivés des produits (hacking ou utilisation dans un domaine spécifique), de donner son avis ou ses recommandations d’évolution, de contribuer à la visibilité et à la commercialisation d’un produit, et donc de permettre à chacun d’ajouter de la valeur.
Et un jour on peut penser qu’on estimera la valeur ajouté d’un produit au nombre de données qui lui seront liés.