Du référentiel à l’ontologie
Lors d’un précédent billet nous avons examiné les différents types de référentiels et la façon dont ils étaient exploités par les moteurs de recherche. Dans la continuité de notre tour d’horizon, nous allons maintenant aborder le lien entre référentiels et ontologies.
Comme nous l’avons vu, les référentiels servent à organiser du vocabulaire, c’est-à-dire des mots qui représentent eux-mêmes des personnes, des objets, des choses …
Et c’est là que le bât blesse : les concepts décrits par ces mots sont sous entendus. Ce que décrivent les mots n’est pas explicité et c’est au lecteur de le déduire.
Exemple :
Si je vous dis « De Gaulle, Mitterrand, Chirac, Sarkozy » … vous répondez Président de la République.
Si je dis « Cresson, Fillon, Villepin, Jospin » … vous répondez Premier Ministre.
Et pour « Laguiller, Bayrou, Accoyer, Strauss-Kahn », vous pensez personne-politique.
Dans un beau référentiel de type « taxonomie », ou système de classement, nous aurions pu ranger tout ça de la façon suivante :
Personnages politiques
+ Président
| De Gaulle
| Mitterrand
| …
+ Premier ministre
| Jospin
| Fillon
| …
+ Autre
| Accoyer
| Strauss Kahn
| …
Cette taxonomie semble efficace et permet de ranger, classer et organiser les hommes politiques français. Mais si on regarde bien, cette solution a des limites.
La hiérarchie semble décrire une spécialisation, allant du plus générique au plus spécifique :
• Président est une sorte de d’Homme Politique,
• Premier Ministre est une sorte d’Homme Politique.
Mais De Gaulle est une sorte de Président, ça ne va pas. Car « De Gaulle est un Président » et non pas « une sorte de ». On dirait en employant un vocabulaire plus technique et informatique que « Président est une sous classe d’Homme Politique » alors que « De Gaulle est une instance de Président ». Et ça n’est pas pareil. On constate donc que notre taxonomie mélange en fait les niveaux logiques : elle mixe les concepts et les objets.
On a également des cas plus complexes : Chirac fut Premier Ministre et Président. Faut-il dupliquer l’entrée et le mettre dans les deux branches de la taxonomie ? Mais comment être sûr qu’il s’agit de la même personne ?
Et bien une ontologie ça sert à résoudre tous ces petits problèmes en permettant de modéliser les types d’objets et la façon dont ils interagissent.
On peut ainsi définir une classe « Homme Politique« , puis des classes « Président » et « Premier Ministre » comme sous classes de « Homme Politique« . On peut aussi préciser des règles qui décrivent des interactions entre les classes. Exemple : « un Premier Ministre est nommé par le Président« .
Voilà, une ontologie, ça sert à ça : à décrire des aspects du monde (la politique, les médicaments, les voitures, …) en modélisant les choses qui constituent le monde. Tout cela permet aux machines de manipuler ces concepts et de faire des opérations très poussées. On parle alors de raisonnement. Ainsi supposons que nous soumettions à une machine la phrase « Nicolas Sarkozy vient de nommer François Fillon au poste de premier Ministre« , celle-ci serait capable de déduire automatiquement que Nicolas Sarkozy est Président et François Fillon Premier Ministre. Elle pourrait également en déduire que ces deux personnalités sont des Hommes Politiques.
Et les référentiels dans tout ça ? Et bien nos référentiels contiennent des mots qui permettent de nommer les concepts et les objets eux-mêmes. Les mots permettent de faire le lien entre l’homme et la machine. Les mots sont des étiquettes posées sur les objets pour les identifier. Et lorsqu’une ontologie contient tout le vocabulaire nécessaire à ce qu’elle décrit et manipule , on parle de référentiel onto-terminologique.
Dans un prochain billet, nous verrons comment ces ontologies peuvent être exploitées par les moteurs de recherche.
Note pour les puristes : oui la modélisation indiquée ici est simpliste. Il faudrait séparer la modélisation des personnes et de leur fonction, et introduire les modes d’accès à la fonction et la dimension temporelle.
1 thoughts on “Du référentiel à l’ontologie”