DIKW, la pyramide qui inspire le futur des moteurs de recherche

Le secret de la pyramide, ce n'est pas un film mais l'idée qui guide l'objectif de la recherche en ligne.

Cela a été révélé par le responsable de la recherche chez Google, dans cette vidéo. A la base il y a la pyramide DIKW, Data, Information, Knowledge et Wisdom, en français: Données, Information, Connaissance, Intelligence.

Elle exprime un objectif qui sera accompli en franchissant un nouveau pas après le graphe de connaissance. Celui-ci qui présente des fiches sur le coté droit de la page de résultats, consiste à former le lien entre un mot-clé et l'objet qu'il représente.
Le pas suivant c'est en quelque sorte que l'internaute devienne lui aussi un objet pour le moteur, que le moteur le connaîsse assez bien pour savoir quelle réponse exactement il doit lui présenter. Il faut que le moteur ait assez de données sur le contexte dans lequel se trouve l'internaute pour pouvoir donner des réponses pertinentes.

Le but de la pyramide est de formaliser la façon dont se structure la pensée pour passer des données factuelles à la capacité de les utiliser au mieux. L'intelligence artificielle fait usage de cette sorte de formalisme pour représenter et utiliser la connaissance, et les moteurs de recherche tendent à faire de même dans le but de rendre le site plus intelligent. On se rapproche pas à pas d'un avenir ou l'on pourra consulter un Dr Know pour avoir la réponse à toute question, comme dans le film A.I. de Spielberg.

DIKW et moteur de recherche

La pyramide montre comment on passe des données telles qu'elle peuvent être acquises jusqu'à l'intelligence qui est la capacité de les utiliser parfaitement.

  1. Tout commence par la collecte des données.
  2. Les données deviennent des informations dès lors qu'on interagit avec elles, qu'on les traite. Pour une recherche en ligne, quand elle sont présentées dans les résultats en réponse aux requêtes.
  3. Les informations deviennent des connaissances quand on les met en relation et qu'on forme un tout. C'est ce que fait le graphe de connaissances.
  4. Les connaissances deviennent intelligence quand on sait s'en servir pour prendre les bonnes décisions.

Une autre interprétation paraît bien plus simple, mais elle est aussi complémentaire:

  1. Quand on ajoute un contexte au données, cela devient des informations (c'est ici qu'intervient la connaissance de l'internaute par le moteur, le minimum utile étant la requête qu'il fait, mais on veut en savoir plus).
  2. Quand on ajoute une signification aux informations (qu'on envisage leur effet ou qu'on les associe au connu antérieur) cela devient des connaissances.
  3. Quand on ajoute de la sagacité à la connaissance, cela devient l'intelligence.

On peut aussi décrire en cinq phases le traitement des données selon les opérations que réalise celui qui les traite.

  1. Données. Ce sont des faits.
  2. Informations. La description nous dit quoi. C'est une première interaction avec les données.
  3. Connaissance. La conversion en instructions ou processus nous dit le comment.
  4. Compréhension. L'explication nous dit le pourquoi.
  5. Intelligence. L'évaluation prospective (l'étude des conséquences) nous dit ce qu'il convient le mieux de faire.

Donc le traitement va dans le passé pour rechercher les données et dans le futur pour prendre les décisions. Et c'est un processus cyclique en perpétuel recommencement.

Encore une autre interprétation en fonction des activités intellectuelles:

  1. Les données sont le résultat de mesures ou d'enregistrements, textuels ou multimedia.
  2. L'analyse en fait des informations.
  3. La confrontation avec l'expérience augmente la connaissance.
  4. Le jugement fournit l'intelligence.

En quoi cela concerne-t-il les moteurs de recherche? Avec le graphe de connaissance, ils sont parvenus au niveau trois, ils détiennent une connaissance qu'ils peuvent délivrer aux internautes. L'étape suivante consiste à fournir l'intelligence, donc leur indiquer les bonnes décisions. A devenir eux-mêmes intelligents.

On peut comprendre le développement qui suivent les moteurs pour y parvenir avec une description finale plus adaptée:

  1. Données: collecte des éléments pour établir l'index du moteur.
  2. Etablir des connexions entre les données: cela devient une information délivrable aux utilisateurs, que l'on présente dans les SERPs.
  3. Former des ensembles significatifs: c'est le graphe de connaissances.
  4. Faire le lien entre ces objets: c'est l'intelligence que l'on envisage.

Ainsi on a une idée du futur proche des moteurs de recherche: ils seront capables de relier les objets entre eux et d'anticiper pour répondre à des questions complexes.