Qu’est-ce que le Knowledge Graph de Google et comment fonctionne-t-il ?
En français, on l'appelle graphe de connaissance, mais beaucoup le connaissent par son terme anglais original : aujourd'hui, nous allons nous concentrer sur le Knowledge Graph de Google, c'est-à-dire la boîte de données qui apparaît pour certaines requêtes sur le moteur de recherche et qui représente une sorte de gigantesque encyclopédie virtuelle de faits.
Qu’est-ce que le Knowledge Graph de Google ?
Selon Google, le Knowledge Graph est une collection d'informations provenant d'une ou plusieurs pages, affichées avec une présentation visuelle similaire à celle des résultats enrichis les plus récents (au point qu'il peut être difficile de distinguer d'un coup d'œil un résultat enrichi d'une boîte d'information, admet Big G). Les résultats du Knowledge Graph peuvent inclure des entités identifiées par un logo, un nom de site préféré, un lien de profil social, et peuvent potentiellement importer des données en utilisant n'importe quel élément de schema.org.
Selon les dernières estimations fournies par Mountain View, le système - qui comprend des faits et des informations sur les entités provenant de documents partagés sur le Web, ainsi que de bases de données libres et sous licence - a accumulé plus de 500 milliards de faits sur près de cinq milliards d'entités.
Comment fonctionne le Knowledge Graph
Il s'agit d'une fonction de recherche sémantique qui, dès le départ, visait à fournir aux utilisateurs des réponses précises et complètes, en anticipant les contenus classiques proposés dans les SERP par les ressources Web. Le système a été lancé par Google en mai 2012 au niveau américain, tandis que sur Google.fr il n'est arrivé que vers la fin de la même année. Durant cette période, il a considérablement augmenté sa diffusion, se révélant utile (et utilisé) surtout pour les recherches mobiles, au point que les informations de Knowlegde Graph sont utilisées pour les recherches vocales et les réponses directes par Google Assistant et Google Home.
Différences graphiques entre les États-Unis et la France
Aux États-Unis, l'évolution a été encore plus importante que ce que l'on peut voir sur Google.fr, à tel point que le Knowledge Graph de Google est utilisé à la fois comme système pour améliorer la pertinence des recherches Google et pour fournir des réponses précises aux questions directes des utilisateurs, comme on peut le voir avec les exemples de la page. L'onglet sur Napoléon, par exemple, présente également les principales citations, celui sur Google ajoute les recherches connexes, celui sur l'homme le plus riche du monde ne génère pas de graphique en français (mais seulement un extrait riche, avec en plus une photo ambiguë !), et celui sur le "meilleur joueur de la NBA" renvoie au classement officiel de la ligue professionnelle américaine.
L'utilité du Knowledge Graph
L'utilité du Knowledge Graph est très simple : le moteur de recherche de Google est capable d'associer un objet à des requêtes, et de mettre en relation plusieurs objets de manière logique et sémantique afin d'offrir à l'utilisateur une recherche plus rapide et plus précise. Le résultat est un encadré qui résume les principales informations sur le sujet de la requête, accélérant ainsi la recherche de l'utilisateur et satisfaisant l'intention de recherche avant la consultation classique des SERPs et des sites. La boîte d'information apparaît sur le côté droit de la page de résultats, avec des données sur l'entité recherchée et toute information supplémentaire en fonction du type de requête tapée.
Quelles sont les requêtes qui génèrent le graphique ?
Dans la liste des identités qui peuvent générer un Knowledge Graph en réponse, on trouve des requêtes générales sur des personnes célèbres de l'histoire, des personnalités influentes du présent, des lieux, des choses, des sociétés, des entreprises, des marques, des villes, des équipes sportives, des produits, des recettes, des livres, etc., mais aussi des requêtes plus spécifiques introduites par des pronoms interrogatifs ou des adverbes.
Un système interconnecté et intelligent
Ce qui est étonnant, c'est la capacité du système à relier les résultats entre eux et à comprendre précisément ce que l'utilisateur veut dire, en éliminant ou en réduisant les éventuels malentendus ou ambiguïtés dans la recherche, sur la base de l'expérience et de la consultation des données antérieures dans la mémoire des requêtes effectuées par tous les utilisateurs.
Un graphique d’informations et de relations
En pratique, il s'agit de l'application de l'intelligence artificielle pour la construction d'un réseau de relations entre toutes les identités différentes et possibles. Depuis le début, le graphe de Google vise à classer les informations disponibles sur le Web selon un critère de relations. Il est important de noter que ce sont les entités elles-mêmes qui sont en mesure de communiquer à Google les informations qu'elles jugent les plus importantes, en utilisant les données structurées et le balisage de Schema.org, qui est une méthode permettant d'aider Googlebot à mieux comprendre le contenu du site et, également pour cette raison, des signaux SEO importants pour le classement.
Les ressources utilisées pour le Knowledge Graph de Google
Il n'est pas toujours évident de savoir quel critère Google utilise pour inclure ou non une entité dans son graphique, mais les ressources utilisées pour composer les Knowledge Graphs sont certaines ; la première que nous venons de mentionner, à savoir le balisage Schema.org à remplir pour la page d'accueil en insérant toutes les informations que l'on juge pertinentes pour l'organisation, la personnalité ou l'activité locale.
Un autre élément commun est la confiance que Google accorde à Wikipédia, dont il reprend à la fois les descriptions sommaires et les adresses des sites officiels (lorsqu'elles ne sont pas communiquées directement) : avoir une entrée dans l'encyclopédie en ligne est donc fondamental pour acquérir la confiance, tout comme la base de données Wikidata est également appréciée.
L'importance de la gestion des réseaux sociaux
Les autres outils à exploiter pour offrir à Google des informations fiables (et tenter de s'imposer en tant qu'entité) sont les profils sociaux et, pour les entreprises, le profil Google My Business : dans le premier cas, le fait d'avoir des comptes identifiés et vérifiés est une méthode pour être reconnu par Google (même s'il ne trouve pas le site officiel), tandis que le système gratuit avec le profil d'entreprise est évidemment une voie privilégiée pour les informations à graver.
Les modifications qui peuvent être suggérées au Knowledge Graph
Chaque entité peut revendiquer sa propre boîte d'information et peut, éventuellement, demander des modifications à Google. La première étape consiste à obtenir la reconnaissance en tant que représentant officiel (généralement en accédant à un profil vérifié ou au site officiel via Google), puis à utiliser l'option "Suggérer une modification" dans la boîte elle-même dans la SERP. Il est toutefois bon de savoir que les modifications ne sont acceptées que sur trois aspects, à savoir l'image vedette, les profils sociaux et les statistiques spécifiques à diverses catégories d'entités (durée d'un film ou date d'anniversaire d'une personne, par exemple), et que, dans tous les cas, les modifications proposées sont soumises à un processus d'examen visant à confirmer leur véracité et à exclure les contenus inappropriés.
Éléments qui ne peuvent pas être modifiés
En revanche, les modifications apportées à d'autres parties de l'encadré informatif, notamment le sous-titre utilisé, l'extrait Wikipédia, la section Recherches connexes, ne sont même pas prises en considération, et il n'est pas possible de demander l'inclusion d'images autres que l'image principale. En outre, les orientations de Google précisent qu'"il n'est pas possible de modifier l'ordre ou de masquer le contenu s'il est correct et relève du domaine public".