Google réduit sa dépendance aux bases de connaissances tierces
Une mise à jour focalisée sur les entités « Personnes »
La dernière mise à jour du Knowledge Graph de Google, appelée « Killer Whale », a eu un impact majeur sur les entités « Personnes ». Selon Jason Bernard, CEO de Kalicube, aucune mise à jour n’a été aussi importante au cours des 25 dernières années. Cette mise à jour marque également le début d’une réduction de la dépendance de Google aux sources d’informations tierces.
Le Knowledge Graph, utilisé par Google depuis 2012, est composé de six verticales, dont le « Knowledge Vault » qui est au centre de l’article de Jason Bernard. Selon lui, Google met à jour le Knowledge Vault chaque été, avec des objectifs différents à chaque fois. Dans cette dernière mise à jour, Google s’est focalisé sur les entités « Personnes », augmentant leur nombre de manière significative en seulement 4 jours.
Des changements importants ont également été apportés aux « subtitles », qui permettent d’identifier le métier ou le rôle d’une personne. Ces changements suggèrent que Google cherche à mieux classifier ces éléments en utilisant les signaux E-E-A-T. Cette mise à jour a particulièrement bénéficié aux rédacteurs et aux auteurs, dont le nombre d’entités a augmenté de plus de 21%. En revanche, certains « subtitles » ont diminué, tels que « musicien » (-21%), « politicien » (-10%), « personnalité du milieu sportif » (-37%) et « acteur » (-13%).
Avant la mise à jour, 57,1% des entités « Personnes » avaient un « subtitle ». Après la mise à jour, ce pourcentage est tombé à 16,6%. En comparaison, le pourcentage d’entités « Corporation » et « Organisation » avec un « subtitle » est resté stable à 86,1%.
Une partie des données utilisées par Google provient de sources tierces structurées et ayant fait l’objet d’une curation manuelle, telles que IMDB, MusicBrainz, des sites gouvernementaux et des sites sportifs. La diminution du pourcentage de « subtitles » suggère que Google commence à mettre de côté ces sources externes.
Cette évolution s’accompagne également d’une réduction de la dépendance de Google à l’égard de Wikipédia. En juin 2023, Wikipédia fournissait 40,9% des données concernant les entités « Personnes » du Knowledge Vault. En septembre 2023, ce pourcentage est tombé à 12,44%. En revanche, le pourcentage d’entités « Sociétés » dont les données proviennent de Wikipédia est resté stable autour de 13%.
Quels enseignements retenir de cette mise à jour ?
Selon Jason Bernard, il y a trois principaux enseignements à retenir de cette mise à jour du Knowledge Graph.
Tout d’abord, Google accélère le développement du Knowledge Vault en commençant par les entités « Personnes ». Ensuite, Google restructure le Knowledge Vault afin d’améliorer la confiance des utilisateurs et l’application des signaux E-E-A-T. Enfin, Google commence à mettre fin à sa dépendance vis-à-vis de Wikipédia et des sources de données tierces.
La prochaine mise à jour concernera les entités « Corporation »
Jason Bernard est convaincu que la prochaine mise à jour du Knowledge Graph se concentrera sur les entités « Corporation ». Il recommande donc de se baser dès maintenant sur une stratégie organique qui ne dépend pas de Wikipédia, des flux des partenaires ou des graphes internes à Google.