C’est quoi des résultats pertinents ?

- 5 juin 2012

La question est évidente dans le cadre des moteurs de recherche, la réponse par contre l’est beaucoup moins ! Beaucoup de clients pensent que la pertinence c’est trop subjectif et donc difficile à expliquer. Ce n’est pas tout à fait vrai et c’est ce que je fais en sorte de leur expliquer. Il y a deux sortes de pertinence : ce que j’appelle la pertinence logique ou naturelle si on veut reprendre le vocabulaire du référencement et la pertinence métier.

La pertinence naturelle c’est la légitimité d’une réponse à ressortir en premier en fonction de la position et de la fréquence des termes recherchés dans le document. Par exemple, un document contenant les termes dans le titre et dans le contenu semblera plus pertinent qu’un document contenant uniquement les termes dans son contenu. C’est globalement vrai mais pas toujours, ce premier calcul dépend du type de contenu indexé. Par exemple, dans le cas de la presse où le titre est souvent un jeu de mots ou une référence culturelle, le titre est peu pertinent (par exemple un article titrant « Des oranges à déguster sans modération » pour un article commentant les résultats obtenus par l’équipe des Pays Bas) mais par contre la multi-occurrence des termes dans le contenu sera à prendre en compte. En e-commerce, on peut supposer que si le titre d’un produit commence par les termes recherchés il sera plus pertinent qu’un titre contenant les termes (par exemple pour la recherche « wii », le produit « wii noire avec 2 manettes » sera plus pertinents que « manette pour console wii »). Les premières questions à se poser concernent donc le type de contenu et la position des termes clés dans ce contenu.

Puis il y a la pertinence métier c’est-à-dire les règles métier qui vont se combiner à la pertinence naturelle. Par exemple dans la presse, il sera préférable de voir en premier les actualités remonter. La date de publication devra donc être prise en compte dans la pertinence pour éviter de noyer les actualités parmi des vieux articles (pertinents en terme d’occurrence mais pas en terme d’actualité). Dans le e-commerce, les articles les mieux notés peuvent être valorisés. Il est également possible dans le cas du e-commerce de combiner à la pertinence naturelle des infos marketing pour par exemple remonter en premier les articles les plus en stock. Il faut donc dans un deuxième temps se demander à pertinence égale quels sont les documents qui doivent être privilégiés dans la remontée des résultats et pourquoi ?

Ces questions vous permettront de lister assez facilement des critères qui permettront de considérablement optimiser la pertinence. Par contre, attention pas tous les moteurs permettent des réglages fins de la pertinence en natif. Certains comme Antidot permettent de configurer très précisément la pertinence et la combinaison des tris alors que d’autres comme Fredhopper ou Endeca ne permettent pas de modifier le calcul de pertinence naturelle mais seulement de combiner/modifier le tri.