11 mars 2020

Qwant et ses concurrents

Vous avez probablement entendu parler de Qwant (l'entreprise, ses produits, ses succès et ses difficultés).

Nous allons dans cet article essayer de faire le tour des différents avantages et inconvénients de Qwant et de ses concurrents afin de mieux vous aider à faire votre choix parmi la multitude de moteurs de recherche existants.

  1. Qwant, souveraineté numérique et enjeux éthiques
  2. Qwant et ses concurrents
  3. Difficultés de l'entreprise
  4. Qwanturank

1. Qwant, souveraineté numérique et enjeux éthiques

Un moteur de recherche représente aujourd'hui l'accès à internet tel qu'une grande partie de la population se l'imagine : un portail qui contient la réponse aux questions que l'on se pose, qui permet de communiquer, qui permet de gérer ses comptes, bref, un internet devenu (presque) indispensable.

Le moteur de recherche est très souvent la porte permettant à l'humain d'accéder à Internet, et a donc le contrôle sur les résultats affichés à l'internaute. Il peut dès lors censurer et/ou favoriser les résultats qu'il souhaite, comme c'est déjà la cas dans certains pays.

Nous pouvons donc assez aisément comprendre l'importance d'un moteur de recherche : un pays peut voir, pour diverses raisons, ses citoyens coupés d'accès à x ou y moteur de recherche. (Non, ce n'est pas de la fiction, en cas de guerre diplomatique un pays peut couper l'accès à certains services d'une entreprise proche d'un gouvernement).

L'internaute a également tout intérêt à choisir un moteur de recherche qui ne l'enfermera pas dans sa bulle de filtre et qui sera respectueux de sa vie privée.

Dans un état non dictatorial, un service doit, pour fonctionner de manière durable, être apprécié par l'utilisateur et être rentable. Dans le cas d'un moteur de recherche, il est d'autant plus difficile de relever le challenge en étant respectueux de la vie privée. Pour plaire à l'utilisateur il faut lui afficher des résultats qui lui seront pertinants, et c'est une tâche complexe à effectuer sans collecter ses données (et donc sans lui afficher des résultats personnalisés).

Cet article donne quelques pistes sur les plans de Qwant pour répondre à cette problématique.

2. Qwant et ses concurrents

Nous pouvons catégoriser les outils communément appelés "moteurs de recherche" en 3 groupes :

a) Les moteurs de recherche

Nous parlons ici des moteurs de recherche "classiques", utilisés par une très large majorité de la population mondiale. Ce sont des vrais moteurs de recherche, ne dépendant pas d'autres moteurs pour fonctionner.

Ces moteurs peuvent être catégorisés en deux différentes parties :

  • Dans la première se trouvent ceux imposant une censure importante à leurs utilisateurs, c'est notamment le cas de Baidu (Chinois) et Yandex (Russe), tous deux contrôlés par le gouvernement de leur pays. La vie privée n'existe pas lors de l'utilisation de ces moteurs. Les résultats ne sont pas forcément les plus pertinents mais étant donné la censure de concurrents (que ce soit en Chine lorsque le pays interdit les moteurs de recherche qui ne censurent pas assez les résultats ou en Russie, qui prévoit carrément de créer un "internet" souverain, dont les acteurs seraient probablement ceux acceptant la censure du gouvernement).
  • Le seconde partie concerne les navigateurs les plus utilisés dans les pays occidentaux (Yahoo!, Bing, Google etc). Ils sont souvent à l'image de Google qui a supprimé la partie vie privée du triptyque vie privée / rentabilité / appréciation de l'utilisation pour favoriser les deux autres, ce qui a un effet boule de neige : l'utilisateur est satisfait de Google, il continue de l'utiliser et donc de lui donner de l'argent, ce qui permettra à Google de payer des personnes qui amélioreront les algorithmes qui amélioreront la pertinence des résultats montrés à l'utilisateur.

b) Les méta-moteurs

Ces derniers ne sont ni plus ni moins que des interfaces qui récupèrent les résultats d'autres moteurs de recherche. Pour pallier leur manque de nouveautés par rapport aux vrais moteurs, ils disent vouloir aider des causes parfois sociétales, souvent environnementales.

Ils effectuent des recherches sur de très nombreux moteurs de recherche et "une requête sur un moteur de recherche c'est, "une ampoule basse consommation allumée pendant 1 heure”. Ils doivent également partager leurs revenus avec leur régie publicitaire (souvent Bing Ads - comme c'est le cas pour Lilo ou Ecosia). Les revenus reversés aux associations sont donc assez faibles et il paraît peu probable que ces derniers puissent, de quelque manière que ce soit, compenser les émissions liées aux multiples requêtes effectuées.

Ce sont en réalité les différentes causes que ces moteurs prétendent défendre qui, offrant à l'internaute la possibilité de faire une bonne action, font le "succès" de ces méta-moteurs.

Ces méta-moteurs sont totalement dépendant des moteurs qui leur fournissent les résultats de leurs recherches. Bien que ce soit peu probable (car les régies publicitaires utilisées par les méta-moteurs de recherche sont souvent desdits "vrais" moteurs, comme c'est le cas pour Bing et Yahoo) mais possible (crise diplomatique), ils n'auront que leurs yeux pour pleurer si l'accès aux résultats leur est coupé. (plus vraisemblablement ils iraient chez les concurrents)

Ces pseudos-moteurs prétendent également protéger votre vie privée. Ironique car pour présenter des résultats à votre requête ils effectuent cette même requête sur une multitude d'autres moteurs de recherche, l'exposant donc à bien plus d'acteurs qui ne font clairement pas de la vie privée une de leurs priorités. Ils font en réalité ce que chaque utilisateur peut faire en suivant quelques tutos, à savoir cacher votre adresse IP (et quelques informations supplémentaires) et bloquer les traqueurs.

Nous pouvons nous demander quel est l'intérêt d'utiliser un méta-moteur de recherche qui est totalement dépendant des outils qu'il souhaite concurrencer, qui pollue énormément alors qu'il se veut écologique, et qui dit respecter la vie privée de l'internaute alors qu'il n'en est rien.

c) Les moteurs hybrides

Ce sont des moteurs de recherche disposant de leur(s) propre(s) crawler(s) et algorithme(s) de tri des résultats, mais qui s'appuient quand même sur les résultats d'autres moteurs de recherche pour compléter leurs résultats.
Ce modèle peut-être un modèle sur le long terme :
on peut être conscient qu'indexer tout le web, du moins une bonne partie, a un coût énorme (temporellement et économiquement) et vouloir continuer d'avoir des crawlers ne parcourant que le web le plus recherché afin d'être indépendant dans une majorité des cas, tout en complétant les résultats visant des recherches particulères par les résultats d'autres moteurs de recherche. Il semblerait que ce soit le cas de Duckduckgo, qui existe depuis longtemps (fondé en 2008) et ne semble pas vouloir s'affranchir des autres moteurs de recherche, dans le but de proposer de meilleurs résultats à l'utilisateur.

Ce modèle peut également être une étape pour devenir un moteur de recherche indépendant : Au début on s'appuie sur les résultats d'un ou plusieurs moteurs de recherche puis on diminue cette part de résultats pour la remplacer progressivement par les résultats de nos crawlers.

Et Qwant dans tout ça ?

Ben ... c'est compliqué.
Il a été, avant 2013, un méta-moteur de recherche. Fin 2018, Qwant détaillait la part que Bing occupait dans les résultats affichés à l'utilisateur : "En réalité, Qwant utilise Bing pour compléter les résultats de recherche sur lesquels nous n’avons pas une pertinence suffisante, et sur les images où les capacités de stockage sont très importantes. `[...]` La bascule vers l’indépendance totale se fait donc progressivement, et c’est bel et bien la direction prise par Qwant, difficile à voir d’un œil extérieur !"
(Lien de l'article)

Il semblerait néammoins qu'aujourd'hui cette indépendance soit loin d'être atteinte.

On classerait donc plutôt Qwant dans la catégorie des moteurs hybrides (n'en déplaise à Éric Léandri, alors président de Qwant, qui reprochait à Duckduckgo de ne pas être un vrai moteur de recherche) cherchant à se débarasser de toute dépendance dès que possible.

3. Difficultés de l'entreprise

Le moteur de recherche d'une "nouvelle" entreprise à peu de chance de percer. Contrairement aux moteurs existants, il ne dispose ni d'expérience dans le domaine, ni d'un budget conséquent, ni d'une réputation acquise précédemment auprès des internautes.

Ils peuvent, dans un premier temps, s'appuyer sur les résultats de moteurs existants (comme le font les méta-moteurs de recherche) pour pouvoir se concentrer sur la partie interface, communication ou encore récolte de fonds.

Ce choix doit être assumé au risque de voir un ou des scandales éclater. C'est ce qui s'est passé pour Qwant.

Mediapart a, entre autres, pointé du doigt les dépendances de Qwant vis-à-vis de Microsoft, mais l'attaque aussi sur sa communication et les scandales passés liés à son ex-président, Éric Léandri. (résumé)
Nextimpact a aussi relevé plusieurs problèmes liés aux résultats de Qwant.
Il a ensuite écrit un article sur ses relations tumultueuses avec Qwant et son ex-président.
Il semblerait cependant que Nextimpact omette plusieurs détails importants, notamment le fait qu' "en septembre 2019, que NextInpact s’est vu promettre 90 000 € de don par Qwant. Le média n’en a pas informé ses lecteurs, mais il ne l’a pas fait non plus quand 20 000 € sont arrivés en avril 2018, puis 30 000 € plus tard. Par souci de transparence, cette information aurait dû être communiquée à ces moments-là, au pire au début de la salve d’articles contre Qwant. Car, en l’état (et même si ce ne serait pas le cas), cette série d’articles à charge peut désormais être perçue comme une vengeance, alors que 40 000 € du don promis ne sont pas arrivés."

Nextimpact avait aussi essayé de mettre en avant l'affaire juridique entre Qwant et l'annuaire français, mais l'acbm a montré les limites des accusation de ce dernier contre Qwant.

Si vous souhaitez en savoir plus sur ce "drama" pour vous forger votre propre opinion, nous ne pouvons que vous encourager à effectuer vos propres recherches (ce n'est pas le but de cet article, même s'il est normal d'en parler). Suite à ces scandales et aux "mauvais" résultats financiers de Qwant, Éric Landri, PDG de Qwant, a quitté la présidence de Qwant.

4. Qwanturank

Le 2 décembre 2019 Qwant lança un concours de SEO (ensemble des méthoses pour référencer un site web sur les moteurs de recherche) : Qwanturank
Le but pour les participants ? Référencer le mieux possible leur site (qui doit être créé après l'annonce du concours) pour qu'il apparaisse dans les premiers résultats de la recherche "qwanturank" sur Qwant le 3 juin 2020.

Pour ce faire, les différents participants devront utiliser différentes techniques et essayer de découvrir le fonctionnement de l'algorithme de Qwant, celui-ci n'étant pas public.

De nombreuses personnes se sont interrogées sur l'intérêt pour Qwant d'organiser ce concours. Nous ne pouvons que recommander l'excellent article d'Abondance, la conclusion de ce dernier est que l'avantage pour Qwant est double : Rénover son image (surtout après les scandales évoqués dans le 3.) et comprendre les mécanismes de spamdexing.
La première raison, évidente, est de tenter de répondre aux différentes accusations qui insinueraient que Qwant ne disposerait pas de de son propre algorithme de tri et afficherait des résultats tirés du moteur de recherche Bing.
Concernant le 2ème point, Qwant le reconnaît dès les premières lignes présentant son concours : "Qwant testera grâce à ce concours la robustesse de ses méthodes anti-spam et améliorera encore la pertinence de ses résultats."
Qwant n'indique nul part que ce concours a pour but de tester son crawler, Qwantify.

Par ailleurs le site que j'ai créé pour participer à ce concours, https://fasturfu.fr, a été référencé chez Qwant alors que je n'avais ni créé de contenu et qu'il n'avait aucun lien externe. Les sites candidats au concours sont donc automatiquement soumis, lors de leur inscription, aux algorithmes de Qwant.
Certes, comme le souligne l'article précédemment cité, ce concours ne prouve pas que Qwant dispose de ses propres algorithmes de tri; mais dans ce cas ce concours ne servirait au final qu'à améliorer la confiance que portent les gens au moteur de recherche et à donner une image plus positive de Qwant à la communauté de développeurs. Étant donné les prix en jeu, cela paraît dur à croire.

Assez ironique de ma part de critiquer les méta-moteurs de recherche et d'en créer un pourrait-on penser (à raison ou à tort, chacun se fera son avis).
Il y a quand même quelques différences entre un méta-moteur de recherche quelconque et Qwanturank, que nous allons lister ci-dessous :

  • Premièrement ce moteur est créé dans le but de participer à un concours de Qwant qui doit lui permettre de s'améliorer.

  • Ensuite Fasturfu n'effectue ses recherches qu'auprès de Qwant et de Duckduckgo (et non pas 8 moteurs de recherche et un annuaire comme Startpage), il n'est donc pas - loin de là - le plus polluant. Nous ne pratiquons pas de greenwashing. 
  • Qwanturank est le seul méta-moteur de recherche qui récupère ses résultats uniquement chez des moteurs de recherche (certes hybrides) respectueux de la privée, alors que tous les autres qui se veulent respectueux de la vie privée vont chercher leurs résultats directement chez Bing (dans le meilleur de cas; parfois les recherches sont également partagées à Yahoo, Goole & co pour avoir des résultats).

Conclusion

Certes Qwant dépend fortement de Microsoft, que ce soit au niveau des serveurs, de la régie publicitaire ou encore des résultats présentés à l'internaute. Certains voudraient le voir se débarasser de tous ces liens.

Mais est-ce réalisable ? Le moteur Qwant est récent, du moins à l'échelle d'internet. Il a très rapidement grandi et propose maintenant une multitude de services (Qwant, Qwant Junior, Qwant Music, Qwant Maps, Masq ...)

Beaucoup lui reprochent d'avoir voulu faire trop. Devenir indépendant de Microsoft signifierait devoir créer une régie publicitaire (ce qui n'est pas une mince affaire), louer des serveurs (chez des services pas forcément plus éthique que Microsoft ou n'ayant pas les même capacités que ce dernier) et crawler le web prend du temps/coûte cher.

En attendant d'être indépendant, il est tout à fait compréhensible que Qwant souhaite offrir des résultats de recherche potables à ses utilisateurs.

[partant du principe qu'un utilisateur essaie de faire un choix éthique (avec sa propre définition)]
Chacun est libre de faire son choix, il est légitime de préférer utiliser un moteur de recherche classique et se protéger de ce dernier (même si ce n'est pas une mince affaire), mais il est encore plus beau de croire en un futur meilleur en donnant une chance à un moteur de recherche prometteur.

P.S. Comme d'habitude, nous ne sommes sponsporisés par personne.