Le géant de la recherche modifie le cœur de son infrastructure technique, mais il ne faut surtout pas que ça se voie.
Google c’est un peu magique. On rentre un mot, ou plusieurs, et moins d’une seconde plus tard, une série de liens apparaissent. Dans la mesure du possible pertinents. C’est magique comme un tour de prestidigitateur. On sait bien qu’il y a un truc, que derrière cette petite seconde, des wagons d’ordinateurs ont travaillé pour scruter le web, le trier, le ranger dans des cases, et ont tout mis en œuvre pour ressortir la bonne série de résultats. On le sait bien, mais on s’en fout. Aujourd’hui, Google est devenu un réflexe pour une majorité d’internautes et peu se posent la question de savoir comment ça marche. Les rouages sont cachés, seule l’interface compte. Alors, quand Google annonce qu’on peut tester la prochaine génération de recherche sur Internet, la curiosité cède vite le pas à l’indifférence. Le lien proposé renvoie tout simplement vers un Google tout pareil, aux résultats apparemment identiques. Ils ont changé les rouages. Et alors ?
Et alors, la performance dans ce genre d’opération est justement dans la continuité. Google va même jusqu’à demander, dans son annonce : « Aujourd’hui, nous ne voulons des retours que sur les différences entre le système de recherche actuel et notre nouveau système ». L’évolution serait-elle donc de ne rien changer ? Pas forcément, mais il faut comprendre que Google ne va pas s’amuser à chambouler un système qui fonctionne bien (au moins en terme de parts de marché) au risque de se planter, à l’heure où ses concurrents les plus directs tentent de se relancer sur le secteur de la recherche, notamment Microsoft avec Bing.com.
Matt Cutts, responsable de l’équipe Webspam chez Google, explique dans une interview à Webpronews : « il s’agit avant tout de réécrire le système d’indexation. Pour avoir une bonne recherche, vous devez savoir parcourir le web, l’indexer, et afficher les résultats très vite. Caffeine est la réécriture d’une grande partie du système qui indexe les pages ». L’indexation, c’est le mécanisme qui, dans la base de données du moteur, permet de relier une page web aux mots clefs tapés par l’internaute, bref le cœur du processus. Par ailleurs, pour Matt Cutts, l’apparition de Caffeine en ligne n’a rien à voir avec les activités de la concurrence : « Ca fait des mois que nos ingénieurs bossent dessus. Et puis, l’été est une très bonne période pour tester. »
L’apparente similitude entre le système actuel et son successeur n’empêche pas quelques internautes de s’extasier, comme maznetwork : « Wow, l’index est bien plus pertinent, moins de spam, plus de bons sites. J’essaie plein de recherches et je vois des énormes améliorations dans la qualité des résultats. J’espère que ça passera tel quel en production. » Ce qui n’arrivera de toute façon pas tout de suite. Comme pour les précédentes modifications d’infrastructure de cette ampleur (la plus récente datant de fin 2005), Google va être très progressif, en installant le nouveau code dans un seul data-center d’abord, avant de le diffuser. Une affaire de quelques mois. Mais pas d’inquiétude, vous ne sentirez rien.
Source: http://www.ecrans.fr