vendredi 23 novembre 2007

Google, quel est le secret de leur réussite ?

Je vous ai déjà parlé dans mon premier article de cette série Google des fondateurs de Google : Larry Page et Sergey Brin. Sans faire une biographie de chacun des directeurs de l'entreprise, je vais vous expliquer quelle est donc cette idée si formidable qui a fait de cette entreprise une des plus connues du monde et qui est estimée maintenant à 140 milliards à la bourse de Wall Street ?

*Attention cet article est un peu plus complexe que les précédents*

Les présidents et fondateurs de Google :
  • Lawrence E. Page : Informaticien cofondateur de Google, il est président et directeur produit de l'entreprise. Google l'a rendu milliardaire. En 2006 le magazine économique américain Forbes classe Larry Page à la 27eme place de son classement des plus grandes fortunes mondiales avec plus de 12 millards de dollars. En 2007 Forbes le classe 6eme avec plus de 18 millards de dollars ! Il est l'inventeur de PageRank.


(Sergey Brin et Larry Page)

  • Sergey Brin : Informaticien et entrepreneur, confondateur de Google, il est président et directeur technique de l'entreprise. Google l'a lui aussi rendu milliardaire. Après l'avoir classé 26eme de son classement et estimant sa fortune à 13 milliards de dollars en 2006, Forbes le classe 5ème, juste devant son partenaire, avec plus de 18 milliards de dollars.

PageRank : la clé de la réussite ?
 
Beaucoup d'entre vous connaissent PageRank (ou PR), le système de classement des pages Web utilisé par le moteur de recherche Google pour attribuer l'ordre des liens dans les résultats de recherche.
Google affecte, grâce à PageRank, un score à chaque page Web en fonction de nombreux critères  : les liens entrants et sortants, les ancres, le trafic associé à la page,  le choix de la page dans les résultats, le nom de domaine, l'hébergement... 
PageRank est un algorithme. Pour définir le plus simplement possible un algorithme disons qu'il répond à des questions comme par exemple "comment faire ceci ?", "comment obtenir ceci ?", "comment trouver telle information", "comment calculer tel nombre ?". Je créerai un article un peu plus tard sur les algorithmes.
PageRank a été utilisé à l'origine pour donner une note aux pages sur une échelle de 10, son utilisation a un peu changé depuis, mais je ne vais pas rentrer dans les détails techniques, pour votre bien ! 
Si vous voulez tout savoir, l'algorithme de PageRank est expliqué sur ce lien, attention, c'est plutôt complexe !
Le score des pages webs ou indice de popularité est calculé de la manière suivante :
  • Plus un site X est pointé par d'autres sites Y, plus sont PR augmente (récompense de la popularité de X) ;
  • Plus de PR des sites Y est grand, plus de PR du site X augmente (bénéfice de la popularité des autres sites trouvant X intéressant) ;
  • Plus le nombre de sites Y est faible, plus le PR de X augmente (X considéré comme le seul site de qualité par les autres).

PageRank n'est pas infaillible :

Comme dans presque tous les moteurs de recherche, Google et son PageRank subissent le Spamdexing d'un bon nombre de sites. 
La technique de spamdexing la plus connu pour le moteur de recherche de google se prénomme élegament le "Google Bombing" ou "Bombardement Google" en français.

Le Spamdexing ?
Le mot Spamdexing est la contraction de spam (communication électronique non sollicitée par les destinataires destinée à des fins publicitaires ou malhonnêtes) et de indexing (référencement). 
Le spamdexing c'est un ensemble de techniques abusives de référencement qui permettent de mieux positionner un site dans la page de résultat des moteurs de recherche (dans les tous premiers résultats, car les utilisateurs vont rarement au-delà de la première page). Ces techniques consistent à tromper les algorithmes des moteurs de recherche, ces mêmes algorithmes, appelés robots (ou PageRank chez Google), indexent et classent les sites. 
Exemples de techniques de Spamdexing :
  • Le Cloaking consiste à fournir aux moteurs de recherche des pages différentes de celles vues pas les internautes.
  • Le Netlinking est la création de réseaux de sites dont le seul but est d'augmenter la popularité d'un site.
  • Les URL longues sont utilisées avec une répétition pour augmenter les résultats d'une recherche (ex de Wikipédia : www.voyages.com/voyages-pas-chers/voyage-en-chine/voyage-en-chine.html).
Bien évidement, le Spamdexing est totalement interdit car contradictoire avec la loi sur les pratiques du commerce. Il s'apparente en plus à la fraude informatique puisqu'il détourne un processus informatique automatisé de son but initial et ce dans un but d'enrichissement personnel. Cet article traite correctement ce sujet. 

Le Google Bombing ?
Comme dit plus haut, Google utilise d'autres critères de sélection.
L'un d'entre eux est le "texte d'un lien". C'est à dire le texte qui est sur un lien (exemples : http:///unjourpasinutile.blogspot.com/ ou un blog passionnant etc...). 
Cette importance accordée par Google au texte d'un lien a été utilisée par certains pour créer cette technique appelée "Google Bombing". 

Le "Bombardement Google" exploite ce critère et un algorithme de PagerRank qui accorde un certain "poids" au texte possédant un hyperlien. En effet, si un grand nombre de sites utilisent le même texte pour pointer la même cible, Google additionne ce poids et il devient possible de faire apparaître la page cible dans les résultats d'une recherche sur le texte contenu dans les liens pointant vers elle.
Exemple : Si plusieurs sites X créent des liens possédant un lien vers un site Y avec le texte "Site horrible". La recherche "Site horrible" possédera un lien vers le site Y. Plus le nombres X est grand, plus le l'indice de popularité du site Y dans la recherche "Site horrible" sera grande.

Ce comportement du moteur Google a été exploité principalement au sein des réseaux de blogs pour agir collectivement sur le classement d'un site. Cette technique exploitant une faille, Google est en droit de condamner cette action. Un grand nombre d'exemples de GoogleBombing sont disponibles ici.

Google ne réagit pas ?

Officiellement, Google ne semble pas s'émouvoir de ces nouvelles pratiques. Interrogé par le New York Times, Craig Silverstein, directeur technique de la société, affirme que "l'entreprise ne voit rien de mal dans le fait que le public utilise le moteur de recherche de cette façon".

Mais, en coulisse, il n'est pas certain que ces techniques soit considérée avec autant de philosophie. On imagine aisément le chaos que pourrait entraîner le Google Bombing si les entreprises venaient à systématiser cette technique pour dénigrer leurs concurrents...

Et voilà, la "Semaine Google" est terminée !