Une pieuvre nommée Google

Répondre
Partager Rechercher
Quelques chiffres

Dire que google a le monopole des moteurs de recherche est un euphémisme: on tourne autour des 50% de parts de marché (52,392% très exactement en janvier 2003, mais on oscille entre 48% et 54% selon les sources). Google fait entre trois et quatre fois plus de hits que le second, yahoo, qui est aux alentours de 15%.

Loin de moi l'idée de revenir sur les qualités de ce moteur qui lui ont permis de déboulonner en quelques années des poids lourds comme Altavista: Google est rapide, pertinent, sobre, et sans publicité. Du moins pendant un temps, car hormis la rapidité ces éléments sont de plus en plus critiqués par des sites comme google watch. Le sujet a été évoqué quelques fois sur JOL, le dernier en date portant sur les pages en cache et les infos personnelles que certains ont pu trouver via Dieu.

Google, un des acteurs principaux du web

Dieu, googeliser, autant de mots qui composent le patois du surfeur, et dont les choix sont significatifs d'une certaine réification du moteur de recherche. Si je n'avais pas confiance envers le sens critique des internautes, le même qui a construit Google, je dirais que l'adoration n'est pas loin, les nombreuses imitations (froogle, xgoogle, elgoog, cthoogle...) en attestent. Encore faut il que ce sens critique ait les moyens de s'exercer.

A nous lécher servilement la main, la plus grande force de Google aura été de se faire oublier de l'internaute. Une textbox avec redirection, une toolbar ou un mot clé requétant comme sur Netcaptor: la puissance du moteur google peut même se passer de la célèbre page de garde. Et dans l'ombre, entre cookies et logs, Google est en passe de réussir en quelques années ce que la CIA n'aurait pu rêver de faire en 1 siècle*: établir des profils, garder des traces, ne rien laisser passer dans sa toile aux mailles de la taille de l'individu. Google, un acteur du web à part entière, invisible, mais avec une mémoire d'éléphant...

Google mange a tous les rateliers

Google évolue du fait de son succès, c'est une évidence. Il ne se passe pas un mois sans que je ne découvre une nouvelle fonctionnalité du moteur: accès au newsgroups, streaming de news, traduction ou recherche d'images ne sont que la partie visible de l'iceberg. Il y a aussi google compare les prix, google viewer, google bar, google webquotes, google trouve tes copains de promo et google passe le bac a ta place. Ensuite, imaginez ce qu'une compagnie privée américaine* peut bien vouloir faire des infos qu'elle récupère chaque jour des centaines de millions d'internautes ? Mmm, sacrément dur de résister à la tentation. Qu'un modèle économique viable passe par la pub personnalisée, passe encore. Que Google n'arrive pas à justifier pourquoi ses cookies disposent d'un ID unique et d'une durée de vie virtuellement illimitée, j'ai plus de mal à comprendre. On arrive au déclencheur du post, le titre de Big Brother 2003 remis à Google, et un article plutôt sobre de google-watch, dont je vais traduire sommairement les points essentiels (on se reportera à l'article pour plus de détails)

1. Google et ses cookies immortels
Google a été le premier moteur de recherche à prendre 2038 comme date d'expiration de ses cookies (pour contourner une loi apparemment), identifiés par un identifiant unique.

2. Google stocke tout
A chaque requête google stocke l'ID du cookie, l'adresse IP, l'heure, la date, les termes de la requête, et la configuration du browser. Apparement google customise les résultats en fonction de l'IP (qui donne des infos sur l'endroit géographique de la machine pour qui sait lire la topologie du réseau)

3. Google garde les données pendant un temps indéfini
Google n'a pas de politique de stockage d'information. Comme disent les programmeurs, quand une variable est "undefined" on peut s'attendre au pire.

4. Google reste muet sur ce qu'ils font de ces données
Les demandes d'info à Google quant à leur politique de droit à la vie privée restent sans réponses (est cité un exemple du New York Times qui interrogeait google sur les poursuites en justice éventuelles à son égard)

5. Google engage des barbouzes
Pas trop compris pourquoi et ça me choque pas plus que ça mais bon.

6. La google toolbar est un spyware
Elle, c'est le pompon, une vraie agence de renseignement à elle toute seule, je vous laisse lire l'article. Elle s'update toute seule sans demander (accès total au disque dur donc), rien que ça.

7. La page en cache est illégale
Il semblerait selon une obscure loi US que la page en cache viole quelque peu le droit du copyright. En passant je suis un peu en désaccord avec ce point, d'une part parce que je trouve ça pratique, et d'autre part parce que je pars du principe que quand on a mis quelque chose sur le web ça devient public (hors cas particulier)
Le point précise qu'on peut éviter par une balise web d'avoir sa page en cache, et aurait souhaité que le cache soit par défaut off.

8. Google n'est pas ton ami
Petite paraphrase personnelle: Google a réussi le coup du Loft, cad arriver à enfler les gens tout en faisant en sorte qu'ils en redemandent.
Plus sérieusement, il est ici abordé le problème du monopole: en gros Google est devenu le passage obligé du webmaster. Je suis encore en désaccord avec ce point car google est plutôt pertinent. Petit problème afférent au monopole: un bon classement sur google est comme un petit diplôme pour une page, or il existe bien des manières de tromper un automate de référencement. Les faiblesses inévitables des algorithmes se retrouvent amplifiées par le statut de monopole de google.
De plus, le fait que Google garde jalousement le secret sur tout ses algorithmes est assez gênant: qu'est ce qui fait précisément qu'une page est mieux notée qu'une autre ? (je ne parle pas du blabla journalistique sur trois lignes)

9. Google est une bombe à retardement dans le droit à la vie privée
150 millions de recherche par jour, un moteur dont l'influence sur le web est beaucoup plus grande qu'on ne croit. Je disais il y a peu que personne n'avait le destin du web dans ses seules mains, ça reste vrai selon moi, mais on devine qu'une décision de google peut sérieusement impacter le web de par son seul poids.
Si l'on considère la pire option, Google pourrait sérieusement nous péter à la tête un jour, imaginons par exemple que google vende un service de profiling d'individu utilisé par les boîtes lors des recrutements: un croisement avec un log de FAI, et on retrouve toutes les requêtes faites par un individu pendant les 40 dernières années. scary isn't it ?

--------------------------------------------
*paraphrase de l'article sur googlewatch.
**Google est plus précisément une joint-venture de 2 boites américaines
http://www.google-watch.org/gifs/connec3.gif
--------------------------------------------

Au final, pas grande chose d'autre à dire, si ce n'est un rappel que la vigilance sur le web est et sera toujours de mise: l'éthique et l'entreprise sont des mots qui vont traditionnellement mal ensemble. Pour ma part, google passe en nuke de cookies à vue (je trouvais ça pratique pour les préférences), la googlebar est partie au panier, et je songe sérieusement à alterner avec d'autres moteurs.

Khronos
Je dirai que fut un temps ou altavista etait a la place de google, que maintenant personne n'en entends plus parler et que si google joue avec le feu, le retour de baton ira tres vite.


vive
kartoo

Citation :
A nous lécher servilement la main, la plus grande force de Google aura été de se faire oublier de l'internaute. Une textbox avec redirection, une toolbar ou un mot clé requétant comme sur Netcaptor: la puissance du moteur google peut même se passer de la célèbre page de garde. Et dans l'ombre, entre cookies et logs, Google est en passe de réussir en quelques années ce que la CIA n'aurait pu rêver de faire en 1 siècle*: établir des profils, garder des traces, ne rien laisser passer dans sa toile aux mailles de la taille de l'individu. Google, un acteur du web à part entière, invisible, mais avec une mémoire d'éléphant...

sur ce point et meme si sur le fond je suis d'accord, l'utilisateur averti ne rentre que rarement ses infos personnelles sur le web. Qui plus est il est a mon avis difficile de savoir si les informations fournies par les internautes sont vraies ou fausses, et donc ces infos perdent un peu de leur valeur a cause de ca.
Re: Une pieuvre nommée Google
Citation :
Provient du message de Khronos
Les faiblesses inévitables des algorithmes se retrouvent amplifiées par le statut de monopole de google.
De plus, le fait que Google garde jalousement le secret sur tout ses algorithmes est assez gênant...
Moi je les comprend, ca doit être une véritable oeuvre d'art derrière
Citation :
Provient du message de Serafel
Je dirai que fut un temps ou altavista etait a la place de google, que maintenant personne n'en entends plus parler et que si google joue avec le feu, le retour de baton ira tres vite.


vive
kartoo
tiens je connaissais pas, ça a l'air assez sympa cette interface...
par contre comparé à google c'est leeeeeeeeeent

(d'ailleurs c'est avant tout la vitesse qui a permis à google d'avoir un tel succès. Et à mon avis tant que la performance sera là les gens (dont moi ) continueront à l'utiliser.
Citation :
Provient du message de Serafel
sur ce point et meme si sur le fond je suis d'accord, l'utilisateur averti ne rentre que rarement ses infos personnelles sur le web. Qui plus est il est a mon avis difficile de savoir si les informations fournies par les internautes sont vraies ou fausses, et donc ces infos perdent un peu de leur valeur a cause de ca.
Le problème est que apparemment, Google garde en cookie chaque requête envoyée par l'utilisateur, et ce avec un numéro d'identification unique, jusqu'en 2038.
Autrement dit, ledit cookie "immortel" est en quelque sorte ton fichier de renseignement personnel sur internet, où on peut voir toutes les recherches que tu as fais depuis le début à partir de l'ip de l'ordinateur d'où tu te connecte.
Il est facile ensuite de déterminer ce qui intéresse l'utilisateur en question, par exemple.

Et ça, c'est bel et bien une bombe à retardement pour la protection de la vie privée, surtout si on n'a aucune garantie (ni même aucune information en réalité) que ces données ne soient pas données à un tier.

C'est en tout cas ce que j'ai compris, et si je ne me trompe pas, ça peut effectivement être assez inquiétant.
Je ne m'en étais jamais soucié auparavant.
Citation :
Provient du message de Orravan
Le problème est que apparemment, Google garde en cookie chaque requête envoyée par l'utilisateur, et ce avec un numéro d'identification unique, jusqu'en 2038.
Autrement dit, ledit cookie "immortel" est en quelque sorte ton fichier de renseignement personnel sur internet, où on peut voir toutes les recherches que tu as fais depuis le début à partir de l'ip de l'ordinateur d'où tu te connecte.
Il est facile ensuite de déterminer ce qui intéresse l'utilisateur en question, par exemple.

Et ça, c'est bel et bien une bombe à retardement pour la protection de la vie privée, surtout si on n'a aucune garantie (ni même aucune information en réalité) que ces données ne soient pas données à un tier.

C'est en tout cas ce que j'ai compris, et si je ne me trompe pas, ça peut effectivement être assez inquiétant.
Je ne m'en étais jamais soucié auparavant.
et ? les fichiers clients, ca existe, les recoupements de fichiers clients aussi. Le probleme vient peut etre de la conservation des informations pendant si longtemps, mais il y a 2 semaines, j'ai vu mes grands parents qui recoivent depuis 30 ans (sic!) des courriers d'un assureur bien connu.

Franchement, sur le web je fais essentiellement de la detente. encore une fois sur le fond je suis contre cette atteinte a la vie privee, maintenant je ne vais pas mourir parce que google sait que j'ai cherche le site marmiton.org il y a 3 semaines.
Citation :
Provient du message de Lango Silma
(kartoo) tiens je connaissais pas, ça a l'air assez sympa cette interface...
par contre comparé à google c'est leeeeeeeeeent

(...)
pour un non-connaisseur tel que moi, sa lenteur ne viendrait-elle pas simplement de son 'interface' [la mise en place du réseau graphique etc] ?


Sinon, et bien sincèrement, je me sens pas particulièrement visé. Je n'ai utilisé Google que peu de fois, et plus depuis qu'il est inlassablement cité en référence pour faire une recherche et qu'il était directement plébiscité dans des navigateurs internet (Mozilla par ex, que j'ai testé et désinstallé pour cette raison entre autre : je vois d'un assez mauvais oeil les connivences publicitaires dans les softs, pages, etc. Mais ce n'est pas parole d'évangile hein. )

Vraisemblablement un vieux reste de rebelzatitude primale
Pour varier les plaisirs, il y a aussi www.alltheweb.com . A voir ensuite ce qui se cache derrière les autres moteurs de recherche.
Pourquoi ça ne m'étonne qu'à moitié que les compagnies offrant ce type de service n'aient rien de philanthropiques?
J'ai entendu dire que Google conservait des armes de destruction massive.


Vous avez conscience d'être parano ? garde l'IP et les mots clés que vous avez tapés dans le moteur et alors ? putain il en faut peu pour faire peur aux novices... 90% des gens savent pas ce que c'est qu'une IP ce qu'il y a derrière etc ...
Citation :
Provient du message de Mouerf
J'ai entendu dire que Google conservait des armes de destruction massive.


Vous avez conscience d'être parano ? garde l'IP et les mots clés que vous avez tapés dans le moteur et alors ? putain il en faut peu pour faire peur aux novices... 90% des gens savent pas ce que c'est qu'une IP ce qu'il y a derrière etc ...
Chez Google ils savent. Et un fichier de renseignement comme ca, ca vaut un paquet de fric ne serais ce que pour un entreprise qui veut faire une étude de marché.
ça fait "plaisir" de voir que d'autres personnes s'intéressent à ce "problème"

j'avoue que Google est un bon moteur de recherche
intégré dans Mozilla, il donne de bons résultats mais bon ...

je vais tester d'autres moteurs pour voir ce que ça donne

est-ce-que ça sert à quelque chose de supprimer ses cookies de Google ?
tiens, question idiote et un peu HS ...

Citation :
Provient du message de Serafel
Sauf qu'en france en tout cas et a ma connaissance il est interdit de vendre des fichiers de ce type. Quelqu'un peut confirmer ou infirmer de facon plus sure que moi ?
Google n'est sans doute pas une entreprise basée dans l'hexagone.

Vis à vis des renseignements qu'ils récolteraient et revendraient sur des citoyens de notre pays (remarquez le conditionnel) ... Quelles types de lois s'y appliqueraient ? Le droit international ? Francais ? Du pays de Google ?

(juste pour me donner un ordre d'idée)
Citation :
Provient du message de vabroi
Vis à vis des renseignements qu'ils récolteraient et revendraient sur des citoyens de notre pays (remarquez le conditionnel) ... Quelles types de lois s'y appliqueraient ? Le droit international ? Francais ? Du pays de Google ?
À ma connaissance, le droit du pays où sont physiquement les serveurs. Donc vraisemblablement le droit américain

S'ils ont des serveurs dans plusieurs pays... aucune idée
enfin si : vu que c'est Google, ca sera : comme ça les arrange.
Citation :
Provient du message de Davesweb
est-ce-que ça sert à quelque chose de supprimer ses cookies de Google ?
a priori, ça les empêche d'accéder aux infos qu'ils stockent ainsi.
Comme ça m'étonnerait qu'ils s'amusent à stocker ce genre d'infos sur leurs serveurs (des centaines de millions de requêtes par jours... ça demanderait beaucoup de capacité de stockage )

donc je pense que oui si tu veux les empécher d'accéder à ce genre d'info effacer tes cookies Google sera efficace.
Wink
Khronos, tu mériterais d'être fouetté sur la place public pour avoir osé prêter autant d'attention à cet article calomnieux écrit par un journaliste dont la frustration ne connaît pas d'égal sur cette planète.

Mais Google est miséricordieux et te pardonnera cet écart de conduite qui, sous la révolution, t'aurait directement conduit à la guillotine.

Google est vie, Google est bon, Google est ton ami, Google est dieu !



Citation :
1. Google et ses cookies immortels
Google a été le premier moteur de recherche à prendre 2038 comme date d'expiration de ses cookies (pour contourner une loi apparemment), identifiés par un identifiant unique.
Quid du problème ?

Citation :
2. Google stocke tout
A chaque requête google stocke l'ID du cookie, l'adresse IP, l'heure, la date, les termes de la requête, et la configuration du browser. Apparement google customise les résultats en fonction de l'IP (qui donne des infos sur l'endroit géographique de la machine pour qui sait lire la topologie du réseau)
Webalizer ou AWStats le font admirablement bien pour n'importe quel site web.
À toi, ou à l'auteur de l'article, de prouver que ça pourrait être utilisé à des fins immorales ou, pire, illégales.

Je t'invite à lire les règles de confidentialité de Google qui ne cachent rien à personne quant à la politique de confidentialité de Google.

http://www.google.fr/intl/fr/privacy.html
Si ces règles ne te conviennent pas, libre à toi d'utiliser un autre moteur de recherche.

Citation :
3. Google garde les données pendant un temps indéfini
Google n'a pas de politique de stockage d'information. Comme disent les programmeurs, quand une variable est "undefined" on peut s'attendre au pire.
Comme beaucoup de sites web, une fois de plus.
Les statistiques sur les requêtes HTTP sont un excellent outil de communication pour une entreprise.

Citation :
4. Google reste muet sur ce qu'ils font de ces données
Les demandes d'info à Google quant à leur politique de droit à la vie privée restent sans réponses (est cité un exemple du New York Times qui interrogeait google sur les poursuites en justice éventuelles à son égard)
Le New York Times doit avoir des difficultés à trouver de l'information qui se trouve ni plus ni moins à la source :
http://www.google.fr/intl/fr/privacy.html

Citation :
5. Google engage des barbouzes
Pas trop compris pourquoi et ça me choque pas plus que ça mais bon.
Je ne savais pas ce qu'était un barbouze
Mais grâce à Google, maintenant je le sais : http://www.google.fr/search?q=barbou...e+Google&meta=



Citation :
6. La google toolbar est un spyware
Elle, c'est le pompon, une vraie agence de renseignement à elle toute seule, je vous laisse lire l'article. Elle s'update toute seule sans demander (accès total au disque dur donc), rien que ça.
Je ne m'étendrai pas ici ne l'utilisant pas mais

Citation :
7. La page en cache est illégale
Il semblerait selon une obscure loi US que la page en cache viole quelque peu le droit du copyright. En passant je suis un peu en désaccord avec ce point, d'une part parce que je trouve ça pratique, et d'autre part parce que je pars du principe que quand on a mis quelque chose sur le web ça devient public (hors cas particulier)
Le point précise qu'on peut éviter par une balise web d'avoir sa page en cache, et aurait souhaité que le cache soit par défaut off.
Là, ce serait illégal mais ça ne te dérange pas parce que tu trouves ça pratique

Ce n'est pas parce que quelque chose est sur le web, et donc public, que tu as le droit de le copier et l'afficher ailleurs que sur le site original sans consentement de l'auteur.
Enfin, j'avais cru comprendre que ça se passait comme ça. Y a t-il un juriste dans la salle ?

Google le fait par défaut (et de se poser la question : est-ce légal ?) mais tu as entièrement le droit de demander à Google de ne pas référencer ton site ou de ne pas proposer de le mettre en cache.
http://www.google.fr/intl/fr/terms.html

Le processus de référencement est automatisé et n'importe quel webmestre peut «interdire» l'accès à ses sites aux robots des différents moteurs de recherche.

Citation :
8. Google n'est pas ton ami
Rhô... !
Calomnie !
Faites monter un bûcher !

Citation :
Petite paraphrase personnelle: Google a réussi le coup du Loft, cad arriver à enfler les gens tout en faisant en sorte qu'ils en redemandent.
Plus sérieusement, il est ici abordé le problème du monopole: en gros Google est devenu le passage obligé du webmaster. Je suis encore en désaccord avec ce point car google est plutôt pertinent. Petit problème afférent au monopole: un bon classement sur google est comme un petit diplôme pour une page, or il existe bien des manières de tromper un automate de référencement. Les faiblesses inévitables des algorithmes se retrouvent amplifiées par le statut de monopole de google.
De plus, le fait que Google garde jalousement le secret sur tout ses algorithmes est assez gênant: qu'est ce qui fait précisément qu'une page est mieux notée qu'une autre ? (je ne parle pas du blabla journalistique sur trois lignes)
http://www.google.fr/intl/fr/webmasters/4.html#A1
Bonne lecture !

Et je ne vois pas pourquoi les auteurs de Google publieraient en détail leur algorithme de référencement.
C'est ce qui a fait la réputation de Google et il est légitime que ces mêmes auteurs le gardent plus ou moins secret.

Ce qui gêne, une fois de plus, c'est le fait qu'un petit moteur de recherche, à l'origine, soit devenu si performant et utilisé : vive le bouche à oreille !

Le succès a toujours fait grincer les dents et Billou en sait quelque chose.
Répondre

Connectés sur ce fil

 
1 connecté (0 membre et 1 invité) Afficher la liste détaillée des connectés