Dans les faits, Google conservait jusqu’à présent toutes les recherches effectuées sur son moteur en y associant l’IP (associable à une connexion en particulier à un abonnement) et une date.
Ex : 123.45.67.89 - 25/Mar/2003 10:15:32 - http://www.google.com/search?q=voitures - Firefox 1.0.7; Windows NT 5.1 - 740674ce2123e969.
La dernière suite de chiffres et de lettres associant la requête à un cookie placé sur la machine émettrice et qui permet d’associer un même utilisateur même quand il change d’IP.

La nouveauté annoncée par Google et pas encore mise en place est d’altérer les 8 derniers bits de l’adresse IP (soit 256 possibilités) et de supprimer l’information permettant d’identifier une personne grâce aux cookies. Selon ce document officiel ces mesures rendront « improbable » l’identification de l’utilisateur. Ces mesures d’anonymisation seraient automatiques après une période de 6 à 24 mois. Elles ne concernent que le service de recherche et pas Gmail et autres qui ont leur propre règle de confidentialité.

Par le passé d’autre moteur de recherche ont voulu rendre anonyme leurs données, on se souvient à ce titre du scandale d’AOL qui avait fourni à des fins de recherche des données soit disant anonyme et qui avaient en fait permis de remonter à l’utilisateur en se basant sur le fait que l’une des requêtes les plus fréquentes sont la recherche de son propre nom. Il est néanmoins raisonnable de penser que Google ne tombera pas dans le même piège.

Alors donc pourquoi est-ce que Google se prive ainsi d’une source d’information, lui qui en est si friand. D’abord ce n’est pas pour gagner de la place puisqu’on la vu, rien n’est réellement supprimé. Ensuite si l’on regarde le cadre juridique, l’Union Européenne à validé une directive sur la collecte de données sur Internet devant être retranscrite d’ici à août 2007 dans les pays membres. Cette directive fixe à 2 ans la durée que les opérateurs Internet et de téléphonie doivent conserver les données personnelles dans le cadre de la lutte contre le terrorisme et le grand banditisme. Aux Etats-Unis le département de la Justice réfléchit à une loi similaire. Il est donc probable que Google ne soit que le premier à se mettre au diapason. C’est donc un coup de maître que d’être le premier à l’annoncer. Il en recueille ainsi tous les bénéfices et redore un blason terni par quantité de procès et limite la porté de la stigmatisation de Google « big brother ». Dernier argument, cette politique permet d’être transparent face aux requêtes de la justice : soit il peut fournir des données soit il ne peut plus, mais il n’y a plus de place pour le cas par cas.

Bref, un bon calcul entre contraintes et opportunités, ce qui confirme que le premier talent de Google c’est un management éclairé et anticipateur.


But why is Google making our data anonymous

privacy

Last week the press announced the end of the data retention by our friend Google. Unlike some press article, Google “will not remove” data which it collected but will simply make them anonymous. What is this really meaning ? Is removing the associated IP is enough and why Google have decided to do so.

Up to now, Google saved all the searches made through it search engine by associating the IP address (linkable to an Internet connexion then possibly to someone) and a date.
Ex: 123.45.67.89 - 25/Mar/2003 10:15: 32 - http://www.google.com/search?q=voitures - Firefox 1.0.7; Windows NT 5.1 - 740674ce2123e969.
The final letters and digits stands for a unique cookie placed on the transmitting machine and which makes possible to associate a same user even when he changes IP.

The change announced by Google and not implemented yet is to randomly modify the last 8 bits of IP address and to remove information making it possible to identify a person thanks to the cookies. According to this official document these measures will make “improbable” the user identification. These protocols would be automatic after a period from 6 to 24 months. They are related only to search and not to Gmail nor to others services which have their own privacy statement.

In the past of another search engine wanted to make anonymous their data and we remember how burst out the AOL scandal. It provided for research purpose data supposedly anonymous and which in fact made it possible to identify many users. This being done based on the fact that one of the most frequent search request are about your own name. It is nevertheless rational to believe that Google won’t make the same mistake.

Thus why Google is getting rid of a source of information, it which is so eager of such sources. For a start is not to save storage place since nothing is really removed only altered. Then if we look the legal framework, the European Union validated an internet data detention directive having to be transcribed before August 2007 for member states. This directive fixes at 2 years the length that Telco and internet operators must save personal data in order to fight against terrorism and the organized crime. The United States department of Justice is thinking about a similar law. It is thus probable that Google is only the first to tuning it’s internal rules. This is definitely a brilliant move to be the first to announce it. Google thus get all the benefits and manage to clear its image tarnished by all the trials about intellectual property. Last argument, this policy makes Google particularly transparent to justice requests, either it can provide data either it cannot.

So, this is a good thinking between constraints and opportunities, which confirms that the first talent of Google is an enlightened management and anticipating capacities.