Google muestra en su Dashboard la información que maneja sobre sus usuarios pero eso no es más que la cresta del iceberg porque necesariamente maneja muchísima más información.
Lo que Google necesita y por qué lo necesita
Una parte muy importante del negocio de Google está basado en la publicidad con enlaces patrocinados en los resultados del buscador, banners en sitios web de editores, en aplicaciones de iPhone o Android o en cualquier otro sitio de la tupida red que crea con Google Adsense y Adwords. Su posición, intermediando entre el anunciante y el consumidor, le obliga a tener un sofisticado sistema de detección del fraude de cara a mantener la confianza de sus clientes.
Para evitar ese fraude, y otros muchísimo más complejos y sofisticados, Google dispone de mecanismos de análisis de cada clic que para sí lo quisieran muchas entidades financieras en la lucha contra el blanqueo de capitales. Y la clave de todo el sistema es la información, en cantidad y calidad.
¿Qué información tiene?
Nadie sabe a ciencia cierta qué información obra en poder de Google para ser tratada por sus sistemas anti-fraude, pero ahí van algunas de las cosas que sí tiene.
- La más sencilla, la información de las búsquedas. Con una cuota de mercado cercana al 85% del negocio de las búsquedas, Google sabe exactamente qué temas nos interesan en base a las búsquedas que realizamos. Estas búsquedas le dan una idea muy certera de nuestro nivel educativo, cultural, social, económico,... o información sobre la edad, género, raza o ideología política entre otras. Tan solo hay que saber combinar la información con un buen modelo estadístico.
- Con Google Analytics, además, complementa la información que le llega del buscador con los rastros que, sin ser conscientes, vamos dejando durante la navegación. Los scripts de Google Analytics están presentes en el 50% de los sitios web con lo que el rastro es visible a gran distancia. Es decir, sabe desde que web hemos partido en la navegación (el resultado de la búsqueda) y por qué webs vamos saltando. La información que facilita Analytics en su sitio web (que no deja de ser un subconjunto de la que Google conoce) es simple alucinante.
- Con Gmail obtiene muchísima información relevante. Tiene acceso a la lista de contactos, tiene información sobre las personas a las que enviamos y nos envían emails, sabe quiénes son contactos personales y quiénes son profesionales (un mínimo análisis sobre el día y hora a la que se cruzan emails permite inferirlo con gran acierto). Y todo esto sin analizar el cuerpo de los mensajes, cosa que estoy convencido de que no hace. Por otra parte, con Calendar tiene acceso a nuestra agenda, reuniones, fechas de cumpleaños de los contactos,...
- Con Google Maps conoce los lugares que nos interesan por una u otra causa. Combinado con información de los puntos anteriores puede llegar a inferir que el próximo fin de semana vamos a visitar a un hermano que vive en otra ciudad, que nos vamos de vacaciones y a qué hotel,... Combinado con un GPS en un smartphone puede conocer las rutas que seguimos, la velocidad a la que conducimos, los lugares en los que paramos durante un viaje,...
- Con YouTube dispone del repertorio completo de vídeos que nos gustan, los que remitimos a nuestros amigos, los que nos remiten, los canales que más nos interesan,... En base al tipo de contenido audiovisual puede determinar con enorme sencillez si desde nuestra dirección IP doméstica se consumen películas infantiles, de adolescentes,... con lo que ya puede conocer nuestro estado civil y si tenemos o no familia.
- Con la información que tiene sobre las redes WiFi (las que analizó y geolocalizó durante los paseos de los coches de Street View) puede saber en qué lugares exactos estamos cuando nos conectamos a estas redes.
- Con los teléfonos Android (o cualquier otro Smartphone) tiene a su alcance algo mucho más íntimo y personal que la libreta de direcciones del email como es la libreta de teléfonos. Ahora están unificadas en una sola y es posible que replicadas en una cuenta de correo de Gmail. A su vez, con Google Talk sabe con quién hablamos por teléfono, a qué horas, durante cuánto tiempo,...
- Con Feedburner y Alerts tiene una vasta información de los sitios web a los que estamos suscritos y los temas o palabras de las que nos interesa ser notificados cuando aparezcan por la web.
- Con Blogger tiene información sobre nuestras inquietudes, preferencias, gustos,... En base a la forma de escribir puede inferir con gran facilidad el nivel cultural, la rama de conocimiento en la que estamos especializados o nuestro posicionamiento frente a determinados asuntos. Y esto no es ciencia-ficción ya que hay empresas especializadas en crear encuestas de opinión analizando únicamente la enorme red de blogs.
- Con Google Translate y otros muchos servicios conoce el timbre de nuestra voz ya que procesa y almacena las solicitudes de traducción.
- Con los álbumes de Google Picasa tiene acceso a todas nuestras fotos, con quien las compartimos, fecha en la que fueron tomadas, lugar -si la cámara dispone de GPS-, quienes aparecen en las fotos...
- ...y su lista de productos y servicios no para de crecer.
Terminando
Toda esta información, y mucha más que resulte de la minería de la ya existente, es necesaria para evitar que alguien que gestiona una web que muestra publicidad de la red de Google se pase el día pinchando en los anuncios de su propia web.
Da igual si cada clic lo hace con un navegador diferente, desde un país diferente, con un ordenador diferente, desde una red WiFi diferente,... o incluso si le pide al primo de su novia que haga los clics por él.
Google necesita identificar ese fraude porque le va en ello no ya su negocio sino el modelo en sí mismo. Y lo que es seguro es que malos que quieran enriquecerse fraudulentamente no faltan.
Algunos países han prohibido o recortado el alcance de algunos servicios como, por ejemplo, Street View o Analytics por considerar que atentan a la privacidad de las personas. Probablemente sea bastante extremo teniendo en cuenta la política de privacidad de Google, o tal vez no porque las asociaciones en favor de los derechos civiles empiezan a poner el foco en este problema intentando forzar al Legislador a regular este mercado.
En cualquier caso, no deja de ser cierto que la mitad de los responsables de campañas de publicidad y marketing del mundo venderían su alma al diablo por la décima parte de la información que tiene Google.
Porque mediante sencillísimas operaciones de BI puede saber nuestro nombre completo, lugar de residencia, lugar donde pasamos las vacaciones, nombre y ubicación de la compañía en la que trabajamos, las carreteras por las que circulamos y a qué velocidad, nuestra foto, el tono de nuestra voz o el nombre de nuestros amigos. Y con unas reglas mínimamente más complejas puede determinar si tenemos o no niños pequeños en casa, nuestro nivel cultural, económico, social o educativo o nuestras preferencias ideológicas, género, raza, edad, gustos. A fin de cuentas, a sabiendas o no, nosotros mismos se lo hemos dicho.
La parte positiva es que muchos de esos productos y servicios son gratuitos, pero tanta información concentrada en un mismo sitio... da miedo.
www.tonsofit.com