TUTORIAL GOOGLE ANALYTICS ESPAÑOL: ELIMINAR EL SPAM EN GOOGLE ANALYTICS CON FILTROS Y SEGMENTOS

Este post es el segundo post de una serie de 4 post englobados dentro del Mega Tutorial Google Analytics en Español ofrecido por el Blog Ingeniando Marketing. En el primer post “Fuentes de tráfico y visitas Web” se explicaron los diferentes tipos de visitas web (fuentes de tráfico) que nos podemos encontrar en los informes de Google Analytics. Una vez adquiridos estos conceptos básicos sobre visitas web, se procede a enseñar cómo se depuran estos informes para obtener datos válidos en Google Analytics mediante dos posts: “Eliminar el spam con filtros y segmentos” y “Etiquetado de Campañas con Google Analytics”. En este post nos centraremos en el primero de ellos, es decir, en eliminar el spam de Google Analytics mediante sus filtros y segmentos. Finalmente, y debido a que etiquetar URL genera URL excesivamente largas para poner en las Redes Sociales, se abordarán las diferentes herramientas para acortar URL que existen en el mercado con nuestro post “El arte de acortar URL”.

Eliminar el spam con filtros y segmentos

Dado que el tema del spam en Google Analytics es un tema extenso, os dejamos un índice que da accesos a los dos post dedicados a esta sección: “Entendiendo el SPAM de nuestros informes de Google Analytics” y “Eliminar el spam con filtros y segmentos”.

¿CUANDO USAR FILTROS Y SEGMENTOS PARA ELIMINAR EL SPAM EN GOOGLE ANALYTICS?

Como todo en esta vida, la primera pregunta que deberíamos hacernos es si merece la pena aplicar filtros o segmentos en nuestra página web. Teniendo en cuenta que el spam lo que hace es distorsionar nuestros informes sobre tráfico web, la exclusión del mismo dependerá de cuánto distorsionen estos datos. Por norma general, si tu tráfico spam es más de un 6% de tu tráfico web, debería plantearte usar alguno de estos dos métodos para optimizar tus informes de tráfico. En este post te explicaremos cómo usar ambos métodos, pero antes debemos entender cuál es la diferencia entre ambas soluciones para decantarnos por una o por otra.

DIFERENCIAS ENTRE FILTROS Y SEGMENTOS EN GOOGLE ANALYTICS

Todo analista que use Google Analytics para cualquier fin sabrá que, en ocasiones, para analizar mejor los datos, debe excluir ciertas cosas, es decir, seleccionar solo una parte de los datos para centrarse en un objetivo determinado. Pues bien, los filtros y los segmentos son dos formas parecidas de hacerlo. Pues bien, la gran diferencia entre unos y otros es que los filtros realizan la selección de los datos antes de que sean grabados y, por tanto, se convierten en una selección permanente e irreversible de los datos y los segmentos simplemente te muestran una ventana de todos los datos posibles, que la puedes cambiar en cualquier momento.

¿QUÉ ES UN FILTRO EN GOOGLE ANALYTICS?

Los filtros de Google Analytics son muy útiles para facilitar la tarea de análisis y brindar a los usuarios acceso únicamente a aquellos datos que son relevantes para ellos. Existen dos tipos de filtros: predefinidos y personalizados. Mientras que los filtros predefinidos nos permiten incluir o excluir tráfico de determinados ISP, direcciones IP, subdirectorios de nuestro sitio web e inclusive nombres de host específicos, los filtros personalizados nos ayudan a filtrar elementos de una manera más sofisticada (Guillermo Pareja, 2015) Para más información sobre que es un filtro os aconsejamos las siguientes lecturas de Google Supports: Acerca de los filtros de la vista, Crear y administrar filtros de vistas, tipos de filtros y usos o expresiones regulares. Además, también puedes ver este vídeo para tener una idea general sobre los mismos y sus principales características.

¿CÓMO USAR UN FILTRO PARA ELIMINAR EL SPAM EN GOOGLE ANALYTICS?

Como ya se ha explicado en las secciones anteriores, los filtros muestran los datos que más nos interesan de manera que incluyen o excluyen ciertas visitas. Si nuestro objetivo es eliminar el spam, desde este Blog de Ingeniando Marketing os aconsejamos la aplicación de dos filtros: uno para combatir el tráfico ghost y otro para combatir el tráfico crawler.

FILTRAR EL NOMBRE DEL HOST

La parte más importante de este método es hacer una lista de los host name válidos para evitar no tener en cuenta tráfico que es válido. Para hacernos esta lista, deberemos ir a nuestra pestaña Informes y dar a audienciaàTecnologíaàRed y, una vez ahí, seleccionamos como proveedor de servicios el nombre del host y tendremos nuestra tabla para recoger los nombres del host válidos. Para que nos hagamos una idea, los hostname no válidos son aquellos que tienen nombres muy conocidos de páginas web (amazon.com o google.com), páginas web de los sitios spam o el famoso (not set) y los válidos sueles ser tu dominio y aquellos lugares en los que estes presente, como tu página de e-commerce o tu canal de youtube.

Una vez tenemos la lista hecha, lo que haremos será crear una expresión REGEX teniendo en cuenta que:

  • Para separar cada hostname usaremos | ya que funciona como el famoso “or”
  • Antes de un punto y un guion siempre ponemos “\”
  • No pongas espacios en la expresión
  • Sólo tenemos 255 caracteres y una posibilidad de incluir hostname válidos. Por tanto, si tenemos blog.ohow.co, es.ohow.co y ohow.co, poner ohow.co será suficiente para incluir a todos (es la parte común a todos ellos).

Un ejemplo de expresión REGEX anti-spam Ghost podría ser:

REGEX Ejemplo #1

Para Spam debido a Ghost
ohow.co|translatingservice.com|webcacheservice.com|videoservice.com|206.190.45.150|shoppingcart.com|cdn-service.com

Para más información sobre como contruir expresiones regulares te recomendamos la lectura de este artículo de Google Supports.

Una vez que tenemos nuestra expresión REGEX, lo que deberemos hacer es ir a la pestaña “Administrador” en Google Analytics y seleccionar la vista donde queremos aplicar el filtro (Se debe recordar que es interesante tener siempre una vista en la que no se haya aplicado ningún filtro o segmento por si nos equivocamos). Una vez ahí, deberemos pinchar en filtros y en agregar nuevo filtroàPersonalizadoàCampo de filtro: Nombre del Host y en patrón del filtro usar nuestra expresión REGEX. Con esta opción deberíamos ser capaces de eliminar el 75%-90% de las visitas spam en nuestros informes de Google Analytics. (Carlos Escalera, 2015)

FILTRAR POR FUENTE EL TRÁFICO SPAM

Como ya hemos dicho, la aplicación de un filtro para host válidos, elimina casi todo el spam ghost. Sin embargo, no hace nada con el spam crawler que usa dominios válidos en su registro de Google Analytics. Por este motivo, es necesario un filtro extra en el que excluyamos aquellas fuentes que nos generen más tráfico spam y que se identifican como ya hemos explicado anteriormente. Una vez los hayamos identificado, deberemos construir nuestra expresión tal y como hemos comentado anteriormente y que incluya los nombres de las fuentes spam. Finalmente, deberemos pinchar en filtros y en agregar nuevo filtroàPersonalizadoàCampo de filtro: Fuente de Campaña e introducir nuestra expresión REGEX. (Rafa Monferrer, 2016) Un ejemplo de expresión REGEX anti-crawlers sería la que sigue:

REGEX Ejemplo #2

Para Spam debido a Crawler
Fast/-wordpress/-start/.com|top1/-seo/-service/.com|scripted/.com|uptimechecker/.com|uptimebot/.net|rankings/-analytics/.com

 

Suscripción Blog Ingeniando Marketing

¿QUÉ ES UN SEGMENTO EN GOOGLE ANALYTICS?

Los segmentos son, pues, una selección temporal y reversible de los datos. Tanto es así que su principal inconveniente es que cuando se trata de una selección habitual, resulta muy molesto tener que aplicar el segmento en cuestión cada vez que se accede a Analytics. (Rafa Monferrer, 2015) Si desea profundizar más en este tema, les aconsejamos la lectura de los siguientes artículos de Google Supports: Acerca de los segmentos, Aplicar y eliminar segmentos, Remarketing con segmentos, crear segmentos y administrar segmentos.

¿CÓMO USAR UN SEGMENTO PARA ELIMINAR EL SPAM EN GOOGLE ANALYTICS?

Para agregar un segmento debemos dar a la pestaña de informes de nuestro Google Analytics y luego dar a “Agregar Segmento” y en el botón rojo que pone “Crear Segmento”.

Segmento para controlar el Spam en Google Analytics

Una vez en esa pantalla, debemos dar a opciones avanzadas y poner dos filtros, tal y como hacíamos en los filtros, uno para incluir la expresión REGEX anti-spam Ghost y otro para excluir una expresión REGEX anti-spam crawler, es decir, para incluir nuestros hostname válidos y para excluir los dominios crawler spam. Para más información ver la figura 3 de este post.

Segmento Anti Spam en Google Analytics

Una vez tengamos hecho nuestro filtro con las expresiones REGEX, lo que haremos será comprobar que funciona bien y, en tal caso, guardarlo.

AYÚDANOS A SEGUIR CRECIENDO

Si has llegado hasta aquí seguro que tienes ya una mejor idea de cómo eliminar el spam en Google Analytics. Además, probablemente te estes planteando la lectura de la siguiente sección “¿Cómo etiquetar las campañas de Marketing en Google Analytics?“. Sin embargo, antes de que lo hagas, nos gustaría que hicieras una de las siguientes acciones para demostrar que te ha gustado el post.

Compárteme: