Analytics

analytics

Qué es Analytics?

Analytics es el análisis sistémico de datos que permite obtener información relevante a un objeto de estudio. El objeto es muy amplio y según el campo de aplicación puede tratarse de las ventas de una empresa, las visitas a una página web, los hábitos de consumo de una población, los comportamientos en redes sociales, etc.

La aplicación de Anlyicis implica combinar muchas actividades y habilidades, desde la obtención y manipulación de la información, la aplicación de técnicas estadísticas y matemáticas, y la elaboración de modelos inteligentes para el tratamiento de información y la generación de reportes.

La organización INFORMS tiene una comunidad especializada en este tema. En su portal, realizan una definición de este concepto dividida en tres tópicos:

  1. Analytics descriptivo
    1. Preparar y analizar datos históricos
    2. Identificar patrones de muestras históricas
  2. Analytics predictivo
    1. Establecer probabilidades y tendencias futuras
    2. Hallar relaciones en los datos que no son fácilmente identificables en la fase descriptiva
  3. Analytics prescriptivo
    1. Evaluar y determinar nuevas formas formas de operar
    2. Identificar objetivos estratégicos del negocio
    3. Balancear restricciones

Breve historia de Analytics

El término Analytics fue introducido a finales de los 90's por la organización INFORMS como una evolución de la minería de datos, programacióninteligrancia de negocios (business intelligence), sin embargo alcanzó su popularidad solo hasta la priméra década del 2000 cuando google lanza su plataforma Google Analytics a finales de 2005 (ver link). A partir de entonces ha existido una confusión constante en términos pues el concepto de Analytics es mucho más amplio que el análisis de tráfico en sitios web aunque se aplica en su totalidad a este campo.Hoy en día el término Analytics es muy popular aunque se confunde en ocasiones con otros muy populares como Big Data y Data Science. Todos ellos estan muy relacionados; Big Data consiste en la aplicación de Analytics a grandes volúmenes de datos y Data Science es una disciplina que intenta incorporar Analytics a aplicaciones epecíficas de negocios.

Analytics en español

En español se suele utilizar el mismo término (Analytics), sin embargo, en los últimos años algunos autores y académicos han comenzado a utilizar la palabra Analítica para definir esta disciplina. Yo prefiero segirla llamando Analytics pues sigue siendo el estandard internacional.

Disciplinas

Para trabajar en el campo de Analytics es necesario combinar las siguientes disciplinas y habilidades técnicas:

  • Estadística
  • Matemáticas
  • Bases de datos
  • Lenguajes de programación (C#, C++, Java y/o Python)
  • Software especializado (Ver link)
  • Conocimiento del negocio analizado (se requiere de un conocimiento sobre el campo aplicado para poder dirigir la exploración de datos).

Aplicaciones

Las técnicas de Analytics pueden ser aplicadas a diferentes campos. A continuación se presentan varios ejemplos.

  • Ventas por retail
  • Pricing (gestión de ingresos)
  • Recursos humanos
  • Finanzas
  • Economía
  • Logística
  • Control de tráfico
  • etc.

Software

Existen varios software utilizados en Analyicis. Los más populares son R y Python (lenguajes de programación), SPSS (IBM), SAS, Excel, Matlab, etc.

Varias empresas especializadas en la evolución del Analytics realizan estudios periódicos entre los expertos en el tema para determinar cuál es la herramienta más utilizada, una de ellas es Rexter Analytics quien publica sus resultados anualmente. En su última encuesta se presentaron las siguientes herramientas como las preferidas de los expertos en Analytics.

fig_6b_rexersurveyalltools2015

En esta encuesta el lenguaje de programación R se presenta como la herramienta más popular. Esto no significa que las demás herramientas no sean útiles, de hecho yo he trabajado con Python, SPSS, Excel, Matlab, Stadistica y Stata, logrando obtener buenos resultados también.

En este blog haré mucho énfasis en R pues es el lenguaje que utilizo actualmente y pues en él encuentro muchas ventajas para la divulgación (entre otras el hecho de ser gratuito).