09 Feb

Paquetes de R indispensables para Analytics

  • Intro
  • Paquetes R
  • Analytics
  • Versión corta

Si usted está interesado en Analytics es indispensable no solo tener un buen conocimiento de estadística y manejo de datos, sino también conocer al menos un software especializado.

De acuerdo a la encuesta anual realizada por el sitio especializado en Analytics y Big Data KDNuggets, los programas de análisis y minería de datos más populares en 2015 fueron: R, RapidMiner, SQL, Python y Excel.

top10-analytics-data-mining-software-2015

De manera similar la empresa de consultoría en Analytics REXER realiza otra encuesta anual cuya última edición (2015) presentó el los siguientes resultados:

fig_6a_rexersurveyprimarytool20151

Donde R es el claro ganador, seguido de SPSS y SAS (y JMP).

Como lo he expresado en otros posts, tengo gran inclinación hacia R y JMP (una ramificación de SAS un poco menos complejo y por más económico).

Dado que R es el más popular, es gratuito y de gran difusión, dedicaré varias entradas del blog a este tópico, explicando cómo usarlo y cómo integrarlo con otras aplicaciones en particular de simulación.

A continuación se presentan algunos de los paquetes básicos para utilizar R en el análisis, manipulación y representación de datos.

Qué es un paquete de R?

Los paquetes son compilaciones de funciones propias de R (u otros lenguajes compilados en librerías) que al unirse pueden ser procesos específicos bien sea de manipulación de datos, análisis, gráficas, etc. Al igual que R, los paquetes son gratuitos y de acceso público (usualmente).

El lugar donde se almacenan los paquetes en el computador local se llama librería.

La versión estandar de R viene normalmente con una serie de paquetes básicos, sin embargo si se requiere de operaciones y/o análisis más complejos, es necesario instalar nuevos paquetes.

Un paquete se instala usando el siguiente comando (nombre del paquete entre comillas):

Paquetes recomendados para hacer Analytics

El siguiente infographics realizado por el sitio especializado Analytics Vidhya presenta una lista de paquetes indispensables para realizar Analytics:

infographics123R

Todos ellos muy relevantes y recomendados. Adicionalmente sugiero los siguientes:

  • qcc: gráficos de control de calidad (quality control charts link)
  • RCurl: descargar información desde direcciones web (link).
  • manipulate: creación de gráficos interactivos en R-Studio (link)

El lector puede copiar y pegar el siguiente código en R o RStudio para instalar todos estos paquetes en secuencia.

Para los interesados en simulación la técnica de montecarlo les recomiendo los siguientes links:

Una lista adicional puede ser encontrada en la el sitio KDnuggets donde se identifican los 20 paquetes más populares en descargas en R durante el 2015 algunos de ellos se encuentran dentro del listado anterior (ver link).

Instale todos estos paquetes con solo copiar y pegar el siguiente código en su línea de comandos de R (o su IDE).

%d bloggers like this: