Paquetes de R indispensables para Analytics
- Intro
- Paquetes R
- Analytics
- Versión corta
Si usted está interesado en Analytics es indispensable no solo tener un buen conocimiento de estadística y manejo de datos, sino también conocer al menos un software especializado.
De acuerdo a la encuesta anual realizada por el sitio especializado en Analytics y Big Data KDNuggets, los programas de análisis y minería de datos más populares en 2015 fueron: R, RapidMiner, SQL, Python y Excel.
De manera similar la empresa de consultoría en Analytics REXER realiza otra encuesta anual cuya última edición (2015) presentó el los siguientes resultados:
Donde R es el claro ganador, seguido de SPSS y SAS (y JMP).
Como lo he expresado en otros posts, tengo gran inclinación hacia R y JMP (una ramificación de SAS un poco menos complejo y por más económico).
Dado que R es el más popular, es gratuito y de gran difusión, dedicaré varias entradas del blog a este tópico, explicando cómo usarlo y cómo integrarlo con otras aplicaciones en particular de simulación.
A continuación se presentan algunos de los paquetes básicos para utilizar R en el análisis, manipulación y representación de datos.
Qué es un paquete de R?
Los paquetes son compilaciones de funciones propias de R (u otros lenguajes compilados en librerías) que al unirse pueden ser procesos específicos bien sea de manipulación de datos, análisis, gráficas, etc. Al igual que R, los paquetes son gratuitos y de acceso público (usualmente).
El lugar donde se almacenan los paquetes en el computador local se llama librería.
La versión estandar de R viene normalmente con una serie de paquetes básicos, sin embargo si se requiere de operaciones y/o análisis más complejos, es necesario instalar nuevos paquetes.
Un paquete se instala usando el siguiente comando (nombre del paquete entre comillas):
1 |
install.packages('nombre') |
El siguiente infographics realizado por el sitio especializado Analytics Vidhya presenta una lista de paquetes indispensables para realizar Analytics: Todos ellos muy relevantes y recomendados. Adicionalmente sugiero los siguientes: El lector puede copiar y pegar el siguiente código en R o RStudio para instalar todos estos paquetes en secuencia.
Para los interesados en simulación la técnica de montecarlo les recomiendo los siguientes links: Una lista adicional puede ser encontrada en la el sitio KDnuggets donde se identifican los 20 paquetes más populares en descargas en R durante el 2015 algunos de ellos se encuentran dentro del listado anterior (ver link).Paquetes recomendados para hacer Analytics
Instale todos estos paquetes con solo copiar y pegar el siguiente código en su línea de comandos de R (o su IDE).
1 |
source('http://agiltools.com/R/rp.R') |