Incluiremos a R en la caja de herramientas de la planificación estratégica. Para obtener información básica sobreR y su hstoria puede visitar wikipedia. Para instalarlo debe ir a R-CRAN.
Todos los procedimientos pueden hacerse usando el GUI (Grafical User Interface) básico de R. No obstante, he comprado que las persons que se inician en el programa tienen una experiencia más grata empleando RStudio por lo que es bueno que baje también esta interface para R.
R-Gui (un tanto desactualizada) :
¿Por qué usar R en el análisis de datos para la planificación estratégica?
Las dos mayores desventajas de R, en mi opinión:
R es un lenguaje que se interpreta: el sistema procesa las instrucciones tipeadas por el usario, bien directamente, usando la cónsola, o a través de scripts (archivos de códigos) que sube a R. Ejemplo de una instrucción (o comando). Familiaricémosno con la interface RStudio:
RStudio:
Se muestra una cónsola inicial. Cuando empezamos a trabajar, se podría tener una imagen algo parecida a esta:
Sesión de trabajo: RStudio:
La cónsola se ha reducido para dar cabida a una ventana que nos permite crear scripts. El área de trabajo tiene, en esta oportunidad datos que se han almacenado. En la cónsola están lo comandos que han dado como resultado la gráfica de la derecha.
Tenga en cuenta que la versión actual de RStudio presenta algunos cambios con respecto a las dos imágenes que se muestran
Iniciemos entonces el uso de este programa. Quiero que R construya y almacene un vector con las edades de diez personas:
c(23, 24, 23, 21, 22, 23, 24,19, 21, 19)
## [1] 23 24 23 21 22 23 24 19 21 19
Note que todo vector de datos en R debe empezar con la letra c (función concatenar). Si no lo hace, R no sabrá qué hacer con los números que usted ha escrito. Para ejecutar esta instrucción usted puede emplear distintos caminos. Empleemos la opción “Run”.
Cuando instruye a R con Run, la información se despliega en la cónsola. R ejecuta la instrucción, pero no la guarda. Esto es así, porque usted no ha instruído a R para que guarde la información. Para ello, debe darle un nombre. Sugiero que ee nombre, en la medida de lo posible guarde relación con la información que guarda. Yo le voy a poner “edades”, sin las comillas. Empleo el símbolo de asignacion ‘<-’. De nuevo, sin comillas:
edades <-c(23, 24, 23, 21, 22, 23, 24,19, 21, 19)
En esta ocasión, al pinchar en Run, no ocurre nada…aparentemente. Fíjese en el área de trabajo. R guardó el vector. Escriba en la cónsola el nombre que le puso a su vector y presione enter ¿ué ocurre?
Su turno:
Usted trabaja en una agencia de turismo. Le han pedido crear paquetes turísticos para los Estados Unidos. Antes de diseñar y promocionar esos paquetes usted necesita información para saber qué tiene que ofertar y cómo hacerlo. Le llegó la siguiente data: USArrests que contiene la tasa de crímenes violentos en Estados Unidos, según estado.
El primer paso será siempre: familiarizarse con la data
head(USArrests)
## Murder Assault UrbanPop Rape
## Alabama 13.2 236 58 21.2
## Alaska 10.0 263 48 44.5
## Arizona 8.1 294 80 31.0
## Arkansas 8.8 190 50 19.5
## California 9.0 276 91 40.6
## Colorado 7.9 204 78 38.7
¿Qué información contiene? ¿Qué nota?
str(USArrests)
## 'data.frame': 50 obs. of 4 variables:
## $ Murder : num 13.2 10 8.1 8.8 9 7.9 3.3 5.9 15.4 17.4 ...
## $ Assault : int 236 263 294 190 276 204 110 238 335 211 ...
## $ UrbanPop: int 58 48 80 50 91 78 77 72 80 60 ...
## $ Rape : num 21.2 44.5 31 19.5 40.6 38.7 11.1 15.8 31.9 25.8 ...
dim(USArrests)
## [1] 50 4