R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.

R es un programa con la capacidad de procesar información a niveles inimaginables, con él se pueden crear artículos de diferentes tópicos con los más altos estándares de calidad y listos para ser publicados en páginas web, revistas, etc. además utilizando la infinidad de paquetes que se encuentran disponibles para su uso, estos artículos pueden tener al lector con la atención que se desee, esto utilizando imágenes, gráficos y demás atractivos con la ayuda de RMarkdown, para poder realizar uno de estos artículos debes de elegir la opción de crear R Markdown, para mayor referencia ver la siguiente imagen:

Una de las diferentes opciones que tenemos para poder analizar información es a través del uso de archivos de excel, esto se puede realizar a traves del package Openxlsx, para instalar Openxlsx debes de dar click en Packages, posteriormente buscar Openxlsx y dar click en install, para más referencias ver la pantalla siguiente:

Una vez instalado podrás verificar si este se realizó correctamente si en la lista de Packages se encuentra el programa Openxlsx de acuerdo a la pantalla siguiente:

Para poder utilizar el package Openxlsx debemos llamarlo a través del comando:

#library(openxlsx)

Esto se debe realizar a través de los llamados “CHONKS” de la siguiente manera, dar click en Insert y después R, de acuerdo a la pantalla siguiente:

A continuación, se usará el archivo en Excel llamado AficionadosNFL.xlsx a traves de R donde se analizará el incremento de los aficionados de 2015 a 2016 a las 5 franquicias de NFL en México. Ver tabla de Excel de archivo a analizar:

Para iniciar con el análisis del archivo lo debemos llamar a través del siguiente comando:

library(openxlsx)
## Warning: package 'openxlsx' was built under R version 3.4.2

Una vez disponible el package Openxlsx podemos abrir el archivo en Excel llamado AficionadosNFL.xlsx para lo cual utilizamos el siguiente comando:

AFICIONADOSNFL=read.xlsx("C:/Users/vv4888/Desktop/Maestria 2017/Materias/MCAA/R/AficionadosNFL.xlsx", sheet ="2016")

Es importante considerar que la ruta en donde debe de estar el archivo, debe ser la misma de donde se encuentran guardados los scripts, las imágenes y demás archivos que se usan en R, véase la siguiente imagen:

Derivado que nuestros datos categóricos, utilizaremos el paquete “gridExtra”, para poder representar en una tabla la información a estudiar, para lo cual se deben seguir los pasos siguientes:

# 1. Debemos llamar al paquete a usar, mediante el comando de library

library(gridExtra)
## Warning: package 'gridExtra' was built under R version 3.4.2
# 2. Vamos a generar la base de datos, a la cual denominamos "AFICIONADOSNFL", y le damos la instrucción que la represente como una tabla con el comando "as.table", y para la cual referimos entre paréntesis los datos que integran cada columna.

AFICIONADOSNFL<-as.table(cbind(c(4315200,3415200),c(3132000,2932000),c(4579100,4079100),c(3619200,3519200),c(2798500,2598500),c(10556000,9956000)))

# 3. Posterior a ello, tenemos que realizar la denominación de los nombres de cada fila y columna.

dimnames(AFICIONADOSNFL)<-list(Año=c("2015","2016"),Equipos=c("Dallas Cowboys","San Francisco 49ers","Pittsburg Steelers","New England Patriots","Baltimore Ravens","Otros"))

# 4. Por último damos la instrucción que se genere visulamente mediante los comandos que se señalan:

plot.new()
grid.table(AFICIONADOSNFL)
AFICIONADOSNFL
##       Equipos
## Año    Dallas Cowboys San Francisco 49ers Pittsburg Steelers
##   2015        4315200             3132000            4579100
##   2016        3415200             2932000            4079100
##       Equipos
## Año    New England Patriots Baltimore Ravens    Otros
##   2015              3619200          2798500 10556000
##   2016              3519200          2598500  9956000
# Indicamos el título y subtítulo de nuestra representación gráfica.


title(main="EQUIPOS DE LA NFL CON MAS AFICONADOS EN MÉXICO", col.main="green", sub="DEPORTES", col.sub="red", cex.sub=0.7)

Otra forma de representar los datos, es mediante un diagrama de Asociación, el cual se puede generarsiguiendo los pasos siguientes:

# 1. Necesitamos usa el comando "assocplot", y referir nuestra tabla que hemos trabajado previamente y a la cual denominamos "AFICIONADOSNFL", para esta representación es necesario la selección de colores, para que se pueda representar las diferencias por variables.

assocplot(AFICIONADOSNFL,col=c("blue","orange"))

# 2. Del mismo modo con el comando "title" especificamos las características de nuestro texto en el diagrama.

title(main="EQUIPOS DE LA NFL CON MAS AFICONADOS EN MÉXICO", col.main="darkgreen", sub="DEPORTES", col.sub="darkorange", cex.sub=0.9)

Otra forma de representar estos datos categóricos, es a través del diagrama de espina o Spine Plot, el cual se puede realizar ejecutando el comando de “spineplot” y refiriendo nuestra tabla.

# 1. Ejecutar el comando (considerando que previamente, ya construimos nuestra tabla denominada AFICIONADOSNFL)

spineplot(AFICIONADOSNFL, col=c("purple","violet"))

# 2. Incluimos los detalles del texto para la interpretación del diagrama

title(main="EQUIPOS DE LA NFL CON MAS AFICONADOS EN MÉXICO", col.main="darkblue", sub="DEPORTES", col.sub="red", cex.sub=0.9)

A continuación se muestra una Gráfica de Barras, en la cual se puede apreciar la agrupación del 100% de los resultados arrojados en 2015 y en 2016.

# Gráfica de Barras
# Resultados del 2015
## 1.- Iniciamos al seleccionar el paquete con el cual decidimos abrir el archivo, en este caso es openxlsx

library(openxlsx)
AFICIONADOSNFL=read.xlsx("C:/Users/vv4888/Desktop/Maestria 2017/Materias/MCAA/R/AficionadosNFL.xlsx", sheet ="2016")
AFICIONADOSNFL
##                Equipos Aficionados
## 1       Dallas Cowboys     4315200
## 2  San Francisco 49ers     3132000
## 3  Pittsburgh Steelers     4579100
## 4 New England Patriots     3619200
## 5     Baltimore Ravens     2798500
## 6                Otros    10556000
## 2.- Una vez que ya contemos con la base de datos, tenemos que introducir el comando attach, para que podamos manipular la información de la base.

attach(AFICIONADOSNFL)

## 3.- Para visualizar nuestra base de datos a trabajar, utilizamos el comando view

View(AFICIONADOSNFL)

## 4.- Vamos a sacar el porcentaje de cada tipo de causa por la cual la población no tuvo servicio celular, con la información proporcionada del 2016

Percent<-Aficionados/sum(Aficionados)*100
AFICIONADOSNFL<-cbind(Equipos,Percent)
AFICIONADOSNFL
##      Equipos                Percent
## [1,] "Dallas Cowboys"       "14.88"
## [2,] "San Francisco 49ers"  "10.8" 
## [3,] "Pittsburgh Steelers"  "15.79"
## [4,] "New England Patriots" "12.48"
## [5,] "Baltimore Ravens"     "9.65" 
## [6,] "Otros"                "36.4"
# Para generar el porcentaje, se tiene que seleccionar la variable a la cual se le va a hacer el cálculo; en este caso seleccionamos la variable de "Aficionados", y en segundo término damos la instrucción que se calcule el porcentaje al 100% de nuestra base denominada INEGI, de la hoja 2016.

# Calculamos el porcentaje, para poder graficar la información.

## 5.- Gráfica de Barras

# Para elaborar la gráfica de barras, seleccionamos nuestro paquete "ggplot2" y usamos el comando "barplot", para el cual damos las especificaciones de cuales columnas debe considerar, y determinamos el redondeo que deseemos, así como la asignación del signo de porcentaje "%".
# Para editar la parte visual de nuestra gráfica, damos las especificaciones sobre la denominación del título y el eje de x y y; asícomo la asignación de los colores que deseamos elegir en nuestra gráfica.

lbls <-paste(Equipos,": ",round(Percent,2), " %", sep="")

bp <-barplot(Percent,horiz=TRUE,main="Equipos", ylab="Equipos con mas afición en México", xlab="Aficionados 2016",col=rainbow(length(round(Percent))))

# Aunado a ello indicamos las características de nuestro texto en la gráfica, como su tamaño "cex".

text(0, bp, lbls, cex=.8, pos=4)

## Para graficar la información del 2015, tenemos que cambiar la lectura de nuestro archivo de excel, especificando en qué hoja se encuentran los datos con los cuales realizaremos la gráfica,de tal modo que quedaría de la forma siguiente:

AFICIONADOSNFL=read.xlsx("C:/Users/vv4888/Desktop/Maestria 2017/Materias/MCAA/R/AficionadosNFL.xlsx", sheet ="2015")

attach(AFICIONADOSNFL)
## The following objects are masked from AFICIONADOSNFL (pos = 3):
## 
##     Aficionados, Equipos
Percent<-Aficionados/sum(Aficionados)*100
AFICIONADOSNFL<-cbind(Aficionados,Percent)
View(AFICIONADOSNFL)
lbls<-paste(Equipos,":",round(Percent,2),"%",sep="")
bp<-barplot(Percent,horiz=TRUE,main="Equipos",ylab="Equipos con mas afición en México",xlab="Aficionados 2015",col=rainbow(length(round(Percent))))
text(0,bp,lbls,cex=.8,pos=4)