Éste documento permitirá entender el uso de open xlsx dentro de R; para lo cual se usaran datos proporcionados por el Instituto Nacional de Geografía y Estadística (INEGI), relacionados con la Población que no dispone de telefonía celular en México, con información de los periodos 2015 y 2016, de conformidad a la Encuesta Nacional sobre Disponibilidad y uso de TIC en Hogares (ENDUTIH) .
Para poder comprender el desarrollo de este trabajo, es necesario definir conceptos básicos y que son parte importante para su entendimiento.
La primera pregunta crucial es definir ¿Qué es R?: R es un sistema, con su propio lenguaje de programación, para realizar análisis estadísticos y gráficos creado por Ross Ihaka y Robert Gentleman.
R es de acceso abierto, se distribuye gratuitamente y está disponible en diferentes formas según la necesidad del equipo de cómputo, es decir está disponible para máquinas Unix y Linux; así como para Windows, Macintosh y Alpha Unix.1
Los archivos necesarios para instalar R, se distribuyen desde el sitio de internet Comprehensive R Archive Network (CRAN), su dirección de internet es la siguiente: https://cran.r-project.org/
Un elemento esencial para entender este manual, es la plataforma en la cual trabajaremos, la cual se llama RStudio, el cual es un entorno de desarrollo integrado (IDE) para R (lenguaje de programación). Incluye una consola, editor de sintaxis que apoya la ejecución de código, así como herramientas para el trazado, la depuración y la gestión del espacio de trabajo.
RStudio tiene la misión de proporcionar el entorno informático estadístico R. Permite un análisis y desarrollo para que cualquiera pueda analizar los datos con R. 2
Dentro de R tendremos que utilizar diversos paquetes que nos permitirán manipular, leer y graficar bases de datos de acuerdo a los comandos que ejecutemos; para efectos de este manual, nos centraremos en el uso de openxlsx.
Openxlsx, es un paquete dentro de R, que nos permite leer, escribir y editar archivos xlsx.
Simplifica la creación de archivos .xlsx de Excel proporcionando una interfaz de alto nivel para escribir, diseñar y editar hojas de cálculo. Mediante el uso de ‘Rcpp’, los tiempos de lectura / escritura son comparables a los paquetes ‘xlsx’ y ‘XLConnect’ con el beneficio añadido de eliminar la dependencia de Java. 3
Nota: Las referencias se pueden observar al final del documento
Para llevar a cabo la instalación de Open xlsx, ésta se puede desarrollar de dos formas:
Forma 1
Instalación del paquete Open xlsx en Rstudio, a través de los comandos:
install.packages ("openxlsx")
library (openxlsx)
require (openxlsx)
Forma 2
Otra forma de instalarlo a través de RStudio, es en el apartado de “Packages”, en su opción “Install”, y refiriendo el nombre del paquete openxlsx.
Posterior a su carga, se debe visulizar en el listado de Paquetes el nombre del paquete openxlsx.
Del mismo modo para el desarrollo de este proyecto, utilizaremos paquetes adicionales los cuales son los siguientes:
Estos paquetes conforman nuestra “library”, la cual llamaremos cuando deseemos utilizar el paquete correspondiente.
library (openxlsx)
library (ggplot2)
library (gridExtra)
Para abrir una base de datos de excel, en Rstudio, primero debemos estar seguros que ya hayamos seleccionado el paquete openxlsx, posterior a ello, le vamos a generar una función para leer la base de datos que deseemos trabajar, para lo cual utilizaremos la función:
Ejemplo:
library(openxlsx)
INEGI=read.xlsx("C:/Users/Héctor Hernández/Documents/MBA/INEGI_no_celular.xlsx", sheet = "2016")
INEGI
## Causa.de.no.disponibilidad Población
## 1 Incosteable 6927865
## 2 No necesita 9738158
## 3 No hay servicio 1468466
## 4 Seguridad 683874
## 5 Dependiente económico 3072607
## 6 Otra 7125677
En este ejemplo, decidimos referenciar a nuestra base de datos como INEGI; dentro de la instrucción de nuestro comando, debemos poner la ubicación del archivo, en este caso esta en el disco local de la computadora, es por ello que se visualiza la dirección de la forma siguiente:
Para que el comando se ejecute correctamente, debemos asegurarnos que el sentido de las líneas sea éste /. Así como agregar el nombre del archivo tal cual lo tenemos guardado, e incluir el .xlsx al final.
Para seleccionar la hoja de excel que vamos a trabajar de ese archivo, debemos especificarlo indicando su nombre en sheet=,en este caso nuestra hoja de excel se llama “2016”.
A continuanión se desarrolla el análisis de los datos, partiendo de manera inicial que los datos que tenemos son categóricos y numéricos.
Datos Categóricos
Esto se debe a que los resultados de la enuesta respecto a las causas de no disponibilidad de telefonía celular en México, fueron agrupadas de la forma siguiente:
Serie y Punto fijo del Tiempo
Otra clasificación de nuestros datos presentados, es la Serie de Tiempo, ya que ésta abarca información recopilada desde mayo de 2015 y mayo de 2016, observando las variaciones en cada categoría que identificó la encuesta.
Aunado a ello, también podríamos clasificar nuestros datos en un Punto fijo del tiempo, al enfocarnos en los resultados anuales de cada encuesta.
Presentación de los datos
Derivado que nuestros datos categóricos, utilizaremos el paquete “gridExtra”, para poder represntar en una tabla la información a estudiar, para lo cual se deben seguir los pasos siguientes:
# 1. Debemos llamar al paquete a usar, mediante el comando de library
library(gridExtra)
# 2. Vamos a generar la base de datos, a la cual denominamos "TABINEGI", y le damos la instrucción que la represente como una tabla con el comando "as.table", y para la cual referimos entre paréntesis los datos que integran cada columna.
TABINEGI <- as.table(cbind(c(9160663,6927865),c(11172839,9738158),c(1518312,1468466),c(0,683874),c(0,3072607),c(9174155,7125677)))
# 3. Posterior a ello, tenemos que realizar la denominación de los nombres de cada fila y columna.
dimnames(TABINEGI) <- list(Año=c("2015","2016"),Causas=c("Caro","No necesita","No red","Seguridad","Depend.económ.","Otra"))
# 4. Por último damos la instrucción que se genere visulamente mediante los comandos que se señalan:
plot.new()
grid.table(TABINEGI)
TABINEGI
## Causas
## Año Caro No necesita No red Seguridad Depend.económ. Otra
## 2015 9160663 11172839 1518312 0 0 9174155
## 2016 6927865 9738158 1468466 683874 3072607 7125677
# Indicamos el título y subtítulo de nuestra representación gráfica.
title(main="Causas de no disponibilidad de telefonía celular", col.main="green", sub="Datos de la ENDUTIH 2016, INEGI", col.sub="red", cex.sub=0.7)
Otra forma de representar los datos, es mediante un diagrama de Asociación, el cual se puede generar siguiendo los pasos siguientes:
# 1. Necesitamos usa el comando "assocplot", y referir nuestra tabla que hemos trabajado previamente y a la cual denominamos "TABINEGI", para esta representación es necesario la selección de colores, para que se pueda representar las diferencias por varibles.
assocplot(TABINEGI, col=c("blue","orange"))
# 2. Del mismo modo con el comando "title" especificamos las características de nuestro texto en el diagrama.
title(main="Causas de no disponibilidad de telefonía celular", col.main="darkgreen", sub="Datos de la ENDUTIH 2015 y 2016, INEGI", col.sub="darkorange", cex.sub=0.9)
Otra forma de representar estos datos categóricos, es a través del diagrama de espina o Spine Plot, el cual se puede realizar ejecutando el comando de “spineplot” y refiriendo nuestra tabla.
# 1. Ejecutar el comando (considerando que previamente, ya construimos nuestra tabla denominada TABINEGI)
spineplot(TABINEGI, col=c("purple","violet"))
# 2. Incluimos los detalles del texto para la interpretación del diagrama
title(main="Causas de no disponibilidad de telefonía celular", col.main="darkblue", sub="Datos de la ENDUTIH 2015 y 2016, INEGI", col.sub="red", cex.sub=0.9)
A continuación se muestra una Gráfica de Barras, en la cual se puede apreciar la agrupación del 100% de los resultados arrojados en 2015 y en 2016.
# Gráfica de Barras
# Resultados del 2015
## 1.- Iniciamos al seleccionar el paquete con el cual decidimos abrir el archivo, en este caso es openxlsx
library(openxlsx)
INEGI=read.xlsx("C:/Users/Héctor Hernández/Documents/MBA/INEGI_no_celular.xlsx", sheet = "2016")
INEGI
## Causa.de.no.disponibilidad Población
## 1 Incosteable 6927865
## 2 No necesita 9738158
## 3 No hay servicio 1468466
## 4 Seguridad 683874
## 5 Dependiente económico 3072607
## 6 Otra 7125677
## 2.- Una vez que ya contemos con la base de datos, tenemos que introducir el comando attach, para que podamos manipular la información de la base.
attach(INEGI)
## 3.- Para visualizar nuestra base de datos a trabajar, utilizamos el comando view
View(INEGI)
## 4.- Vamos a sacar el porcentaje de cada tipo de causa por la cual la población no tuvo servicio celular, con la información proporcionada del 2016
Percent <- Población/sum(Población)*100
INEGI <- cbind(INEGI,Percent)
INEGI
## Causa.de.no.disponibilidad Población Percent
## 1 Incosteable 6927865 23.875484
## 2 No necesita 9738158 33.560590
## 3 No hay servicio 1468466 5.060771
## 4 Seguridad 683874 2.356833
## 5 Dependiente económico 3072607 10.589118
## 6 Otra 7125677 24.557203
# Para generar el porcentaje, se tiene que seleccionar la variable a la cual se le va a hacer el cálculo; en este caso seleccionamos la variable de "Población", y en segundo término damos la instrucción que se calcule el porcentaje al 100% de nuestra base denominada INEGI, de la hoja 2016.
# Calculamos el porcentaje, para poder graficar la información.
## 5.- Gráfica de Barras
# Para elaborar la gráfica de barras, seleccionamos nuestro paquete "ggplot2" y usamos el comando "barplot", para el cual damos las especificaciones de cuales columnas debe considerar, y determinamos el redondeo que deseemos, así como la asignación del signo de porcentaje "%".
# Para editar la parte visual de nuestra gráfica, damos las especificaciones sobre la denominación del título y el eje de x y y; asícomo la asignación de los colores que deseamos elegir en nuestra gráfica.
lbls <- paste(Causa.de.no.disponibilidad, ": ",round(Percent,2), " %", sep="")
bp <- barplot (Percent, horiz=TRUE, main="Falta de disponibilidad de servicio celular", ylab="Causa de no disponibilidad", xlab="Población 2016",col=rainbow(length(round(Percent))))
# Aunado a ello indicamos las características de nuestro texto en la gráfica, como su tamaño "cex".
text(0, bp, lbls, cex=.8, pos=4)
## Para graficar la información del 2015, tenemos que cambiar la lectura de nuestro archivo de excel, especificando en qué hoja se encuentran los datos con los cuales realizaremos la gráfica, de tal modo que quedaría de la forma siguiente:
INEGI=read.xlsx("C:/Users/Héctor Hernández/Documents/MBA/INEGI_no_celular.xlsx", sheet = "2015")
attach(INEGI)
## The following objects are masked from INEGI (pos = 3):
##
## Causa.de.no.disponibilidad, Población
Percent <- Población/sum(Población)*100
INEGI <- cbind(INEGI,Percent)
View(INEGI)
lbls <- paste(Causa.de.no.disponibilidad, ": ",round(Percent,2), " %", sep="")
bp <- barplot (Percent, horiz=TRUE, main="Falta de disponibilidad de servicio celular", ylab="Causa de no disponibilidad", xlab="Población 2015",col=rainbow(length(round(Percent))))
text(0, bp, lbls, cex=.8, pos=4)
***
En junio de 2013, el presidente Enrique Peña Nieto promulgó la Reforma Constitucional en Materia de telecomunicaciones y radiodifusión. Desde el primer día de su administración, el presidente Peña Nieto subrayó que el acceso a las Tecnologías de la Información y la Comunicación (TIC) es un elemento fundamental que impulsa la productividad, fortalece el crecimiento y mejora la competitividad de México en el contexto internacional. 4 El uso masivo y la apropiación de estas tecnologías por parte de toda la población también funcionan como piezas esenciales en el desarrollo de la democracia, el acceso a la cultura, a la educación, a la salud, y al ejercicio pleno de los derechos humanos.
Luego de un proceso de diálogo plural del Poder Ejecutivo con las principales fuerzas políticas del país, se tomó la decisión de promover un cambio estructural en el sector de telecomunicaciones que contribuyera a liberar todo el potencial económico de México, al mismo tiempo en que redujera la desigualdad social y generara mayor bienestar para los mexicanos. Contando con la aprobación del Congreso de la Unión, el resultado de dicho proceso quedó plasmado en la Reforma Constitucional de Telecomunicaciones y Radiodifusión que sentó las bases para que México pudiera hacer frente a los nuevos retos del entorno digital global y alcanzar sus objetivos de desarrollo económico y social.
La Reforma impuso condiciones para equilibrar la participación en el mercado y garantizar la competencia. Con ello, logró reordenar la industria y favoreció su crecimiento por medio de la aplicación de una regulación acorde con la evolución de la tecnología y del mercado.
Con la promulgación dela Reforma se tomó un paso fundamental para modernizar y armonizar una industria con años de retraso. Esto se logró por medio de una nueva arquitectura institucional diseñada para establecer condiciones más justas de participación en el mercado y favorecer la competencia.
De esta forma, se transitó de una situación caracterizada por la baja competencia, precios elevados, servicios de mala calidad y bajos niveles de inversión, a un nuevo escenario que ha propiciado el desarrollo de las telecomunicaciones como herramientas de productividad e impulso a la competitividad, y como factores de equidad social.
Antes de la Reforma, la situación prevaleciente en el sector de telecomunicaciones impedía aprovechar su potencial como detonador de progreso en México porque, entre otras cosas,limitaba el acceso de muchos mexicanos a los servicios de telecomunicaciones, como la telefonía móvil.
Los servicios eran de mala calidad y los usuarios pagaban precios elevados por ello. Esto permitía que las empresas con mayor participación en el mercado obtuvieran márgenes de ganancia superiores a los que registraban empresas en otros países. Adicionalmente, la inversión en el desarrollo de la infraestructura de telecomunicaciones era insuficiente para ampliar su cobertura.
La combinación de éstos y otros factores generaba barreras para el ingreso de nuevos competidores, impidiendo así la oferta de más servicios de mejor calidad y la entrada de mayores inversiones. Por consiguiente, el acceso de los mexicanos a los servicios de telecomunicaciones y a las TIC era muy limitado, tanto por sus altos costos como por su insuficiente cobertura.
Las nuevas condiciones de competencia en el mercado establecidas por la Reforma permitieron el ingreso al mercado mexicano de nuevos operadores de telefonía móvil. Ello propició la oferta de nuevos de servicios móviles de mayor calidad y con precios accesibles para un creciente número de usuarios.
En su Tercer Informe Trimestral Estadístico 2016, el Instituto Federal de Telecomunicaciones (IFT) establece que hacia el tercer trimestre de 2016 el Índice de Precios de Comunicaciones mantuvo la tendencia a la baja, con una tasa de inflación anual de -15.4%, y la compara con una tasa de inflación anual de 3% registrada por el Indice Nacional de Precios al Consumidor (INPC) en ese mismo periodo. 5
En el mismo Informe, el IFT indica que los precios de los servicios de telefonía móvil registraron una disminución de casi el 30%. 6
En su informe sobre Las telecomunicaciones a más de tres años de la Reforma Constitucional publicado en el primer trimestre de 2017, el IFT apunta que en 2011, sólo el 7% de la población podía acceder a Internet a través de un dispositivo móvil, mientras que a principios de 2017, el 63% de la población ya tenía Internet de banda ancha móvil en su dispositivo. 7
Por su lado, La Organización para el Crecimiento y Desarrollo Económicos (OCDE) destacó en su Estudio sobre Telecomunicaciones y Radiodifusión en México 2017 de agosto de 2017, que algunas de las canastas de servicios móviles experimentaron, a partir de la implementación de la Reforma, una reducción de más de 65%. 8
La Encuesta Nacional sobre Disponibilidad y Uso de Tecnologías de la Información en los Hogares (ENDUTIH) 2016 del Instituto Nacional de Estadística y Geografía (INEGI) da cuenta de los mayores niveles de acceso y asequibilidad a las Tecnologías de la Información y la Comunicación (TIC) por parte de más mexicanos, al hacer un comparativo de la población que no disponía de telefonía celular entre los años 2015 y 2016. De acuerdo al INEGI el porcentaje de personas sin el servicio de telefonía celular disminuyó casi un 7% de 2015 a 2016.
En números absolutos esto indica que en 2015 un total de 31,025,969 personas no contaban con dicho servicio, mientras que en 2016 este número disminuyó a 29,016,647.
La oferta de nuevos paquetes de servicio a menores precios y con mayores valores agregados, como efecto de la competencia, junto con la asequibilidad a dispositivos más sofisticados y poderosos y el incremento de la infraestructura y de su cobertura pueden explicar otros criterios de la misma encuesta del INEGI, que ofrecen evidencia adicional del incremento de disponibilidad de telefonía móvil entre un mayor número de mexicanos.Según la ENDUTIH 2016, el número de personas que en 2015 consideró los servicios como incosteables, se redujo en un 25% hacia 2016. De igual forma, el número de personas que en 2015 consideraron como no necesario el servicio de telefonía celular se redujo en cerca de 13%. Por último, el número de personas sin disponibilidad del servicio de telefonía celular por falta de infraestructura y cobertura disminuyó en poco más de 3%.
La Reforma de Telecomunicaciones es una de las políticas públicas de mayor impacto y trascendencia en la historia reciente de México. Sus impactos positivos sobre la economía en general y sobre la economía de las familias son innegables.
En congruencia con lo expresado por el presidente Peña Nieto es su discurso de toma de posesión, el presidente de la Junta de Gobierno del INEGI, Julio Santaella, dijo durante la presentación de la ENDUTIH 2016: Es importante tener el conocimiento de qué tanto han penetrado estas tecnologías en los hogares, porque nos facilita el entendimiento de las nuevas vías de comunicación y el nuevo entorno que estamos viviendo. 9
En la ENDUTIH 2016 la entrevista se realiza a un miembro del hogar seleccionado de manera aleatoria, de quien se capta directamente su experiencia sobre el uso de estas tecnologías mediante un cuestionario estructurado. En este sentido, la información es totalmente comparable con la ENDUTIH 2015, que fue el año en que se introdujo este cambio metodológico respecto a lo que se venía realizando de 2001 a 2014 con el Módulo sobre Disponibilidad y Uso de las Tecnologías de la Información en los Hogares (MODUTIH).
En 2015, la ENDUTIH sustituyó al MODUTIH y con ello mejoró el proceso de levantamiento de información sobre la disponibilidad y uso de las TIC en México. Asimismo, la ENDUTIH se posicionó como una de las encuestas más completas a escala mundial en cuanto a la disponibilidad de información útil para el diseño, seguimiento y evaluación de políticas públicas en esta materia.
1 R para Principiantes; Emmanuel Paradis; Institut des Sciencies de’l
Evolution, Universit Montpellier II; France.
2 https://es.wikipedia.org/Xwiki/RStudio
4 “Mensaje a la nación del presidente de los Estados Unidos Mexicanos” (discurso pronunciado en la ciudad de México, 1° de diciembre, 2012).
5 Tercer Informe Anual Estadístico, Instituto Federal de Telecomunicaciones (IFT) http://www.ift.org.mx/sites/default/files/contenidogeneral/estadisticas/3ite16v4.pdf
6 Tercer Informe Anual Estadístico, Instituto Federal de Telecomunicaciones (IFT) http://www.ift.org.mx/sites/default/files/contenidogeneral/estadisticas/3ite16v4.pdf
7 Las telecomunicaciones a más de 3 años de la Reforma Constitucional en México, IFT, http://www.ift.org.mx/sites/default/files/contenidogeneral/estadisticas/analisistelecom1t2017acc.pdf
8 Estudio sobre Telecomunicaciones y Radiodifusión en México 2017, OCDE http://www.oecd.org/publications/estudio-de-la-ocde-sobre-telecomunicaciones-y-radiodifusion-en-mexico-2017-9789264280656-es.htm
9 Comunicado de prensa 122/17 INEGI Secretaría de Comunicaciones y Transportes e IFT, 14 de marzo de 2017.