UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO/FACULTAD DE CONTADURIA Y ADMINISTRACIÓN

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO/FACULTAD DE CONTADURIA Y ADMINISTRACIÓN

Métodos Cuantitativos Aplicados a la Administración

Dr.Carlos Rodríguez

Autores: Lorena Mercado Trejo y Jorge Ramiro Huerta Martínez

“Hogares que disponen de conexión a Internet por entidad federativa en México en áreas urbano y rural”

El siguiente reporte presenta un panorama general sobre el acceso a internet en los hogares mexicanos, considerando su ubicación geográfica. Con base en la Encuesta Nacional sobre Disponibilidad y Uso de Tecnologías de la Información en los Hogares (ENDUTIH) 2018, realizada por el Instituto Nacional de Estadística y Geografía (INEGI).

OBJETIVO:

El siguiente análisis tiene como propósito identificar la proporción de los hogares por entidad federativa, con base en la región en que se ubican (Norte, Centro y Sur) así como la zona a la que pertenecen (Rural y Urbana), con la finalidad de determinar el mercado potencial para ventas online.

Consideramos que los resultados de dicho análisis probablemente confirmen que los hogares que se encuentran en: CDMX, Estado de México y Nuevo León, (tomando en consideración que son Estados con mayor desarrollo en infraestructura) independientemente de si se ubican en zona urbana o rural son un mercado con mayores posibilidades para las ventas online.

Es importante mencionar que los datos analizados son proporcionales por cada entidad.

library("readxl")
## Warning: package 'readxl' was built under R version 3.5.3
Datos_Inegi <- read_excel("~/MCAA/Datos Inegi.xlsx")
View(Datos_Inegi)
Datos_Inegi <- Datos_Inegi [c(1:7)]
names(Datos_Inegi) <-c ("Estado", "Zona", "Total", "sidisponenurbano", "nodisponenurbano", "sidisponenrural", "nodisponenrural")
str(Datos_Inegi)
## Classes 'tbl_df', 'tbl' and 'data.frame':    32 obs. of  7 variables:
##  $ Estado          : chr  "Aguascalientes" "Baja California" "Baja California Sur" "Campeche" ...
##  $ Zona            : chr  "Centro" "Norte" "Norte" "Sur" ...
##  $ Total           : num  100 100 100 100 100 100 100 100 100 100 ...
##  $ sidisponenurbano: num  51.6 70 66.8 46.7 55.2 ...
##  $ nodisponenurbano: num  30.6 22.9 18.1 28.5 35.6 ...
##  $ sidisponenrural : num  6.35 3.17 7.55 4.65 1.36 ...
##  $ nodisponenrural : num  11.51 3.98 7.49 20.17 7.84 ...
Datos_Inegi$Estado <- as.factor(Datos_Inegi$Zona)
Datos_Inegi$Estado <- as.factor(Datos_Inegi$sidisponenurbano)
Datos_Inegi$Estado <- as.factor(Datos_Inegi$sidisponenrural)
Datos_Inegi$Estado <- as.factor(Datos_Inegi$nodisponenurbano)
Datos_Inegi$Estado <- as.factor(Datos_Inegi$nodisponenrural)
library(ggplot2)
ggplot(data=Datos_Inegi, aes(x=Zona))+geom_bar()

#La gráfica anterior muestra el número total de Estados que integra cada zona: Centro:14 Norte:10 Sur:8


#Zona geográfica de total de hogares que disponen de conexión a internet

Datos_Inegi[Datos_Inegi$sidisponenurbano > 32, c("Estado", "sidisponenurbano")]
## # A tibble: 26 x 2
##    Estado            sidisponenurbano
##    <fct>                        <dbl>
##  1 11.5098967930095              51.6
##  2 3.98235649962067              70.0
##  3 7.49411118090452              66.8
##  4 20.1682508467169              46.7
##  5 7.84218008972061              55.2
##  6 7.37298851570214              57.0
##  7 13.2575011258726              51.1
##  8 0.305766911332039             72.2
##  9 22.6171042829979              42.2
## 10 21.5143736559387              41.2
## # ... with 16 more rows
Datos_Inegi$Estado <- rev(factor(Datos_Inegi$Estado, levels = Datos_Inegi$Estado))
library("ggplot2")

ggplot (Datos_Inegi, aes(x=Zona, y=sidisponenurbano)) + 
  geom_bar(stat="identity", width=.5, fill="darkblue") +
  labs(title="Zonas urbanas que si disponen de internet") +
  coord_flip()

#La gráfica anterior muestra que la zona Centro-Urbano concentra el mayor número de hogares con conexión a internet.  

ggplot (Datos_Inegi, aes(x=Zona, y=nodisponenurbano)) + 
  geom_bar(stat="identity", width=.5, fill="darkblue") +
  labs(title="Zonas urbanas que no disponen de internet") +
  coord_flip()

#La gráfica anterior muestra que la zona Centro-Urbano concentra el mayor número de hogares que no cuentan con conexión a internet, derivado de que un mayor numero de estados se ubica en ésta.

ggplot (Datos_Inegi, aes(x=Zona, y=sidisponenrural)) + 
  geom_bar(stat="identity", width=.5, fill="darkblue") +
  labs(title="Zonas rurales que si disponen de internet") +
  coord_flip()

#La gráfica anterior muestra que la zona Centro-Rural concentra el mayor número de hogares con conexión a internet. 

ggplot (Datos_Inegi, aes(x=Zona, y=nodisponenrural)) + 
  geom_bar(stat="identity", width=.5, fill="darkblue") +
  labs(title="Zonas rurales que no disponen de internet") +
  coord_flip()

#La gráfica anterior muestra que la zona Centro-Rural y zona Sur-Rural concentran el mayor número de hogares que no cuentan con conexión a internet.

library("readxl")
Datos_Inegi <- read_excel("~/MCAA/Datos Inegi.xlsx")
Datos_Inegi <- Datos_Inegi [c(1:7)]
names(Datos_Inegi) <-c ("Estado", "Zona", "Total", "sidisponenurbano", "nodisponenurbano", "sidisponenrural", "nodisponenrural")
str(Datos_Inegi)
## Classes 'tbl_df', 'tbl' and 'data.frame':    32 obs. of  7 variables:
##  $ Estado          : chr  "Aguascalientes" "Baja California" "Baja California Sur" "Campeche" ...
##  $ Zona            : chr  "Centro" "Norte" "Norte" "Sur" ...
##  $ Total           : num  100 100 100 100 100 100 100 100 100 100 ...
##  $ sidisponenurbano: num  51.6 70 66.8 46.7 55.2 ...
##  $ nodisponenurbano: num  30.6 22.9 18.1 28.5 35.6 ...
##  $ sidisponenrural : num  6.35 3.17 7.55 4.65 1.36 ...
##  $ nodisponenrural : num  11.51 3.98 7.49 20.17 7.84 ...
Datos_Inegi$Zona <- as.factor(Datos_Inegi$Zona)
Datos_Inegi$sidisponenurbano <- as.factor(Datos_Inegi$sidisponenurbano)
Datos_Inegi$sidisponenrural <- as.factor(Datos_Inegi$sidisponenrural)
Datos_Inegi$nodisponenurbano <- as.factor(Datos_Inegi$nodisponenurbano)
Datos_Inegi$nodisponenrural <- as.factor(Datos_Inegi$nodisponenrural)


Datos_Inegi[Datos_Inegi$sidisponeurbano > 32, c("Estado", "sidisponenurbano")]
## Warning: Unknown or uninitialised column: 'sidisponeurbano'.
## Warning: Length of logical index must be 1 or 32, not 0
## # A tibble: 0 x 2
## # ... with 2 variables: Estado <chr>, sidisponenurbano <fct>
Datos_Inegi$Estado <- rev(factor(Datos_Inegi$Estado, levels = Datos_Inegi$Estado))

ggplot (Datos_Inegi, aes(x=Zona, y=nodisponenrural, fill=Estado)) + 
  geom_bar(stat="identity", position='dodge', width=.5) +
  labs(title="First 5 Estados que si disponen de internet en zona urbana") +
  coord_flip()

#Gráficas de Barras#
#SI DISPONEN URBANO#

library("readxl")

Datos <- read_excel("~/MCAA/Datos Inegi.xlsx")

Datos <- Datos[c(1:7)]
names(Datos) <- c("Estado", "Zona", "Total", "sidisponenurbano", "nodisponenurbano", "sidisponenrural", "nodisponenrural")


str(Datos)
## Classes 'tbl_df', 'tbl' and 'data.frame':    32 obs. of  7 variables:
##  $ Estado          : chr  "Aguascalientes" "Baja California" "Baja California Sur" "Campeche" ...
##  $ Zona            : chr  "Centro" "Norte" "Norte" "Sur" ...
##  $ Total           : num  100 100 100 100 100 100 100 100 100 100 ...
##  $ sidisponenurbano: num  51.6 70 66.8 46.7 55.2 ...
##  $ nodisponenurbano: num  30.6 22.9 18.1 28.5 35.6 ...
##  $ sidisponenrural : num  6.35 3.17 7.55 4.65 1.36 ...
##  $ nodisponenrural : num  11.51 3.98 7.49 20.17 7.84 ...
Datos$Estado <- as.factor(Datos$Estado)
Datos$Zona <- as.factor(Datos$Zona)


head(Datos)
## # A tibble: 6 x 7
##   Estado Zona  Total sidisponenurbano nodisponenurbano sidisponenrural
##   <fct>  <fct> <dbl>            <dbl>            <dbl>           <dbl>
## 1 Aguas~ Cent~  100              51.6             30.6            6.35
## 2 Baja ~ Norte  100.             70.0             22.9            3.17
## 3 Baja ~ Norte  100              66.8             18.1            7.55
## 4 Campe~ Sur    100              46.7             28.5            4.65
## 5 Coahu~ Norte  100              55.2             35.6            1.36
## 6 Colima Cent~  100.             57.0             31.8            3.86
## # ... with 1 more variable: nodisponenrural <dbl>
tail(Datos)
## # A tibble: 6 x 7
##   Estado Zona  Total sidisponenurbano nodisponenurbano sidisponenrural
##   <fct>  <fct> <dbl>            <dbl>            <dbl>           <dbl>
## 1 Tabas~ Sur    100              33.3             25.2           11.5 
## 2 Tamau~ Norte  100              53.8             33.6            2.51
## 3 Tlaxc~ Cent~  100              31.7             49.9            2.46
## 4 Verac~ Sur    100              31.3             32.4            4.09
## 5 Yucat~ Sur    100.             47.8             37.1            2.63
## 6 Zacat~ Norte  100              33.7             26.8            7.55
## # ... with 1 more variable: nodisponenrural <dbl>
class(Datos)
## [1] "tbl_df"     "tbl"        "data.frame"
dim(Datos)
## [1] 32  7
ncol(Datos)
## [1] 7
nrow(Datos)
## [1] 32
class(Datos$Estado)
## [1] "factor"
length(Datos$Estado)
## [1] 32
length(Datos$Zona)
## [1] 32
levels(Datos$Zona)
## [1] "Centro" "Norte"  "Sur"
length(levels(Datos$Zona))
## [1] 3
table(Datos$Zona)
## 
## Centro  Norte    Sur 
##     14     10      8
orderForProfit <- order(Datos$sidisponenurbano,decreasing=TRUE)
orderForProfit 
##  [1] 26  9 19 23  2  3 14  6 15  5 28 25  1  8 17 22 31  4 10 11 16 18 21
## [24] 24 32 27 29 30 12 13 20  7
first10byProfit <- Datos[orderForProfit[c(1:5)],c("Estado","Zona","sidisponenurbano")]
first10byProfit
## # A tibble: 5 x 3
##   Estado           Zona   sidisponenurbano
##   <fct>            <fct>             <dbl>
## 1 Sonora           Norte              73.2
## 2 Ciudad de México Centro             72.2
## 3 Nuevo León       Norte              70.8
## 4 Quintana Roo     Sur                70.4
## 5 Baja California  Norte              70.0
library("ggplot2")


first10byProfit$sidisponenurbano <- rev(factor(first10byProfit$sidisponenurbano, levels = first10byProfit$sidisponenurbano))


ggplot(first10byProfit, aes(x=Estado, y=sidisponenurbano,fill=Zona)) + 
  geom_bar(stat="identity") +
  scale_fill_manual(values=c("red", "#3300FF","#00CC00", "#3300FF", "#3300FF"))

#La gráfica anterior muestra que en zonas Urbanas las 5 principales entidades con conexión a internet son las siguientes: Baja California, CDMX, Nuevo León, Quintana Roo, Sonora.


#NO DISPONEN URBANO#

table(Datos$Zona)
## 
## Centro  Norte    Sur 
##     14     10      8
orderForProfit <- order(Datos$nodisponenurbano,decreasing=TRUE)
orderForProfit 
##  [1] 29 31 21  5 17  8 28  7 30  6 18 24 15  1 16 11 12 14  4 13  9 32 10
## [24] 20 27 19  2 22 25 23  3 26
first10byProfit <- Datos[orderForProfit[c(1:5)],c("Estado","Zona","nodisponenurbano")]
first10byProfit
## # A tibble: 5 x 3
##   Estado               Zona   nodisponenurbano
##   <fct>                <fct>             <dbl>
## 1 Tlaxcala             Centro             49.9
## 2 Yucatán              Sur                37.1
## 3 Puebla               Centro             35.8
## 4 Coahuila de Zaragoza Norte              35.6
## 5 Morelos              Centro             34.4
library("ggplot2")


first10byProfit$nodisponenurbano <- rev(factor(first10byProfit$nodisponenurbano, levels = first10byProfit$nodisponenurbano))


ggplot(first10byProfit, aes(x=Estado, y=nodisponenurbano,fill=Zona)) + 
  geom_bar(stat="identity") +
  scale_fill_manual(values=c("red", "#3300FF","#00CC00", "#3300FF", "#3300FF"))

#La gráfica anterior muestra que en zonas Urbanas las 5 principales entidades donde los hogares no disponen de conexión son las siguientes: Coahuila, Morelos, Puebla, Tlaxcala y Yucatán. 


#NO DISPONEN RURAL·

table(Datos$Zona)
## 
## Centro  Norte    Sur 
##     14     10      8
orderForProfit <- order(Datos$nodisponenrural,decreasing=TRUE)
orderForProfit 
##  [1] 20  7 12 13 30 32 24 27 18 16 21 10 22 11  4 29 25  8 31  1 17 28 15
## [24] 14  5  3  6 23 26  2 19  9
first10byProfit <- Datos[orderForProfit[c(1:5)],c("Estado","Zona","nodisponenrural")]
first10byProfit
## # A tibble: 5 x 3
##   Estado                          Zona   nodisponenrural
##   <fct>                           <fct>            <dbl>
## 1 Oaxaca                          Sur               45.3
## 2 Chiapas                         Sur               42.1
## 3 Guerrero                        Sur               35.3
## 4 Hidalgo                         Centro            34.4
## 5 Veracruz de Ignacio de la Llave Sur               32.2
library("ggplot2")


first10byProfit$nodisponenrural <- rev(factor(first10byProfit$nodisponenrural, levels = first10byProfit$nodisponenrural))


ggplot(first10byProfit, aes(x=Estado, y=nodisponenrural,fill=Zona)) + 
  geom_bar(stat="identity") +
  scale_fill_manual(values=c("red", "#3300FF","#00CC00", "#3300FF", "#3300FF"))

#La gráfica anterior muestra que en zonas Rurales las 5 principales entidades donde los hogares no disponen de conexión son las siguientes: Chiapas, Guerrero, Hidalgo, Oaxaca y Veracruz.


#SI DISPONEN RURAL#


table(Datos$Zona)
## 
## Centro  Norte    Sur 
##     14     10      8
orderForProfit <- order(Datos$sidisponenrural,decreasing=TRUE)
orderForProfit 
##  [1] 27 25 13 10 26 32  3 11  1 22  7 17 20 12 16  4 30  6 23 18 14 21  2
## [24] 31 28 29 15 24 19  8  5  9
first10byProfit <- Datos[orderForProfit[c(1:5)],c("Estado","Zona","sidisponenrural")]
first10byProfit
## # A tibble: 5 x 3
##   Estado  Zona   sidisponenrural
##   <fct>   <fct>            <dbl>
## 1 Tabasco Sur              11.5 
## 2 Sinaloa Norte            10.7 
## 3 Hidalgo Centro           10.3 
## 4 Durango Norte             8.66
## 5 Sonora  Norte             8.17
library("ggplot2")


first10byProfit$sidisponenrural <- rev(factor(first10byProfit$sidisponenrural, levels = first10byProfit$sidisponenrural))


ggplot(first10byProfit, aes(x=Estado, y=sidisponenrural,fill=Zona)) + 
  geom_bar(stat="identity") +
  scale_fill_manual(values=c("red", "#3300FF","#00CC00", "#3300FF", "#3300FF"))

#La gráfica anterior muestra que en zonas Rurales las 5 principales entidades donde los hogares no disponen de conexión son las siguientes: Chiapas, Guerrero, Hidalgo, Oaxaca y Veracruz.

En cuanto a la disponibilidad de conexiones a Internet, los resultados generales confirman que ésta se concentran en las zonas Centro-Urbanas, en las cuales se encuentran los Estados con el mayor número de población en el país.

Derivado de los datos analizados, y sus respectivas proporciones, podemos concluir que las entidades en zona rural con mayor potencial para ventas online son las siguientes: Sonora. Durango, Hidalgo, Sinaloa y Tabasco.

Conforme a los datos analizados, y sus respectivas proporciones, podemos concluir que las entidades en zona urbana con mayor potencial para ventas online son las siguientes: Baja California, CDMX, Nuevo León, Quintana Roo, Sonora. No obstante Sonora es la única entidad en la cual sin importar si el hogar se encuentra en zona urbana o rural cuentan con una proporción mayor con conexión, en comparación con el resto de las entidades.

Por otro lado, en las Zonas rurales es aproximadente 4 veces mayor la proporción de hogares que no cuenta con acceso a internet, en comparación con los hogares que sí disponen, en este sentido las principales entidades sin conexión a internet son: Chiapas, Guerrero, Oaxaca, Veracruz e Hidalgo mismas que se encuentran en la zona Sur y Centro respectivamente.