UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO/FACULTAD DE CONTADURIA Y ADMINISTRACIÓN

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO/FACULTAD DE CONTADURIA Y ADMINISTRACIÓN

Métodos Cuantitativos Aplicados a la Administración

Dr.Carlos Rodríguez

Autores: Lorena Mercado Trejo y Jorge Ramiro Huerta Martínez

“Hogares que disponen de conexión a Internet por entidad federativa en México en áreas urbano y rural”

El siguiente reporte presenta un panorama general sobre el acceso a internet en los hogares mexicanos, considerando su ubicación geográfica. Con base en la Encuesta Nacional sobre Disponibilidad y Uso de Tecnologías de la Información en los Hogares (ENDUTIH) 2018, realizada por el Instituto Nacional de Estadística y Geografía (INEGI).

OBJETIVO:

El siguiente análisis tiene como propósito identificar los hogares por entidad federativa, con base en la región en que se ubican (Norte, Centro y Sur) así como a la zona a la que pertenecen (Rural y Urbana), con la finalidad de determinar el mercado potencial para ventas online.

Consideramos que los resultados de dicho análisis confirmarán que los hogares que se encuentran en los Estados ubicados en la zona Centro-Urbano son un mercado con mayores posibilidades para las ventas online en comparación a los hogares ubicados en la zona Sur-Urbano.

library("readxl")
## Warning: package 'readxl' was built under R version 3.5.3
Datos_Inegi <- read_excel("~/MCAA/Datos Inegi.xlsx")
View(Datos_Inegi)
Datos_Inegi <- Datos_Inegi [c(1:7)]
names(Datos_Inegi) <-c ("Estado", "Zona", "Total", "sidisponenurbano", "nodisponenurbano", "sidisponenrural", "nodisponenrural")
str(Datos_Inegi)
## Classes 'tbl_df', 'tbl' and 'data.frame':    32 obs. of  7 variables:
##  $ Estado          : chr  "Aguascalientes" "Baja California" "Baja California Sur" "Campeche" ...
##  $ Zona            : chr  "Centro" "Norte" "Norte" "Sur" ...
##  $ Total           : num  100 100 100 100 100 100 100 100 100 100 ...
##  $ sidisponenurbano: num  51.6 70 66.8 46.7 55.2 ...
##  $ nodisponenurbano: num  30.6 22.9 18.1 28.5 35.6 ...
##  $ sidisponenrural : num  6.35 3.17 7.55 4.65 1.36 ...
##  $ nodisponenrural : num  11.51 3.98 7.49 20.17 7.84 ...
Datos_Inegi$Estado <- as.factor(Datos_Inegi$Zona)
Datos_Inegi$Estado <- as.factor(Datos_Inegi$sidisponenurbano)
Datos_Inegi$Estado <- as.factor(Datos_Inegi$sidisponenrural)
Datos_Inegi$Estado <- as.factor(Datos_Inegi$nodisponenurbano)
Datos_Inegi$Estado <- as.factor(Datos_Inegi$nodisponenrural)
library(ggplot2)
ggplot(data=Datos_Inegi, aes(x=Zona))+geom_bar()

#La gráfica anterior muestra el número total de Estados que integra cada zona: Centro:14 Norte:10 Sur:8


#Zona geográfica de total de hogares que disponen de conexión a internet

Datos_Inegi[Datos_Inegi$sidisponenurbano > 32, c("Estado", "sidisponenurbano")]
## # A tibble: 26 x 2
##    Estado            sidisponenurbano
##    <fct>                        <dbl>
##  1 11.5098967930095              51.6
##  2 3.98235649962067              70.0
##  3 7.49411118090452              66.8
##  4 20.1682508467169              46.7
##  5 7.84218008972061              55.2
##  6 7.37298851570214              57.0
##  7 13.2575011258726              51.1
##  8 0.305766911332039             72.2
##  9 22.6171042829979              42.2
## 10 21.5143736559387              41.2
## # ... with 16 more rows
Datos_Inegi$Estado <- rev(factor(Datos_Inegi$Estado, levels = Datos_Inegi$Estado))
library("ggplot2")

ggplot (Datos_Inegi, aes(x=Zona, y=sidisponenurbano)) + 
  geom_bar(stat="identity", width=.5, fill="darkblue") +
  labs(title="Zonas urbanas que si disponen de internet") +
  coord_flip()

#La gráfica anterior muestra que la zona Centro-Urbano concentra el mayor número de hogares con conexión a internet.  

ggplot (Datos_Inegi, aes(x=Zona, y=nodisponenurbano)) + 
  geom_bar(stat="identity", width=.5, fill="darkblue") +
  labs(title="Zonas urbanas que no disponen de internet") +
  coord_flip()

#La gráfica anterior muestra que la zona Centro-Urbano concentra el mayor número de hogares que no cuentan con conexión a internet, derivado de que un mayor numero de estados se ubica en ésta.

ggplot (Datos_Inegi, aes(x=Zona, y=sidisponenrural)) + 
  geom_bar(stat="identity", width=.5, fill="darkblue") +
  labs(title="Zonas rurales que si disponen de internet") +
  coord_flip()

#La gráfica anterior muestra que la zona Centro-Rural concentra el mayor número de hogares con conexión a internet. 

ggplot (Datos_Inegi, aes(x=Zona, y=nodisponenrural)) + 
  geom_bar(stat="identity", width=.5, fill="darkblue") +
  labs(title="Zonas rurales que no disponen de internet") +
  coord_flip()

#La gráfica anterior muestra que la zona Centro-Rural y zona Sur-Rural concentran el mayor número de hogares que no cuentan con conexión a internet.

library("readxl")
Datos_Inegi <- read_excel("~/MCAA/Datos Inegi.xlsx")
Datos_Inegi <- Datos_Inegi [c(1:7)]
names(Datos_Inegi) <-c ("Estado", "Zona", "Total", "sidisponenurbano", "nodisponenurbano", "sidisponenrural", "nodisponenrural")
str(Datos_Inegi)
## Classes 'tbl_df', 'tbl' and 'data.frame':    32 obs. of  7 variables:
##  $ Estado          : chr  "Aguascalientes" "Baja California" "Baja California Sur" "Campeche" ...
##  $ Zona            : chr  "Centro" "Norte" "Norte" "Sur" ...
##  $ Total           : num  100 100 100 100 100 100 100 100 100 100 ...
##  $ sidisponenurbano: num  51.6 70 66.8 46.7 55.2 ...
##  $ nodisponenurbano: num  30.6 22.9 18.1 28.5 35.6 ...
##  $ sidisponenrural : num  6.35 3.17 7.55 4.65 1.36 ...
##  $ nodisponenrural : num  11.51 3.98 7.49 20.17 7.84 ...
Datos_Inegi$Zona <- as.factor(Datos_Inegi$Zona)
Datos_Inegi$sidisponenurbano <- as.factor(Datos_Inegi$sidisponenurbano)
Datos_Inegi$sidisponenrural <- as.factor(Datos_Inegi$sidisponenrural)
Datos_Inegi$nodisponenurbano <- as.factor(Datos_Inegi$nodisponenurbano)
Datos_Inegi$nodisponenrural <- as.factor(Datos_Inegi$nodisponenrural)


Datos_Inegi[Datos_Inegi$sidisponeurbano > 32, c("Estado", "sidisponenurbano")]
## Warning: Unknown or uninitialised column: 'sidisponeurbano'.
## Warning: Length of logical index must be 1 or 32, not 0
## # A tibble: 0 x 2
## # ... with 2 variables: Estado <chr>, sidisponenurbano <fct>
Datos_Inegi$Estado <- rev(factor(Datos_Inegi$Estado, levels = Datos_Inegi$Estado))

ggplot (Datos_Inegi, aes(x=Zona, y=nodisponenrural, fill=Estado)) + 
  geom_bar(stat="identity", position='dodge', width=.5) +
  labs(title="First 5 Estados que si disponen de internet en zona urbana") +
  coord_flip()

#Gráficas de Barras#
#SI DISPONEN URBANO#

library("readxl")

Datos <- read_excel("~/MCAA/Datos Inegi.xlsx")

Datos <- Datos[c(1:7)]
names(Datos) <- c("Estado", "Zona", "Total", "sidisponenurbano", "nodisponenurbano", "sidisponenrural", "nodisponenrural")


str(Datos)
## Classes 'tbl_df', 'tbl' and 'data.frame':    32 obs. of  7 variables:
##  $ Estado          : chr  "Aguascalientes" "Baja California" "Baja California Sur" "Campeche" ...
##  $ Zona            : chr  "Centro" "Norte" "Norte" "Sur" ...
##  $ Total           : num  100 100 100 100 100 100 100 100 100 100 ...
##  $ sidisponenurbano: num  51.6 70 66.8 46.7 55.2 ...
##  $ nodisponenurbano: num  30.6 22.9 18.1 28.5 35.6 ...
##  $ sidisponenrural : num  6.35 3.17 7.55 4.65 1.36 ...
##  $ nodisponenrural : num  11.51 3.98 7.49 20.17 7.84 ...
Datos$Estado <- as.factor(Datos$Estado)
Datos$Zona <- as.factor(Datos$Zona)


head(Datos)
## # A tibble: 6 x 7
##   Estado Zona  Total sidisponenurbano nodisponenurbano sidisponenrural
##   <fct>  <fct> <dbl>            <dbl>            <dbl>           <dbl>
## 1 Aguas~ Cent~  100              51.6             30.6            6.35
## 2 Baja ~ Norte  100.             70.0             22.9            3.17
## 3 Baja ~ Norte  100              66.8             18.1            7.55
## 4 Campe~ Sur    100              46.7             28.5            4.65
## 5 Coahu~ Norte  100              55.2             35.6            1.36
## 6 Colima Cent~  100.             57.0             31.8            3.86
## # ... with 1 more variable: nodisponenrural <dbl>
tail(Datos)
## # A tibble: 6 x 7
##   Estado Zona  Total sidisponenurbano nodisponenurbano sidisponenrural
##   <fct>  <fct> <dbl>            <dbl>            <dbl>           <dbl>
## 1 Tabas~ Sur    100              33.3             25.2           11.5 
## 2 Tamau~ Norte  100              53.8             33.6            2.51
## 3 Tlaxc~ Cent~  100              31.7             49.9            2.46
## 4 Verac~ Sur    100              31.3             32.4            4.09
## 5 Yucat~ Sur    100.             47.8             37.1            2.63
## 6 Zacat~ Norte  100              33.7             26.8            7.55
## # ... with 1 more variable: nodisponenrural <dbl>
class(Datos)
## [1] "tbl_df"     "tbl"        "data.frame"
dim(Datos)
## [1] 32  7
ncol(Datos)
## [1] 7
nrow(Datos)
## [1] 32
class(Datos$Estado)
## [1] "factor"
length(Datos$Estado)
## [1] 32
length(Datos$Zona)
## [1] 32
levels(Datos$Zona)
## [1] "Centro" "Norte"  "Sur"
length(levels(Datos$Zona))
## [1] 3
table(Datos$Zona)
## 
## Centro  Norte    Sur 
##     14     10      8
orderForProfit <- order(Datos$sidisponenurbano,decreasing=TRUE)
orderForProfit 
##  [1] 26  9 19 23  2  3 14  6 15  5 28 25  1  8 17 22 31  4 10 11 16 18 21
## [24] 24 32 27 29 30 12 13 20  7
first10byProfit <- Datos[orderForProfit[c(1:5)],c("Estado","Zona","sidisponenurbano")]
first10byProfit
## # A tibble: 5 x 3
##   Estado           Zona   sidisponenurbano
##   <fct>            <fct>             <dbl>
## 1 Sonora           Norte              73.2
## 2 Ciudad de México Centro             72.2
## 3 Nuevo León       Norte              70.8
## 4 Quintana Roo     Sur                70.4
## 5 Baja California  Norte              70.0
library("ggplot2")


first10byProfit$sidisponenurbano <- rev(factor(first10byProfit$sidisponenurbano, levels = first10byProfit$sidisponenurbano))


ggplot(first10byProfit, aes(x=Estado, y=sidisponenurbano,fill=Zona)) + 
  geom_bar(stat="identity") +
  scale_fill_manual(values=c("red", "#3300FF","#00CC00", "#3300FF", "#3300FF"))

#La gráfica anterior muestra que en zonas Urbanas las 5 principales entidades con conexión a internet son las siguientes: Baja California, CDMX, Nuevo León, Quintana Roo, Sonora.


#NO DISPONEN URBANO#

table(Datos$Zona)
## 
## Centro  Norte    Sur 
##     14     10      8
orderForProfit <- order(Datos$nodisponenurbano,decreasing=TRUE)
orderForProfit 
##  [1] 29 31 21  5 17  8 28  7 30  6 18 24 15  1 16 11 12 14  4 13  9 32 10
## [24] 20 27 19  2 22 25 23  3 26
first10byProfit <- Datos[orderForProfit[c(1:5)],c("Estado","Zona","nodisponenurbano")]
first10byProfit
## # A tibble: 5 x 3
##   Estado               Zona   nodisponenurbano
##   <fct>                <fct>             <dbl>
## 1 Tlaxcala             Centro             49.9
## 2 Yucatán              Sur                37.1
## 3 Puebla               Centro             35.8
## 4 Coahuila de Zaragoza Norte              35.6
## 5 Morelos              Centro             34.4
library("ggplot2")


first10byProfit$nodisponenurbano <- rev(factor(first10byProfit$nodisponenurbano, levels = first10byProfit$nodisponenurbano))


ggplot(first10byProfit, aes(x=Estado, y=nodisponenurbano,fill=Zona)) + 
  geom_bar(stat="identity") +
  scale_fill_manual(values=c("red", "#3300FF","#00CC00", "#3300FF", "#3300FF"))

#La gráfica anterior muestra que en zonas Urbanas las 5 principales entidades donde los hogares no disponen de conexión son las siguientes: Coahuila, Morelos, Puebla, Tlaxcala y Yucatán. 


#NO DISPONEN RURAL·

table(Datos$Zona)
## 
## Centro  Norte    Sur 
##     14     10      8
orderForProfit <- order(Datos$nodisponenrural,decreasing=TRUE)
orderForProfit 
##  [1] 20  7 12 13 30 32 24 27 18 16 21 10 22 11  4 29 25  8 31  1 17 28 15
## [24] 14  5  3  6 23 26  2 19  9
first10byProfit <- Datos[orderForProfit[c(1:5)],c("Estado","Zona","nodisponenrural")]
first10byProfit
## # A tibble: 5 x 3
##   Estado                          Zona   nodisponenrural
##   <fct>                           <fct>            <dbl>
## 1 Oaxaca                          Sur               45.3
## 2 Chiapas                         Sur               42.1
## 3 Guerrero                        Sur               35.3
## 4 Hidalgo                         Centro            34.4
## 5 Veracruz de Ignacio de la Llave Sur               32.2
library("ggplot2")


first10byProfit$nodisponenrural <- rev(factor(first10byProfit$nodisponenrural, levels = first10byProfit$nodisponenrural))


ggplot(first10byProfit, aes(x=Estado, y=nodisponenrural,fill=Zona)) + 
  geom_bar(stat="identity") +
  scale_fill_manual(values=c("red", "#3300FF","#00CC00", "#3300FF", "#3300FF"))

#La gráfica anterior muestra que en zonas Rurales las 5 principales entidades donde los hogares no disponen de conexión son las siguientes: Chiapas, Guerrero, Hidalgo, Oaxaca y Veracruz.


#SI DISPONEN RURAL#


table(Datos$Zona)
## 
## Centro  Norte    Sur 
##     14     10      8
orderForProfit <- order(Datos$sidisponenrural,decreasing=TRUE)
orderForProfit 
##  [1] 27 25 13 10 26 32  3 11  1 22  7 17 20 12 16  4 30  6 23 18 14 21  2
## [24] 31 28 29 15 24 19  8  5  9
first10byProfit <- Datos[orderForProfit[c(1:5)],c("Estado","Zona","sidisponenrural")]
first10byProfit
## # A tibble: 5 x 3
##   Estado  Zona   sidisponenrural
##   <fct>   <fct>            <dbl>
## 1 Tabasco Sur              11.5 
## 2 Sinaloa Norte            10.7 
## 3 Hidalgo Centro           10.3 
## 4 Durango Norte             8.66
## 5 Sonora  Norte             8.17
library("ggplot2")


first10byProfit$sidisponenrural <- rev(factor(first10byProfit$sidisponenrural, levels = first10byProfit$sidisponenrural))


ggplot(first10byProfit, aes(x=Estado, y=sidisponenrural,fill=Zona)) + 
  geom_bar(stat="identity") +
  scale_fill_manual(values=c("red", "#3300FF","#00CC00", "#3300FF", "#3300FF"))

#La gráfica anterior muestra que en zonas Rurales las 5 principales entidades donde los hogares no disponen de conexión son las siguientes: Chiapas, Guerrero, Hidalgo, Oaxaca y Veracruz.

En cuanto a la disponibilidad de conexiones a Internet los resultados confirman que su uso se concentra en las zonas urbanas y del Centro del país, y a su vez tienen relación con las zonas de mayor concentración de población en el país.

Por otro lado, en las Zonas rurales es 4 veces mayor la proporción de gente que no cuenta con acceso a internet, de la que el si dispone, las principales entidades sin conexión a internet se encuentran en la zona Centro y Sur del país.