UNAM FACULTAD DE CONTADURIA Y ADMINISTRACIÓN
library("readxl")
## Warning: package 'readxl' was built under R version 3.5.3
Datos_Inegi <- read_excel("~/MCAA/Datos Inegi.xlsx")
View(Datos_Inegi)
Datos_Inegi <- Datos_Inegi [c(1:7)]
names(Datos_Inegi) <-c ("Estado", "Zona", "Total", "sidisponenurbano", "nodisponenurbano", "sidisponenrural", "nodisponenrural")
str(Datos_Inegi)
## Classes 'tbl_df', 'tbl' and 'data.frame': 32 obs. of 7 variables:
## $ Estado : chr "Aguascalientes" "Ciudad de México" "Colima" "Guanajuato" ...
## $ Zona : chr "Centro" "Centro" "Centro" "Centro" ...
## $ Total : num 353852 2700423 230924 1522438 842472 ...
## $ sidisponenurbano: num 182531 1950190 131563 627584 235468 ...
## $ nodisponenurbano: num 108138 738527 73426 455487 231019 ...
## $ sidisponenrural : num 22455 3449 8909 111824 86498 ...
## $ nodisponenrural : num 40728 8257 17026 327543 289487 ...
Datos_Inegi$Estado <- as.factor(Datos_Inegi$Zona)
Datos_Inegi$Estado <- as.factor(Datos_Inegi$sidisponenurbano)
Datos_Inegi$Estado <- as.factor(Datos_Inegi$sidisponenrural)
Datos_Inegi$Estado <- as.factor(Datos_Inegi$nodisponenurbano)
Datos_Inegi$Estado <- as.factor(Datos_Inegi$nodisponenrural)
library(ggplot2)
ggplot(data=Datos_Inegi, aes(x=Zona))+geom_bar()
####Zona geográfica de total de hogares que disponen de conexión a internet
Datos_Inegi[Datos_Inegi$sidisponenurbano > 32, c("Estado", "sidisponenurbano")]
## # A tibble: 32 x 2
## Estado sidisponenurbano
## <fct> <dbl>
## 1 40728 182531
## 2 8257 1950190
## 3 17026 131563
## 4 327543 627584
## 5 289487 235468
## 6 221317 1323936
## 7 442347 2594277
## 8 328283 503326
## 9 56923 278266
## 10 99669 146621
## # ... with 22 more rows
Datos_Inegi$Estado <- rev(factor(Datos_Inegi$Estado, levels = Datos_Inegi$Estado))
library("ggplot2")
ggplot (Datos_Inegi, aes(x=Zona, y=sidisponenurbano)) +
geom_bar(stat="identity", width=.5, fill="darkblue") +
labs(title="Zonas urbanas que si disponen de internet") +
coord_flip()
ggplot (Datos_Inegi, aes(x=Zona, y=nodisponenurbano)) +
geom_bar(stat="identity", width=.5, fill="darkblue") +
labs(title="Zonas urbanas que no disponen de internet") +
coord_flip()
ggplot (Datos_Inegi, aes(x=Zona, y=sidisponenrural)) +
geom_bar(stat="identity", width=.5, fill="darkblue") +
labs(title="Zonas rurales que si disponen de internet") +
coord_flip()
ggplot (Datos_Inegi, aes(x=Zona, y=nodisponenrural)) +
geom_bar(stat="identity", width=.5, fill="darkblue") +
labs(title="Zonas rurales que no disponen de internet") +
coord_flip()
ggplot (Datos_Inegi, aes(x=Estado, y=nodisponenrural)) +
geom_bar(stat="identity", width=.5, fill="darkblue") +
labs(title="Zonas rurales que no disponen de internet") +
coord_flip()
library("readxl")
Datos_Inegi <- read_excel("~/MCAA/Datos Inegi.xlsx")
Datos_Inegi <- Datos_Inegi [c(1:7)]
names(Datos_Inegi) <-c ("Estado", "Zona", "Total", "sidisponenurbano", "nodisponenurbano", "sidisponenrural", "nodisponenrural")
str(Datos_Inegi)
## Classes 'tbl_df', 'tbl' and 'data.frame': 32 obs. of 7 variables:
## $ Estado : chr "Aguascalientes" "Ciudad de México" "Colima" "Guanajuato" ...
## $ Zona : chr "Centro" "Centro" "Centro" "Centro" ...
## $ Total : num 353852 2700423 230924 1522438 842472 ...
## $ sidisponenurbano: num 182531 1950190 131563 627584 235468 ...
## $ nodisponenurbano: num 108138 738527 73426 455487 231019 ...
## $ sidisponenrural : num 22455 3449 8909 111824 86498 ...
## $ nodisponenrural : num 40728 8257 17026 327543 289487 ...
Datos_Inegi$Zona <- as.factor(Datos_Inegi$Zona)
Datos_Inegi$sidisponenurbano <- as.factor(Datos_Inegi$sidisponenurbano)
Datos_Inegi$sidisponenrural <- as.factor(Datos_Inegi$sidisponenrural)
Datos_Inegi$nodisponenurbano <- as.factor(Datos_Inegi$nodisponenurbano)
Datos_Inegi$nodisponenrural <- as.factor(Datos_Inegi$nodisponenrural)
library(ggplot2)
ggplot(data=Datos_Inegi, aes(x=Zona))+geom_bar()
Datos_Inegi[Datos_Inegi$sidisponeurbano > 32, c("Estado", "sidisponenurbano")]
## Warning: Unknown or uninitialised column: 'sidisponeurbano'.
## Warning: Length of logical index must be 1 or 32, not 0
## # A tibble: 0 x 2
## # ... with 2 variables: Estado <chr>, sidisponenurbano <fct>
Datos_Inegi$Estado <- rev(factor(Datos_Inegi$Estado, levels = Datos_Inegi$Estado))
ggplot (Datos_Inegi, aes(x=Zona, y=nodisponenrural, fill=Estado)) +
geom_bar(stat="identity", position='dodge', width=.5) +
labs(title="First 5 Estados que si disponen de internet en zona urbana") +
coord_flip()
#Gráficas de Barras#
#SI DISPONEN URBANO#
library("readxl")
Datos <- read_excel("~/MCAA/Datos Inegi.xlsx")
Datos <- Datos[c(1:7)]
names(Datos) <- c("Estado", "Zona", "Total", "sidisponenurbano", "nodisponenurbano", "sidisponenrural", "nodisponenrural")
str(Datos)
## Classes 'tbl_df', 'tbl' and 'data.frame': 32 obs. of 7 variables:
## $ Estado : chr "Aguascalientes" "Ciudad de México" "Colima" "Guanajuato" ...
## $ Zona : chr "Centro" "Centro" "Centro" "Centro" ...
## $ Total : num 353852 2700423 230924 1522438 842472 ...
## $ sidisponenurbano: num 182531 1950190 131563 627584 235468 ...
## $ nodisponenurbano: num 108138 738527 73426 455487 231019 ...
## $ sidisponenrural : num 22455 3449 8909 111824 86498 ...
## $ nodisponenrural : num 40728 8257 17026 327543 289487 ...
Datos$Estado <- as.factor(Datos$Estado)
Datos$Zona <- as.factor(Datos$Zona)
head(Datos)
## # A tibble: 6 x 7
## Estado Zona Total sidisponenurbano nodisponenurbano sidisponenrural
## <fct> <fct> <dbl> <dbl> <dbl> <dbl>
## 1 Aguas~ Cent~ 3.54e5 182531 108138 22455
## 2 Ciuda~ Cent~ 2.70e6 1950190 738527 3449
## 3 Colima Cent~ 2.31e5 131563 73426 8909
## 4 Guana~ Cent~ 1.52e6 627584 455487 111824
## 5 Hidal~ Cent~ 8.42e5 235468 231019 86498
## 6 Jalis~ Cent~ 2.30e6 1323936 679272 78634
## # ... with 1 more variable: nodisponenrural <dbl>
tail(Datos)
## # A tibble: 6 x 7
## Estado Zona Total sidisponenurbano nodisponenurbano sidisponenrural
## <fct> <fct> <dbl> <dbl> <dbl> <dbl>
## 1 Chiap~ Sur 1.36e6 256121 452435 78508
## 2 Guerr~ Sur 9.92e5 295540 294646 52146
## 3 Oaxaca Sur 1.15e6 276992 290143 61285
## 4 Quint~ Sur 5.11e5 359791 97810 19271
## 5 Tabas~ Sur 6.73e5 223945 169845 77327
## 6 Yucat~ Sur 5.99e5 286570 222297 15793
## # ... with 1 more variable: nodisponenrural <dbl>
class(Datos)
## [1] "tbl_df" "tbl" "data.frame"
dim(Datos)
## [1] 32 7
ncol(Datos)
## [1] 7
nrow(Datos)
## [1] 32
class(Datos$Estado)
## [1] "factor"
length(Datos$Estado)
## [1] 32
length(Datos$Zona)
## [1] 32
levels(Datos$Zona)
## [1] "Centro" "Norte" "Sur"
length(levels(Datos$Zona))
## [1] 3
table(Datos$Zona)
##
## Centro Norte Sur
## 16 9 7
orderForProfit <- order(Datos$sidisponenurbano,decreasing=TRUE)
orderForProfit
## [1] 7 2 6 22 15 17 24 4 11 25 19 8 20 23 30 28 32 12 9 29 13 27 5
## [24] 31 21 1 18 16 10 3 26 14
first10byProfit <- Datos[orderForProfit[c(1:5)],c("Estado","Zona","sidisponenurbano")]
first10byProfit
## # A tibble: 5 x 3
## Estado Zona sidisponenurbano
## <fct> <fct> <dbl>
## 1 México Centro 2594277
## 2 Ciudad de México Centro 1950190
## 3 Jalisco Centro 1323936
## 4 Nuevo León Norte 1052609
## 5 Veracruz de Ignacio de la Llave Centro 776008
library("ggplot2")
first10byProfit$sidisponenurbano <- rev(factor(first10byProfit$sidisponenurbano, levels = first10byProfit$sidisponenurbano))
ggplot(first10byProfit, aes(x=Estado, y=sidisponenurbano,fill=Zona)) +
geom_bar(stat="identity") +
scale_fill_manual(values=c("red", "#3300FF","#00CC00", "#3300FF", "#3300FF"))
#NO DISPONEN URBANO#
table(Datos$Zona)
##
## Centro Norte Sur
## 16 9 7
orderForProfit <- order(Datos$nodisponenurbano,decreasing=TRUE)
orderForProfit
## [1] 7 15 2 6 11 4 27 8 19 25 22 20 28 29 17 13 5 32 9 23 31 14 21
## [24] 12 10 16 24 1 30 3 26 18
first10byProfit <- Datos[orderForProfit[c(1:5)],c("Estado","Zona","nodisponenurbano")]
first10byProfit
## # A tibble: 5 x 3
## Estado Zona nodisponenurbano
## <fct> <fct> <dbl>
## 1 México Centro 1437670
## 2 Veracruz de Ignacio de la Llave Centro 804906
## 3 Ciudad de México Centro 738527
## 4 Jalisco Centro 679272
## 5 Puebla Centro 591972
library("ggplot2")
first10byProfit$nodisponenurbano <- rev(factor(first10byProfit$nodisponenurbano, levels = first10byProfit$nodisponenurbano))
ggplot(first10byProfit, aes(x=Estado, y=nodisponenurbano,fill=Zona)) +
geom_bar(stat="identity") +
scale_fill_manual(values=c("red", "#3300FF","#00CC00", "#3300FF", "#3300FF"))
#NO DISPONEN RURAL·
table(Datos$Zona)
##
## Centro Norte Sur
## 16 9 7
orderForProfit <- order(Datos$nodisponenrural,decreasing=TRUE)
orderForProfit
## [1] 15 27 29 7 11 28 8 4 5 13 6 31 19 16 23 12 21 25 10 32 20 9 22
## [24] 14 26 24 17 1 30 18 3 2
first10byProfit <- Datos[orderForProfit[c(1:5)],c("Estado","Zona","nodisponenrural")]
first10byProfit
## # A tibble: 5 x 3
## Estado Zona nodisponenrural
## <fct> <fct> <dbl>
## 1 Veracruz de Ignacio de la Llave Centro 798650
## 2 Chiapas Sur 573143
## 3 Oaxaca Sur 519796
## 4 México Centro 442347
## 5 Puebla Centro 406338
library("ggplot2")
first10byProfit$nodisponenrural <- rev(factor(first10byProfit$nodisponenrural, levels = first10byProfit$nodisponenrural))
ggplot(first10byProfit, aes(x=Estado, y=nodisponenrural,fill=Zona)) +
geom_bar(stat="identity") +
scale_fill_manual(values=c("red", "#3300FF","#00CC00", "#3300FF", "#3300FF"))
#SI DISPONEN RURAL#
table(Datos$Zona)
##
## Centro Norte Sur
## 16 9 7
orderForProfit <- order(Datos$sidisponenrural,decreasing=TRUE)
orderForProfit
## [1] 4 7 15 23 5 6 27 31 24 8 29 11 28 21 12 17 16 9 22 25 1 19 30
## [24] 18 32 13 10 26 20 3 14 2
first10byProfit <- Datos[orderForProfit[c(1:5)],c("Estado","Zona","sidisponenrural")]
first10byProfit
## # A tibble: 5 x 3
## Estado Zona sidisponenrural
## <fct> <fct> <dbl>
## 1 Guanajuato Centro 111824
## 2 México Centro 110375
## 3 Veracruz de Ignacio de la Llave Centro 101581
## 4 Sinaloa Norte 91310
## 5 Hidalgo Centro 86498
library("ggplot2")
first10byProfit$sidisponenrural <- rev(factor(first10byProfit$sidisponenrural, levels = first10byProfit$sidisponenrural))
ggplot(first10byProfit, aes(x=Estado, y=sidisponenrural,fill=Zona)) +
geom_bar(stat="identity") +
scale_fill_manual(values=c("red", "#3300FF","#00CC00", "#3300FF", "#3300FF"))