S5 - Tipo de Graficos

Mauricio Carrillo

2025-02-22

0.1 Sesión 5 análisis gráfico en R

library(haven)
auto <- read_dta("C:/Users/mauca/Downloads/Econometria/MB/S5BA/auto.dta")
sumaria_2015 <- read_dta("C:/Users/mauca/Downloads/Econometria/MB/S5BA/sumaria-2015.dta")

1 Pie Chart with percentages

slices <- c(10, 12,4,16,8)
lbls <- c("US", "UK", "Australia", "Germany", "France")
pie(slices, labels = lbls)

2 Se crea una variable que represente las categorías

auto$extran[auto$foreign == 1] = "Extranjero"
## Warning: Unknown or uninitialised column: `extran`.
auto$extran[auto$foreign == 0] = "Nacional"

## Se elabora el gráfico por sectores

pie(table(auto$extran))

3 Grafico de Barras

barplot(table(sumaria_2015$dominio), main= "Grafico de Barras para el dominio", col = "red")

4 Grafico de barras de más de una variable categórica

counts = table(sumaria_2015$dominio, sumaria_2015$pobreza)

counts
##    
##        1    2    3
##   1   61  629 3697
##   2    3  178 2551
##   3    7  136 1618
##   4  368  556 1054
##   5  374 1324 4217
##   6  190  854 3604
##   7  318 1204 5281
##   8    8  272 3684
barplot(counts, main = "Condicion de pobreza de los hogares por dominio",
        xlab = "Número de hogares", legend = rownames(counts))

counts = table(sumaria_2015$dominio, sumaria_2015$pobreza)
barplot(counts, main = "Condicion de pobreza de los hogares por dominio",
        xlab = "Número de hogares", legend = rownames(counts),
        beside = TRUE)

5 Diagrama de cajas

boxplot(sumaria_2015$gashog2d)

boxplot(auto$price ~ auto$extran, main= "Diagrama de cajas para los preccios\nde acuerdo a la procedencia del vehiculo")

6 Histogramas

hist(auto$price, xlab = "Precio", main = "Hostograma de Precio")

hist(auto$price, col = "green", xlab = "Precio", main = "Hostograma de Precio")

hist(auto$price, col = "green",
     xlab = "Precio", main = "Histogramaa de Precio", prob = TRUE)
lines(dnorm(auto$price))

7 Histograma con curva normal

m = mean(auto$price)
std = sqrt(var(auto$price))

hist(auto$price, probability = TRUE, col = "red",
     main = "Histograma con curva normal", border = "blue")

curve(dnorm(x, mean = m, sd = std), col ="cyan",
      add = TRUE)

8 Graficos de dispersion

attach(auto)
plot(weight, mpg, xlab = "Peso",
     ylab = "Consumo de gasolina",
     main = "Dispersion entre el peso y el consumo de combustible")
abline(lm(mpg ~ weight), col = "red")

9 Matriz de dispersiones

pairs(~mpg +price+ weight + length, data = auto,
       main = "Matriz de dispersiones simple")

10 Ejemplo 1 Gráfico de Sectores

Se elabora el grafico de sectores, para eso se crea una variable recodificada que represente a cada categoria de la variable pobreza.

sumaria_2015$pobre[sumaria_2015$pobreza == 1] <- "Pobre extremo"
## Warning: Unknown or uninitialised column: `pobre`.
sumaria_2015$pobre[sumaria_2015$pobreza == 2] <- "Pobre no extremo"
sumaria_2015$pobre[sumaria_2015$pobreza == 3] <- "No pobre"

# se elabora el grafico de pie

pie(table(sumaria_2015$pobre), col = rainbow(3),
    main = "Porcentaje de hogares pobres")

11 Ejemplo 2 Grafico de Barras

sumaria_2015$estrat[sumaria_2015$estrato == 1] <- "Mayor que 100,000 viviendas"
## Warning: Unknown or uninitialised column: `estrat`.
sumaria_2015$estrat[sumaria_2015$estrato == 2] <- "de 20,001 a 100,000 viviendas"
sumaria_2015$estrat[sumaria_2015$estrato == 3] <- "de 10,001 a 20,000 viviendas"
sumaria_2015$estrat[sumaria_2015$estrato == 4] <- "de 4,001 a 10,000 viviendas"
sumaria_2015$estrat[sumaria_2015$estrato == 5] <- "de 401 a 4,000 viviendas"
sumaria_2015$estrat[sumaria_2015$estrato == 6] <- "menos de 401 viviendas"
sumaria_2015$estrat[sumaria_2015$estrato == 7] <- "Area de empadronamiento rural - aer compuesto"
sumaria_2015$estrat[sumaria_2015$estrato == 8] <- "Area de empadronamiento rural - aer simple"

# El grafico 

conteo <- table(sumaria_2015$estrat, sumaria_2015$pobre)

conteo
##                                                
##                                                 No pobre Pobre extremo
##   Area de empadronamiento rural - aer compuesto     5209           829
##   Area de empadronamiento rural - aer simple        1729           273
##   de 10,001 a 20,000 viviendas                      2194            10
##   de 20,001 a 100,000 viviendas                     5320            21
##   de 4,001 a 10,000 viviendas                       1836            27
##   de 401 a 4,000 viviendas                          3348            97
##   Mayor que 100,000 viviendas                       4755            11
##   menos de 401 viviendas                            1315            61
##                                                
##                                                 Pobre no extremo
##   Area de empadronamiento rural - aer compuesto             2203
##   Area de empadronamiento rural - aer simple                 666
##   de 10,001 a 20,000 viviendas                               210
##   de 20,001 a 100,000 viviendas                              416
##   de 4,001 a 10,000 viviendas                                258
##   de 401 a 4,000 viviendas                                   754
##   Mayor que 100,000 viviendas                                339
##   menos de 401 viviendas                                     307
barplot(conteo, main = "Condicion de pobreza de acuerdo a estrato geografico",
        beside = TRUE, legend = rownames(conteo))

12 Ejemplo 3 Histograma

m = mean(sumaria_2015$gashog2d)
std = sqrt(var(sumaria_2015$gashog2d))

hist(sumaria_2015$gashog2d, probability = TRUE, col = "blue",
     main = "Histograma del gasto total bruto",
     border = "grey")
curve(dnorm(x, mean = m, sd = std), col ="red",
      add =TRUE)

13 Ejemplo 4 Grafico de dispersion

# El grafico

plot(sumaria_2015$inghog2d, sumaria_2015$gashog2d,
     main = "Dispersion entre ingresos y gastos",
     xlab = "Ingresos Totales", ylab = "Gastos Totales")
abline(lm(gashog2d ~ inghog2d, data= sumaria_2015 ),
       col = "red")