library(haven)
auto <- read_dta("C:/Users/mauca/Downloads/Econometria/MB/S5BA/auto.dta")
sumaria_2015 <- read_dta("C:/Users/mauca/Downloads/Econometria/MB/S5BA/sumaria-2015.dta")
slices <- c(10, 12,4,16,8)
lbls <- c("US", "UK", "Australia", "Germany", "France")
pie(slices, labels = lbls)
auto$extran[auto$foreign == 1] = "Extranjero"
## Warning: Unknown or uninitialised column: `extran`.
auto$extran[auto$foreign == 0] = "Nacional"
## Se elabora el gráfico por sectores
pie(table(auto$extran))
barplot(table(sumaria_2015$dominio), main= "Grafico de Barras para el dominio", col = "red")
counts = table(sumaria_2015$dominio, sumaria_2015$pobreza)
counts
##
## 1 2 3
## 1 61 629 3697
## 2 3 178 2551
## 3 7 136 1618
## 4 368 556 1054
## 5 374 1324 4217
## 6 190 854 3604
## 7 318 1204 5281
## 8 8 272 3684
barplot(counts, main = "Condicion de pobreza de los hogares por dominio",
xlab = "Número de hogares", legend = rownames(counts))
counts = table(sumaria_2015$dominio, sumaria_2015$pobreza)
barplot(counts, main = "Condicion de pobreza de los hogares por dominio",
xlab = "Número de hogares", legend = rownames(counts),
beside = TRUE)
boxplot(sumaria_2015$gashog2d)
boxplot(auto$price ~ auto$extran, main= "Diagrama de cajas para los preccios\nde acuerdo a la procedencia del vehiculo")
hist(auto$price, xlab = "Precio", main = "Hostograma de Precio")
hist(auto$price, col = "green", xlab = "Precio", main = "Hostograma de Precio")
hist(auto$price, col = "green",
xlab = "Precio", main = "Histogramaa de Precio", prob = TRUE)
lines(dnorm(auto$price))
m = mean(auto$price)
std = sqrt(var(auto$price))
hist(auto$price, probability = TRUE, col = "red",
main = "Histograma con curva normal", border = "blue")
curve(dnorm(x, mean = m, sd = std), col ="cyan",
add = TRUE)
attach(auto)
plot(weight, mpg, xlab = "Peso",
ylab = "Consumo de gasolina",
main = "Dispersion entre el peso y el consumo de combustible")
abline(lm(mpg ~ weight), col = "red")
pairs(~mpg +price+ weight + length, data = auto,
main = "Matriz de dispersiones simple")
Se elabora el grafico de sectores, para eso se crea una variable recodificada que represente a cada categoria de la variable pobreza.
sumaria_2015$pobre[sumaria_2015$pobreza == 1] <- "Pobre extremo"
## Warning: Unknown or uninitialised column: `pobre`.
sumaria_2015$pobre[sumaria_2015$pobreza == 2] <- "Pobre no extremo"
sumaria_2015$pobre[sumaria_2015$pobreza == 3] <- "No pobre"
# se elabora el grafico de pie
pie(table(sumaria_2015$pobre), col = rainbow(3),
main = "Porcentaje de hogares pobres")
sumaria_2015$estrat[sumaria_2015$estrato == 1] <- "Mayor que 100,000 viviendas"
## Warning: Unknown or uninitialised column: `estrat`.
sumaria_2015$estrat[sumaria_2015$estrato == 2] <- "de 20,001 a 100,000 viviendas"
sumaria_2015$estrat[sumaria_2015$estrato == 3] <- "de 10,001 a 20,000 viviendas"
sumaria_2015$estrat[sumaria_2015$estrato == 4] <- "de 4,001 a 10,000 viviendas"
sumaria_2015$estrat[sumaria_2015$estrato == 5] <- "de 401 a 4,000 viviendas"
sumaria_2015$estrat[sumaria_2015$estrato == 6] <- "menos de 401 viviendas"
sumaria_2015$estrat[sumaria_2015$estrato == 7] <- "Area de empadronamiento rural - aer compuesto"
sumaria_2015$estrat[sumaria_2015$estrato == 8] <- "Area de empadronamiento rural - aer simple"
# El grafico
conteo <- table(sumaria_2015$estrat, sumaria_2015$pobre)
conteo
##
## No pobre Pobre extremo
## Area de empadronamiento rural - aer compuesto 5209 829
## Area de empadronamiento rural - aer simple 1729 273
## de 10,001 a 20,000 viviendas 2194 10
## de 20,001 a 100,000 viviendas 5320 21
## de 4,001 a 10,000 viviendas 1836 27
## de 401 a 4,000 viviendas 3348 97
## Mayor que 100,000 viviendas 4755 11
## menos de 401 viviendas 1315 61
##
## Pobre no extremo
## Area de empadronamiento rural - aer compuesto 2203
## Area de empadronamiento rural - aer simple 666
## de 10,001 a 20,000 viviendas 210
## de 20,001 a 100,000 viviendas 416
## de 4,001 a 10,000 viviendas 258
## de 401 a 4,000 viviendas 754
## Mayor que 100,000 viviendas 339
## menos de 401 viviendas 307
barplot(conteo, main = "Condicion de pobreza de acuerdo a estrato geografico",
beside = TRUE, legend = rownames(conteo))
m = mean(sumaria_2015$gashog2d)
std = sqrt(var(sumaria_2015$gashog2d))
hist(sumaria_2015$gashog2d, probability = TRUE, col = "blue",
main = "Histograma del gasto total bruto",
border = "grey")
curve(dnorm(x, mean = m, sd = std), col ="red",
add =TRUE)
# El grafico
plot(sumaria_2015$inghog2d, sumaria_2015$gashog2d,
main = "Dispersion entre ingresos y gastos",
xlab = "Ingresos Totales", ylab = "Gastos Totales")
abline(lm(gashog2d ~ inghog2d, data= sumaria_2015 ),
col = "red")