#Precio promedio de la vivienda en México
El data set se tomó de INEGI. El objetivo del estudio es analizar el precio promedio y sí existe alguna relación por región en México. El data set cuenta con 17 variables y 102240 observaciones. Para la razón de este estudio, analizaremos la región y el precio promedio.
##Carga de libreria y datos
library(readxl)
library(openxlsx)
getwd()
## [1] "C:/Users/elena/OneDrive/Escritorio/MASTER NEXT EDUCATION/1.Analisis de datos/Trabajo Individual"
datos_excel <- read_xlsx("INP_PP.xlsx")
## New names:
## • `` -> `...2`
## • `` -> `...3`
## • `` -> `...4`
## • `` -> `...5`
## • `` -> `...6`
## • `` -> `...7`
## • `` -> `...8`
## • `` -> `...9`
## • `` -> `...10`
## • `` -> `...11`
## • `` -> `...12`
## • `` -> `...13`
## • `` -> `...14`
## • `` -> `...15`
## • `` -> `...16`
## • `` -> `...17`
Limpieza de Datos: Eliminación de filas no deseadas, con esto nuetsro data set quedara de
datos_excel <- datos_excel[-c(1:4), ]
#Asignar la primera fila como nombres de las columnas
colnames(datos_excel) <- datos_excel[1, ]
#Eliminar la primera fila (ya que ahora es el encabezado)
datos_excel <- datos_excel[-1, ]
head(datos_excel)
## # A tibble: 6 × 17
## Año Mes Fecha_Pub_DOF `Clave ciudad` `Nombre ciudad` División Grupo Clase
## <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 2018 07 17/08/2018 12… 01 Área Met. de l… 3. Vivi… 3.1.… 3.1.…
## 2 2018 07 17/08/2018 12… 01 Área Met. de l… 3. Vivi… 3.1.… 3.1.…
## 3 2018 07 17/08/2018 12… 01 Área Met. de l… 3. Vivi… 3.1.… 3.1.…
## 4 2018 07 17/08/2018 12… 01 Área Met. de l… 3. Vivi… 3.1.… 3.1.…
## 5 2018 07 17/08/2018 12… 01 Área Met. de l… 3. Vivi… 3.1.… 3.1.…
## 6 2018 07 17/08/2018 12… 01 Área Met. de l… 3. Vivi… 3.1.… 3.1.…
## # ℹ 9 more variables: Subclase <chr>, `Clave genérico` <chr>, Genérico <chr>,
## # Consecutivo <chr>, Especificación <chr>, `Precio promedio` <chr>,
## # Cantidad <chr>, Unidad <chr>, Estatus <chr>
#Filtrar datos para obtener solo la información de Costo de uso de vivienda
Costovivienda <- datos_excel[datos_excel$Grupo == "3.1. Costo de uso de vivienda", ]
#eliminamos las columas que no nos interesan
Costovivienda.clean <- Costovivienda[, -c(2,3,4,6,7,8,10,11,12,13,15,17)]
print(Costovivienda.clean)
## # A tibble: 11,675 × 5
## Año `Nombre ciudad` Subclase `Precio promedio` Unidad
## <chr> <chr> <chr> <chr> <chr>
## 1 2018 Área Met. de la Cd. de México 41 Vivienda alq… 5103.29 RENTA
## 2 2018 Área Met. de la Cd. de México 41 Vivienda alq… 5103.29 RENTA
## 3 2018 Área Met. de la Cd. de México 41 Vivienda alq… 5103.29 RENTA
## 4 2018 Área Met. de la Cd. de México 41 Vivienda alq… 5103.29 RENTA
## 5 2018 Área Met. de la Cd. de México 41 Vivienda alq… 5103.29 RENTA
## 6 2018 Área Met. de la Cd. de México 41 Vivienda alq… 5103.29 RENTA
## 7 2018 Área Met. de la Cd. de México 41 Vivienda alq… 5103.29 RENTA
## 8 2018 Área Met. de la Cd. de México 41 Vivienda alq… 5103.29 RENTA
## 9 2018 Área Met. de la Cd. de México 41 Vivienda alq… 5103.29 RENTA
## 10 2018 Área Met. de la Cd. de México 41 Vivienda alq… 5103.29 RENTA
## # ℹ 11,665 more rows
Análisis Descriptivo:
# Medidas de tendencia central
mean(Costovivienda$`Precio promedio`)
## [1] NA
median(Costovivienda$`Precio promedio`)
## [1] "2471.88"
# Gráfico de barras para visualizar el precio promedio por región
library(ggplot2)
ggplot(Costovivienda, aes(x = `Nombre ciudad`, y = `Precio promedio`)) +
geom_bar(stat = "identity", fill = "blue", alpha = 0.7) +
labs(title = "Precio Promedio de Viviendas en México",
x = "Nombre Ciudad",
y = "Precio Promedio") +
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1))
#veamos el precioa traves de los años
ggplot(Costovivienda.clean, aes(x = `Año`, y = `Precio promedio`)) +
geom_bar(stat = "identity", fill = "yellow", alpha = 0.7) +
labs(title = "PRECIO PROMEDIO DE VIVIENDAS EN MEXICO",
x = "Año",
y = "Precio Promedio")
'podemos observar que el precio prodemedio en el año
2017 es en el año en el que màs incrementoha tenido'
## [1] "podemos observar que el precio prodemedio en el año\n2017 es en el año en el que màs incrementoha tenido"