#Precio promedio de la vivienda en México

El data set se tomó de INEGI. El objetivo del estudio es analizar el precio promedio y sí existe alguna relación por región en México. El data set cuenta con 17 variables y 102240 observaciones. Para la razón de este estudio, analizaremos la región y el precio promedio.

##Carga de libreria y datos

library(readxl)
library(openxlsx)
getwd()
## [1] "C:/Users/elena/OneDrive/Escritorio/MASTER NEXT EDUCATION/1.Analisis de datos/Trabajo Individual"
datos_excel <- read_xlsx("INP_PP.xlsx")
## New names:
## • `` -> `...2`
## • `` -> `...3`
## • `` -> `...4`
## • `` -> `...5`
## • `` -> `...6`
## • `` -> `...7`
## • `` -> `...8`
## • `` -> `...9`
## • `` -> `...10`
## • `` -> `...11`
## • `` -> `...12`
## • `` -> `...13`
## • `` -> `...14`
## • `` -> `...15`
## • `` -> `...16`
## • `` -> `...17`

Limpieza de Datos: Eliminación de filas no deseadas, con esto nuetsro data set quedara de

datos_excel <- datos_excel[-c(1:4), ]
#Asignar la primera fila como nombres de las columnas
colnames(datos_excel) <- datos_excel[1, ]
#Eliminar la primera fila (ya que ahora es el encabezado)
datos_excel <- datos_excel[-1, ]
head(datos_excel)
## # A tibble: 6 × 17
##   Año   Mes   Fecha_Pub_DOF  `Clave ciudad` `Nombre ciudad` División Grupo Clase
##   <chr> <chr> <chr>          <chr>          <chr>           <chr>    <chr> <chr>
## 1 2018  07    17/08/2018 12… 01             Área Met. de l… 3. Vivi… 3.1.… 3.1.…
## 2 2018  07    17/08/2018 12… 01             Área Met. de l… 3. Vivi… 3.1.… 3.1.…
## 3 2018  07    17/08/2018 12… 01             Área Met. de l… 3. Vivi… 3.1.… 3.1.…
## 4 2018  07    17/08/2018 12… 01             Área Met. de l… 3. Vivi… 3.1.… 3.1.…
## 5 2018  07    17/08/2018 12… 01             Área Met. de l… 3. Vivi… 3.1.… 3.1.…
## 6 2018  07    17/08/2018 12… 01             Área Met. de l… 3. Vivi… 3.1.… 3.1.…
## # ℹ 9 more variables: Subclase <chr>, `Clave genérico` <chr>, Genérico <chr>,
## #   Consecutivo <chr>, Especificación <chr>, `Precio promedio` <chr>,
## #   Cantidad <chr>, Unidad <chr>, Estatus <chr>
#Filtrar datos para obtener solo la información de Costo de uso de vivienda
Costovivienda <- datos_excel[datos_excel$Grupo == "3.1. Costo de uso de vivienda", ]
#eliminamos las columas que no nos interesan
Costovivienda.clean <- Costovivienda[, -c(2,3,4,6,7,8,10,11,12,13,15,17)]
print(Costovivienda.clean)
## # A tibble: 11,675 × 5
##    Año   `Nombre ciudad`               Subclase         `Precio promedio` Unidad
##    <chr> <chr>                         <chr>            <chr>             <chr> 
##  1 2018  Área Met. de la Cd. de México 41 Vivienda alq… 5103.29           RENTA 
##  2 2018  Área Met. de la Cd. de México 41 Vivienda alq… 5103.29           RENTA 
##  3 2018  Área Met. de la Cd. de México 41 Vivienda alq… 5103.29           RENTA 
##  4 2018  Área Met. de la Cd. de México 41 Vivienda alq… 5103.29           RENTA 
##  5 2018  Área Met. de la Cd. de México 41 Vivienda alq… 5103.29           RENTA 
##  6 2018  Área Met. de la Cd. de México 41 Vivienda alq… 5103.29           RENTA 
##  7 2018  Área Met. de la Cd. de México 41 Vivienda alq… 5103.29           RENTA 
##  8 2018  Área Met. de la Cd. de México 41 Vivienda alq… 5103.29           RENTA 
##  9 2018  Área Met. de la Cd. de México 41 Vivienda alq… 5103.29           RENTA 
## 10 2018  Área Met. de la Cd. de México 41 Vivienda alq… 5103.29           RENTA 
## # ℹ 11,665 more rows

Análisis Descriptivo:

# Medidas de tendencia central
mean(Costovivienda$`Precio promedio`)
## [1] NA
median(Costovivienda$`Precio promedio`)
## [1] "2471.88"
# Gráfico de barras para visualizar el precio promedio por región
library(ggplot2)

ggplot(Costovivienda, aes(x = `Nombre ciudad`, y = `Precio promedio`)) +
  geom_bar(stat = "identity", fill = "blue", alpha = 0.7) +
  labs(title = "Precio Promedio de Viviendas en México",
       x = "Nombre Ciudad",
       y = "Precio Promedio") +
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1))

#veamos el precioa traves de los años 
ggplot(Costovivienda.clean, aes(x = `Año`, y = `Precio promedio`)) +
  geom_bar(stat = "identity", fill = "yellow", alpha = 0.7) +
  labs(title = "PRECIO PROMEDIO DE VIVIENDAS EN MEXICO",
       x = "Año",
       y = "Precio Promedio")

'podemos observar que el precio prodemedio en el año
2017 es en el año en el que màs incrementoha tenido'
## [1] "podemos observar que el precio prodemedio en el año\n2017 es en el año en el que màs incrementoha tenido"