This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
House.Price.Dataset = read.table("House Price Dataset.csv", header=TRUE, sep=",",
dec=".", stringsAsFactors = TRUE)
nuevosDatos = House.Price.Dataset[,1:5]
r = cor(nuevosDatos)
library(corrplot)
## corrplot 0.95 loaded
corrplot(r , method="number")
## El precio se correlaciona moderadamente con el área (0.54) y los baños (0.52), lo que sugiere que estos son los factores más asociados al valor de la propiedad. La relación con habitaciones (0.37) y pisos (0.42) es más débil. En general, ninguna variable tiene una correlación perfecta, por lo que el precio depende de varios factores combinados.
### diagrama dispersion
library(ggplot2)
## grafico de dispersion
ggplot(nuevosDatos, aes(x=area,y=price)) +
geom_jitter() +
geom_smooth(method = "lm", colour="skyblue")+
labs(title ="Diagrama de Dispersion Area vs Price",
x="Area", y="Price")
## `geom_smooth()` using formula = 'y ~ x'
## Muestra una relación positiva entre el área de la vivienda y su precio. A medida que aumenta el área, el precio tiende a incrementarse. Sin embargo, los puntos están muy dispersos, lo que indica que existen otros factores que también influyen en el precio, no solo el tamaño.
## Diagrama de cajas comparativas
boxplot(House.Price.Dataset$price ~ House.Price.Dataset$basement,
col=c("yellow","pink"), ylab="Price",
xlab="Basement")
library(ggplot2)
ggplot(House.Price.Dataset, aes(x = mainroad, fill = furnishingstatus)) +
geom_bar(position = "stack") +
labs(title = "Distribución de propiedades según 'Mainroad' y 'Furnishingstatus'", # Título
x = "Cerca de la carretera principal (Mainroad)",
y = "Número de propiedades",
fill = "Estado de muebles") +
scale_fill_manual(values = c("furnished" = "skyblue", "semi-furnished" = "red", "unfurnished" = "green")) +
theme_minimal()
tabla1 = table(House.Price.Dataset$mainroad, House.Price.Dataset$furnishingstatus)
tabla1
##
## furnished semi-furnished unfurnished
## no 9 31 37
## yes 131 196 141
## La mayoría de las propiedades se encuentran cerca de la carretera principal, donde predominan las viviendas semi-amuebladas, seguidas por las amuebladas y las sin amueblar. En contraste, las propiedades alejadas de la carretera son pocas y, en su mayoría, se clasifican como semi-amuebladas o sin amueblar. En general, se observa que la cercanía a la carretera principal está asociada con una mayor cantidad y diversidad de propiedades disponibles.