library(readxl)
data1 <- read_excel("DATA1.xlsx")
## New names:
## • `` -> `...2`
## • `` -> `...3`
## • `` -> `...4`
## • `` -> `...5`
## • `` -> `...6`
## • `` -> `...7`
## • `` -> `...8`
## • `` -> `...9`
## • `` -> `...10`
## • `` -> `...11`
#columnas
data1 <- data1[, -(1:2)]
#filas
data1 <- data1[-(1:4),]
#titulo
colnames(data1) <- as.character(unlist(data1[1,]))
data1 <- data1[-1,]
data1limpio <- data1[complete.cases(data1), ]
data1limpio$Provincia <- lapply(data1limpio$Provincia, function(cadena) {
palabras <- strsplit(cadena, " ")[[1]]
ultima_palabra <- palabras[length(palabras)]
trimws(ultima_palabra)
})
#data1limpio <- data1limpio |>
#mutate_if(!names(data1limpio) %in% "Provincia", as.numeric)
#names(data1limpio)
data1limpio <- data1limpio |> mutate(electricidadpct =
(data1limpio\(`Sí usa electricidad`/
(data1limpio\)Sí usa electricidad+
data1limpio$No usa electricidad)))
data1limpio <- data1limpio |> mutate(balonGLPpct =
(data1limpio\(`Sí usa gas (balón GLP)`/
(data1limpio\)No usa gas (balón GLP)+
data1limpio$Sí usa gas (balón GLP))))
data1limpio <- data1limpio |> (carbonpct = (data1limpio\(`Sí usa carbón`/
(data1limpio\)Sí usa carbón+
data1limpio$No usa carbón)))
data1limpio <- data1limpio |> mutate(leñapct =
(data1limpio\(`Sí usa leña`/
(data1limpio\)Sí usa leña+
data1limpio$No usa leña)))
install.packages(“polycor”) library(polycor)
dontselect=c(“Provincia”, “No usa electricidad”, “Sí usa electricidad”, “No usa gas (balón GLP)”, “Sí usa gas (balón GLP)”, “No usa carbón”, “Sí usa carbón”, “No usa leña”, “Sí usa leña”) select=setdiff(names(data1limpio),dontselect) theData=data1limpio[,select]
usaremos: library(magrittr) head(theData,10)%>% rmarkdown::paged_table()
corMatrix=polycor::hetcor(theData)$correlations