Cuarteto de Anscombe
#importando los datos
anscombe <- read.csv2("~/BI/exercise1/exercise1/anscombe.csv", stringsAsFactors=TRUE)
str(anscombe)
## 'data.frame': 44 obs. of 3 variables:
## $ Set: int 1 1 1 1 1 1 1 1 1 1 ...
## $ X : int 10 8 13 9 11 14 6 4 12 7 ...
## $ Y : num 8.04 6.95 7.58 8.81 8.33 ...
#convierte la primera columna en factor, para que no lo lea como un int
anscombe$Set <- as.factor(anscombe$Set)
str(anscombe)
## 'data.frame': 44 obs. of 3 variables:
## $ Set: Factor w/ 4 levels "1","2","3","4": 1 1 1 1 1 1 1 1 1 1 ...
## $ X : int 10 8 13 9 11 14 6 4 12 7 ...
## $ Y : num 8.04 6.95 7.58 8.81 8.33 ...
#dividir en subgrupos
uno <- subset(anscombe, anscombe$Set == 1)
promedioX <- mean(uno$X)
varianzaX <- var(uno$X)
promedioY <- mean(uno$Y)
varianzaY <- var(uno$Y)
correlacion <- cor(uno$X,uno$Y)
SummaryStats <- data.frame(promedioX, promedioY, varianzaX, varianzaY, correlacion)
SummaryStats
## promedioX promedioY varianzaX varianzaY correlacion
## 1 9 7.500909 11 4.127269 0.8164205
dos <- subset(anscombe, anscombe$Set == 2)
tres <- subset(anscombe, anscombe$Set == 3)
cuatro <- subset(anscombe, anscombe$Set == 4)
Visualización del 1er conjunto
#Importar la Libreria
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.3
#gplotUno <- ggplot(uno,aes(X,Y))
gplotUno <- ggplot(anscombe,aes(X,Y, color = Set))
#aumento capas
#gplotUno <- gplotUno + geom_point()
gplotUno <- gplotUno + geom_line()
#gplotUno
gplotUno <- gplotUno + geom_smooth(method = lm, se = FALSE) #el 'se' es para mostrar el embudo que encierra a la linea central
gplotUno <- gplotUno + geom_vline(aes(xintercept = promedioX)) #aes significa Aesthetics
#gplotUno
gplotUno <- gplotUno + geom_hline(aes(yintercept = promedioY))
gplotUno
## `geom_smooth()` using formula = 'y ~ x'

Visualización FACETAS``
gplotDos <- ggplot(anscombe,aes(X,Y))
#aumento capas
gplotDos <- gplotDos + geom_point()
gplotDos <- gplotDos + geom_smooth(method = lm, se = FALSE) #el 'se' es para mostrar el embudo que encierra a la linea central
gplotDos <- gplotDos + geom_vline(aes(xintercept = promedioX)) #aes significa Aesthetics
gplotDos <- gplotDos + geom_hline(aes(yintercept = promedioY))
#crear un dataset con todas las variables de todos los grupos y graficar
#Facetas
#gplotUno <- gplotUno + facet_wrap(. ~Set)
gplotDos <- gplotDos + facet_grid(. ~ Set)
gplotDos
## `geom_smooth()` using formula = 'y ~ x'
