#Cuarteto de Anscombe

anscombe  <- read.csv2("D:/Usuario/Desktop/Visualización de datos/anscombe.csv", stringsAsFactors=TRUE)
str(anscombe)
## 'data.frame':    44 obs. of  3 variables:
##  $ Set: int  1 1 1 1 1 1 1 1 1 1 ...
##  $ X  : int  10 8 13 9 11 14 6 4 12 7 ...
##  $ Y  : num  8.04 6.95 7.58 8.81 8.33 ...
anscombe$Set <- as.factor(anscombe$Set)
str(anscombe)
## 'data.frame':    44 obs. of  3 variables:
##  $ Set: Factor w/ 4 levels "1","2","3","4": 1 1 1 1 1 1 1 1 1 1 ...
##  $ X  : int  10 8 13 9 11 14 6 4 12 7 ...
##  $ Y  : num  8.04 6.95 7.58 8.81 8.33 ...
##dividir en subgrupos 
# Cálculos del primer subconjunto
uno <-subset(anscombe,anscombe$Set =="1")
promX <- mean(uno$X)
varX <- var(uno$X)
promY <- mean(uno$Y)
varY <- var(uno$Y)
corr <- cor(uno$X,uno$Y)
# Se guardan en un dataset
resultados=data.frame(promX,promY,varX,varY,corr)
# Cálculos del segundo subconjunto
dos <- subset(anscombe, Set=="2")
promX <- mean(dos$X)
promY <- mean (dos$Y)
varX <- var(dos$X)
varY <- var(dos$Y)
corr <- cor(dos$X, dos$Y)
# Se guardan en un dataset
resultados2=data.frame(promX,promY,varX,varY,corr)
# Se adicionan
resultados <- rbind(resultados, resultados2)

# ****
# Cálculos del tercer subconjunto
tres <- subset(anscombe, Set=="3")

promX <- mean(tres$X)
promY <- mean (tres$Y)
varX <- var(tres$X)
varY <- var(tres$Y)
corr <- cor(tres$X, tres$Y)
# Se guardan en un dataset
resultados3=data.frame(promX,promY,varX,varY,corr)
# Se adicionan
resultados <- rbind(resultados, resultados3)

# ****
# Cálculos del cuarto subconjunto
cuatro <- subset(anscombe, Set=="4")
promX <- mean(cuatro$X)
promY <- mean (cuatro$Y)
varX <- var(cuatro$X)
varY <- var(cuatro$Y)
corr <- cor(cuatro$X, cuatro$Y)
# Se guardan en un dataset
resultados4=data.frame(promX,promY,varX,varY,corr)
# Se adicionan
resultados <- rbind(resultados, resultados4)

Visualización del conjunto de datos

Veamos los conjuntos gráficamente usando la libreria ggplot2. Descargue e importe la libreria ggplot2

# omita el signo '#' si no tiene la libreria descargada
# install.packages("ggplot2")

Hacemos la visualización del primer conjunto

#INSTALAR LIBRERIA GGPLOT
# install.packages("rlang")
# install.packages("ggplot2")
#IMPORTAR LIBRERIA
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.3
# Canvas sobre el que vamos a dibujar
plotAns <- ggplot(anscombe,aes(X,Y, colour = Set))

# Diagrama de lineas
plotAns <- plotAns + geom_line()

# Regresion lineal
plotAns <- plotAns + geom_smooth(method=lm, se=FALSE)

# promedio X
plotAns <- plotAns + geom_vline (aes ( xintercept = resultados[1,1]))

# promedio Y
plotAns <- plotAns + geom_hline (aes ( yintercept = resultados[1,2]))
plotAns
## `geom_smooth()` using formula = 'y ~ x'

library(ggplot2)
# Canvas sobre el que vamos a dibujar
plotAns <- ggplot(anscombe,aes(X,Y))
# Diagrama de dispersion
plotAns <- plotAns + geom_point()
# Regresion lineal
plotAns <- plotAns + geom_smooth(method=lm, se=FALSE)
# promedio X
plotAns <- plotAns + geom_vline (aes ( xintercept = resultados[1,1]))
# promedio Y
plotAns <- plotAns + geom_hline (aes ( yintercept = resultados[1,2]))
# facetas
plotAns <- plotAns + facet_grid(. ~ Set)
plotAns
## `geom_smooth()` using formula = 'y ~ x'