#Cuarteto de Anscombe
#Importar los datos
anscombe <- read.csv2("C:/Users/jeank/Google Drive (sanchez.jean@correounivalle.edu.co)/MAESTRÍA INGENIERÍA INDUSTRIAL/SEMESTRE 3/INTELIGENCIA DE NEGOCIOS/2. MODULO 2/datasets/Anscombe/anscombe.csv", stringsAsFactors=TRUE)
str(anscombe)
## 'data.frame': 44 obs. of 3 variables:
## $ Set: int 1 1 1 1 1 1 1 1 1 1 ...
## $ X : int 10 8 13 9 11 14 6 4 12 7 ...
## $ Y : num 8.04 6.95 7.58 8.81 8.33 ...
anscombe$Set <- as.factor(anscombe$Set)
str(anscombe)
## 'data.frame': 44 obs. of 3 variables:
## $ Set: Factor w/ 4 levels "1","2","3","4": 1 1 1 1 1 1 1 1 1 1 ...
## $ X : int 10 8 13 9 11 14 6 4 12 7 ...
## $ Y : num 8.04 6.95 7.58 8.81 8.33 ...
##Dividir en subgrupos
uno <-subset(anscombe,anscombe$Set =="1")
promX <- mean(uno$X)
varX <- var(uno$X)
promY <- mean(uno$Y)
varY <- var(uno$Y)
corr <- cor(uno$X,uno$Y)
resultados=data.frame(promX,promY,varX,varY,corr)
dos <- subset(anscombe, Set=="2")
promX <- mean(dos$X)
promY <- mean (dos$Y)
varX <- var(dos$X)
varY <- var(dos$Y)
corr <- cor(dos$X, dos$Y)
resultados2=data.frame(promX,promY,varX,varY,corr)
resultados <- rbind(resultados, resultados2)
# ****
tres <- subset(anscombe, Set=="3")
promX <- mean(tres$X)
promY <- mean (tres$Y)
varX <- var(tres$X)
varY <- var(tres$Y)
corr <- cor(tres$X, tres$Y)
resultados3=data.frame(promX,promY,varX,varY,corr)
resultados <- rbind(resultados, resultados3)
# ****
cuatro <- subset(anscombe, Set=="4")
promX <- mean(cuatro$X)
promY <- mean (cuatro$Y)
varX <- var(cuatro$X)
varY <- var(cuatro$Y)
corr <- cor(cuatro$X, cuatro$Y)
resultados4=data.frame(promX,promY,varX,varY,corr)
resultados <- rbind(resultados, resultados4)
# omita el signo '#' si no tiene la libreria descargada
# install.packages("ggplot2")
# install.packages("rlang")
# install.packages("ggplot2")
#IMPORTAR LIBRERIA
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.3
# Canvas sobre el que vamos a dibujar
plotAns <- ggplot(anscombe,aes(X,Y, colour = Set))
# Diagrama de lineas
plotAns <- plotAns + geom_line()
# Regresion lineal
plotAns <- plotAns + geom_smooth(method=lm, se=FALSE)
# promedio X
plotAns <- plotAns + geom_vline (aes ( xintercept = resultados[1,1]))
# promedio Y
plotAns <- plotAns + geom_hline (aes ( yintercept = resultados[1,2]))
plotAns
## `geom_smooth()` using formula = 'y ~ x'
library(ggplot2)
# Canvas sobre el que vamos a dibujar
plotAns <- ggplot(anscombe,aes(X,Y))
# Diagrama de dispersion
plotAns <- plotAns + geom_point()
# Regresion lineal
plotAns <- plotAns + geom_smooth(method=lm, se=FALSE)
# promedio X
plotAns <- plotAns + geom_vline (aes ( xintercept = resultados[1,1]))
# promedio Y
plotAns <- plotAns + geom_hline (aes ( yintercept = resultados[1,2]))
# facetas
plotAns <- plotAns + facet_grid(. ~ Set)
plotAns
## `geom_smooth()` using formula = 'y ~ x'