anscombe <- read.csv2("C:/Users/omjas/Desktop/anscombe.csv")
# Imprimir la estructura de datos
str(anscombe)
## 'data.frame': 44 obs. of 3 variables:
## $ Set: int 1 1 1 1 1 1 1 1 1 1 ...
## $ X : int 10 8 13 9 11 14 6 4 12 7 ...
## $ Y : num 8.04 6.95 7.58 8.81 8.33 ...
#convertir a Variable categorica
anscombe$Set <- as.factor(anscombe$Set)
str(anscombe)
## 'data.frame': 44 obs. of 3 variables:
## $ Set: Factor w/ 4 levels "1","2","3","4": 1 1 1 1 1 1 1 1 1 1 ...
## $ X : int 10 8 13 9 11 14 6 4 12 7 ...
## $ Y : num 8.04 6.95 7.58 8.81 8.33 ...
#Se crean los subconjuntos para cada valor seT (seT==1, seT==2, seT==3, seT==4)
uno <- subset(anscombe, Set=="1")
dos <- subset(anscombe, Set=="2")
tres <- subset(anscombe, Set=="3")
cuatro <- subset(anscombe, Set=="4")
#Calcule el promedio, varianza, y correlación para cada objeto y guárdelos en una dataframe
XProm <- mean(uno$X)
YProm <- mean (uno$Y)
Xvar <- var(uno$X)
Yvar <- var(uno$Y)
Corr <- cor(uno$X, uno$Y)
# Se guardan en un dataset
SummaryStats <- data.frame(XProm, YProm, Xvar, Yvar, Corr)
SummaryStats
## XProm YProm Xvar Yvar Corr
## 1 9 7.500909 11 4.127269 0.8164205
##VISUALIZACIÓN DE LOS DATOS #se verificó que estuviese instalado (ggplot2) esta libreria permite crear facetas y trazar la regresión lineal
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.0.5
# creo objeto gráfico (diseño gráfico)
grafica <- ggplot(anscombe,aes(X,Y, group=Set, color=Set))
# Diagrama de puntos
grafica <- grafica + geom_point()
# Diagrama de lineas
grafica <- grafica + geom_line()
# Regresion lineal
grafica <- grafica + geom_smooth(method=lm, se= FALSE)
#Divido en facetas
grafica <- grafica + facet_grid(.~Set) #El Set hace referencia a los conjuntos (1,2,3 y 4)
#Se imprIme gráfico
grafica
## `geom_smooth()` using formula 'y ~ x'