knitr::opts_chunk$set(echo = TRUE)
Importo dataset
anscombe <- read.csv2("C:/Users/Julian/Desktop/ejercicios univalle/anscombe2/anscombe.csv")
str(anscombe)
## 'data.frame': 44 obs. of 3 variables:
## $ Set: int 1 1 1 1 1 1 1 1 1 1 ...
## $ X : int 10 8 13 9 11 14 6 4 12 7 ...
## $ Y : num 8.04 6.95 7.58 8.81 8.33 ...
summary(anscombe)
## Set X Y
## Min. :1.00 Min. : 4 Min. : 3.100
## 1st Qu.:1.75 1st Qu.: 7 1st Qu.: 6.117
## Median :2.50 Median : 8 Median : 7.520
## Mean :2.50 Mean : 9 Mean : 7.501
## 3rd Qu.:3.25 3rd Qu.:11 3rd Qu.: 8.748
## Max. :4.00 Max. :19 Max. :12.740
anscombe$Set<-as.factor(anscombe$Set)
str(anscombe)
## 'data.frame': 44 obs. of 3 variables:
## $ Set: Factor w/ 4 levels "1","2","3","4": 1 1 1 1 1 1 1 1 1 1 ...
## $ X : int 10 8 13 9 11 14 6 4 12 7 ...
## $ Y : num 8.04 6.95 7.58 8.81 8.33 ...
uno<-subset(anscombe, Set=="1")
dos<-subset(anscombe, Set=="2")
tres<-subset(anscombe, Set=="3")
cuatro<-subset(anscombe, Set=="4")
Se calcula los datos de las estadísticas descriptivas (media, varianza, correlación, para cada subconjunto de datos -uno, dos, tres y cuatro)
Xprom1<-mean(uno$X)
Yprom1<-mean(uno$Y)
Xvar1<-var(uno$X)
Yvar1<-var(uno$Y)
Corr1<-cor(uno$X, uno$Y)
#se guarda en un dataset
resumenstat1<-data.frame(Xprom1,Yprom1,Xvar1,Yvar1,Corr1)
resumenstat1
## Xprom1 Yprom1 Xvar1 Yvar1 Corr1
## 1 9 7.500909 11 4.127269 0.8164205
Usamos la librería ggplot2 para realizar las gráficas
library(ggplot2)
# creo objeto ggplot
grafica<- ggplot(anscombe, aes(X,Y, group=Set,color=Set))
#adiciono geometría de puntos
grafica<- grafica +geom_point()
#adiciono geometría de líneas
#grafica<- grafica +geom_line()
grafica<- grafica +geom_smooth(method = lm, se= FALSE)
#dividir en facetas
grafica<-grafica+facet_grid(.~Set)
# Dibujo el objeto en ggplot
grafica