knitr::opts_chunk$set(echo = TRUE)

ANALISIS ANSCOMBE

Importo dataset

anscombe <- read.csv2("C:/Users/Julian/Desktop/ejercicios univalle/anscombe2/anscombe.csv") 

str(anscombe)
## 'data.frame':    44 obs. of  3 variables:
##  $ Set: int  1 1 1 1 1 1 1 1 1 1 ...
##  $ X  : int  10 8 13 9 11 14 6 4 12 7 ...
##  $ Y  : num  8.04 6.95 7.58 8.81 8.33 ...
summary(anscombe)
##       Set             X            Y         
##  Min.   :1.00   Min.   : 4   Min.   : 3.100  
##  1st Qu.:1.75   1st Qu.: 7   1st Qu.: 6.117  
##  Median :2.50   Median : 8   Median : 7.520  
##  Mean   :2.50   Mean   : 9   Mean   : 7.501  
##  3rd Qu.:3.25   3rd Qu.:11   3rd Qu.: 8.748  
##  Max.   :4.00   Max.   :19   Max.   :12.740
anscombe$Set<-as.factor(anscombe$Set)
str(anscombe)
## 'data.frame':    44 obs. of  3 variables:
##  $ Set: Factor w/ 4 levels "1","2","3","4": 1 1 1 1 1 1 1 1 1 1 ...
##  $ X  : int  10 8 13 9 11 14 6 4 12 7 ...
##  $ Y  : num  8.04 6.95 7.58 8.81 8.33 ...
uno<-subset(anscombe, Set=="1")
dos<-subset(anscombe, Set=="2")
tres<-subset(anscombe, Set=="3") 
cuatro<-subset(anscombe, Set=="4")

ESTADISTICAS DESCRIPTIVAS

Se calcula los datos de las estadísticas descriptivas (media, varianza, correlación, para cada subconjunto de datos -uno, dos, tres y cuatro)

Xprom1<-mean(uno$X)
Yprom1<-mean(uno$Y)
Xvar1<-var(uno$X)
Yvar1<-var(uno$Y)
Corr1<-cor(uno$X, uno$Y)
#se guarda en un dataset
resumenstat1<-data.frame(Xprom1,Yprom1,Xvar1,Yvar1,Corr1)
resumenstat1
##   Xprom1   Yprom1 Xvar1    Yvar1     Corr1
## 1      9 7.500909    11 4.127269 0.8164205

GRAFICAS

Usamos la librería ggplot2 para realizar las gráficas

library(ggplot2)
# creo objeto ggplot
grafica<- ggplot(anscombe, aes(X,Y, group=Set,color=Set))

#adiciono geometría de puntos
grafica<- grafica +geom_point() 

#adiciono geometría de líneas
#grafica<- grafica +geom_line()

grafica<- grafica +geom_smooth(method = lm, se= FALSE)
#dividir en facetas
grafica<-grafica+facet_grid(.~Set)
# Dibujo el objeto en ggplot

grafica