setwd("~/VERANOPYE")
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2")

El siguiente cuadro muestra los datos de un experimento de comparación de los kilogramos de semillas de Pinus pseudostrobes obtenidos de 10 árboles en el año 2010 (antes) y en el año 2013 (después).

Kilogranos de semillas obtenidas en dos años diferentes (2010 y 2013) de la especie Pinus pseudostrobus

semillas <- read_csv("semilla.csv")
## Parsed with column specification:
## cols(
##   Kilogramos = col_double(),
##   tiempo = col_character()
## )

Datos del experimento:

El siguiente cuadro muestra los datos de un experimento de comparación de los kilogramos de semillas de Pinus pseudostrobes obtenidos de 10 árboles en el año 2010 (antes) y en el año 2013 (después).

datatable(semillas)

La H0 de este ejemplo dice que la cantidad de kilogramos obtenida en el año 2010 es igual a la cantidad obtenida en el año 2013, en el caso contrario estamos hablando de la H1.

T2010 <- subset(semillas, tiempo == "T2010" )
T2013 <- subset(semillas, tiempo == "T2013" )

Asignación

Gráficos de caja y bigote para los subconjuntos 2010 y 2013

boxplot(semillas$Kilogramos ~ semillas$tiempo, col = "pink"  )

5 Números de Tukey

fivenum(T2010$Kilogramos)
## [1] 3.0 5.0 6.0 7.5 9.0
fivenum(T2013$Kilogramos)
## [1] 3.0 4.0 5.0 7.5 9.0

Histogramas

hist(T2010$Kilogramos)

summary(T2010$Kilogramos)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.000   5.000   6.000   6.125   7.250   9.000
sd(T2010$Kilogramos)
## [1] 1.892969
hist(T2013$Kilogramos)

summary(T2013$Kilogramos)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.000   4.000   5.000   5.562   7.250   9.000
sd(T2013$Kilogramos)
## [1] 1.931105

Caja y bigote comparando las desviaciones con gráfico de barra

op <- par(mfrow=c(1,2), cex.axis=0.7, cex.lab=0.9)

boxplot(semillas$Kilogramos ~ semillas$tiempo, col="grey", main="A")

barplot(tapply(semillas$Kilogramos, list(semillas$tiempo), mean), beside = T, main="B")

Pruebas de normalidad (las 2)

Prueba de normalidad de Shapiro-Wilk

shapiro.test(T2010$Kilogramos)
## 
##  Shapiro-Wilk normality test
## 
## data:  T2010$Kilogramos
## W = 0.92998, p-value = 0.2436
shapiro.test(T2013$Kilogramos)
## 
##  Shapiro-Wilk normality test
## 
## data:  T2013$Kilogramos
## W = 0.9158, p-value = 0.1444

Prueba de normalidad de Kolmogorov-Smirnov

ks.test(T2010$Kilogramos,"pnorm", mean=mean(T2010$Kilogramos), sd=sd(T2010$Kilogramos))
## Warning in ks.test(T2010$Kilogramos, "pnorm", mean = mean(T2010$Kilogramos), :
## ties should not be present for the Kolmogorov-Smirnov test
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  T2010$Kilogramos
## D = 0.16135, p-value = 0.7991
## alternative hypothesis: two-sided
ks.test(T2013$Kilogramos,"pnorm", mean=mean(T2013$Kilogramos), sd=sd(T2013$Kilogramos))
## Warning in ks.test(T2013$Kilogramos, "pnorm", mean = mean(T2013$Kilogramos), :
## ties should not be present for the Kolmogorov-Smirnov test
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  T2013$Kilogramos
## D = 0.17708, p-value = 0.6973
## alternative hypothesis: two-sided

Prueba de t

t.test(T2010$Kilogramos, T2013$Kilogramos, var.equal = T,) 
## 
##  Two Sample t-test
## 
## data:  T2010$Kilogramos and T2013$Kilogramos
## t = 0.83205, df = 30, p-value = 0.412
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.8181596  1.9431596
## sample estimates:
## mean of x mean of y 
##    6.1250    5.5625

Prueba de F

var.test(T2010$Kilogramos, T2013$Kilogramos)
## 
##  F test to compare two variances
## 
## data:  T2010$Kilogramos and T2013$Kilogramos
## F = 0.96089, num df = 15, denom df = 15, p-value = 0.9394
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.3357312 2.7501671
## sample estimates:
## ratio of variances 
##          0.9608939