setwd("~/PyE verano 2020")
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2")

semillas

El siguiente cuadro muestra los datos de un experimento de comparación de los kilogramos de semillas de Pinus pseudostrobes obtenidos de 10 árboles en el año 2010 (antes) y en el año 2013 (después).

Kilogranos de semillas obtenidas en dos años diferentes (2010 y 2013) de la especie Pinus pseudostrobus

semillas <- read_csv("semilla.csv")
## Parsed with column specification:
## cols(
##   Kilogramos = col_double(),
##   tiempo = col_character()
## )

datos del experimento:

El siguiente cuadro muestra los datos de un experimento de comparación de los kilogramos de semillas de Pinus pseudostrobes obtenidos de 10 árboles en el año 2010 (antes) y en el año 2013 (después).

datatable(semillas)

a H0 de este ejemplo dice que la cantidad de kilogramos obtenida en el año 2010 es igual a la cantidad obtenida en el año 2013, en el caso contrario estamos hablando de la H1.

T2010 <- subset(semillas, tiempo == "T2010")
T2013 <- subset(semillas, tiempo == "T2013")
  1. grafico de caja y bigote para los subconjuntos de 2010 y 2013
boxplot(T2010$Kilogramos ~ T2013$Kilogramos, col="blue")

  1. 5 numero de tukey
fivenum(T2010$Kilogramos)
## [1] 3.0 5.0 6.0 7.5 9.0
fivenum(T2013$Kilogramos)
## [1] 3.0 4.0 5.0 7.5 9.0
  1. histogramas
hist(T2010$Kilogramos)

hist(T2013$Kilogramos, col = "green")

  1. caja y bigotes comparando las desviaciones con grafico de barra
op <- par(mfrow =c(1,2), cex.axis=.7, cex.lab=.9 )

boxplot(T2010$Kilogramos ~ T2013$Kilogramos, col="blue", main= "A") 

barplot(tapply(T2010$Kilogramos, list(T2013$Kilogramos), mean ), beside = T, main="B"                             )

  1. pruebas de normalidad (las 2)
shapiro.test(T2010$Kilogramos)
## 
##  Shapiro-Wilk normality test
## 
## data:  T2010$Kilogramos
## W = 0.92998, p-value = 0.2436
shapiro.test(T2013$Kilogramos)
## 
##  Shapiro-Wilk normality test
## 
## data:  T2013$Kilogramos
## W = 0.9158, p-value = 0.1444
ks.test(T2010$Kilogramos, "pnorm", mean= mean(T2010$Kilogramos), sd=sd(T2010$Kilogramos))
## Warning in ks.test(T2010$Kilogramos, "pnorm", mean = mean(T2010$Kilogramos), :
## ties should not be present for the Kolmogorov-Smirnov test
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  T2010$Kilogramos
## D = 0.16135, p-value = 0.7991
## alternative hypothesis: two-sided
ks.test(T2013$Kilogramos, "pnorm", mean= mean(T2013$Kilogramos), sd=sd(T2013$Kilogramos))
## Warning in ks.test(T2013$Kilogramos, "pnorm", mean = mean(T2013$Kilogramos), :
## ties should not be present for the Kolmogorov-Smirnov test
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  T2013$Kilogramos
## D = 0.17708, p-value = 0.6973
## alternative hypothesis: two-sided
  1. pruebas de t
t.test(T2010$Kilogramos, T2013$Kilogramos, var.equal = T)
## 
##  Two Sample t-test
## 
## data:  T2010$Kilogramos and T2013$Kilogramos
## t = 0.83205, df = 30, p-value = 0.412
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.8181596  1.9431596
## sample estimates:
## mean of x mean of y 
##    6.1250    5.5625

estos datos obtenidos de la prueba de t son; grados de libertad = 30 ; para saber si se debe rechazar o aceptar este estudio devemos fijarnos en la probbilidad de normalidad que es p-value = 0.412.

  1. pruebas de F
var.test(T2010$Kilogramos, T2013$Kilogramos)
## 
##  F test to compare two variances
## 
## data:  T2010$Kilogramos and T2013$Kilogramos
## F = 0.96089, num df = 15, denom df = 15, p-value = 0.9394
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.3357312 2.7501671
## sample estimates:
## ratio of variances 
##          0.9608939

igual e este estudio tenemos grados de libertad de 15 con una p-value de 0.9394.