1. \(Prueba-t\) para dos muestras independientes

Se midió la conductancia estomática (gs: mol/m^2*s) en dos cultivares de papa diploide (Colombia y Ocarina) bajo una condición de déficit de riego. Parte de los datos se muestran en la siguiente tabla:

Colombia= c(0.45,0.41, 0.42, 0.46,0.39,0.44,0.48,0.42,0.44,0.48,0.50,0.47,0.44,0.52 );Colombia
##  [1] 0.45 0.41 0.42 0.46 0.39 0.44 0.48 0.42 0.44 0.48 0.50 0.47 0.44 0.52
Ocarina= c(0.28,0.25,0.32,0.34,0.36,0.40,0.32,0.36,0.39,0.41,0.37,0.42,0.4,0.35);Ocarina
##  [1] 0.28 0.25 0.32 0.34 0.36 0.40 0.32 0.36 0.39 0.41 0.37 0.42 0.40 0.35
Tabla_1=data.frame(Colombia, Ocarina)
Tabla_2=c(Colombia, Ocarina)
Tabla_3= data.frame(Conductancia= c(Colombia, Ocarina))
Tabla_3$Cultivar=gl(n=2, k=14, length = 28, labels = c("Colombia", "Ocarina"))
Tabla_3
##    Conductancia Cultivar
## 1          0.45 Colombia
## 2          0.41 Colombia
## 3          0.42 Colombia
## 4          0.46 Colombia
## 5          0.39 Colombia
## 6          0.44 Colombia
## 7          0.48 Colombia
## 8          0.42 Colombia
## 9          0.44 Colombia
## 10         0.48 Colombia
## 11         0.50 Colombia
## 12         0.47 Colombia
## 13         0.44 Colombia
## 14         0.52 Colombia
## 15         0.28  Ocarina
## 16         0.25  Ocarina
## 17         0.32  Ocarina
## 18         0.34  Ocarina
## 19         0.36  Ocarina
## 20         0.40  Ocarina
## 21         0.32  Ocarina
## 22         0.36  Ocarina
## 23         0.39  Ocarina
## 24         0.41  Ocarina
## 25         0.37  Ocarina
## 26         0.42  Ocarina
## 27         0.40  Ocarina
## 28         0.35  Ocarina

Prueba de Normalidad de datos Shapiro-wilk test

Hipótesis

\[H_0:\hspace{0.1cm}Los\hspace{0.1cm}datos\hspace{0.1cm}tienen\hspace{0.1cm}distribución\hspace{0.1cm}normal \\H_a:Los\hspace{0.1cm}datos\hspace{0.1cm}no\hspace{0.1cm}tienen\hspace{0.1cm}distribución\hspace{0.1cm}normal\]

stc= shapiro.test(Colombia);stc
## 
##  Shapiro-Wilk normality test
## 
## data:  Colombia
## W = 0.98221, p-value = 0.9856
ifelse(stc$p.value<0.05, 'Rechazo Ho', 'No rechazo Ho')
## [1] "No rechazo Ho"
sto= shapiro.test(Ocarina);sto
## 
##  Shapiro-Wilk normality test
## 
## data:  Ocarina
## W = 0.94337, p-value = 0.4632
ifelse(stc$p.value<0.05, 'Rechazo Ho', 'No rechazo Ho')
## [1] "No rechazo Ho"

Las variedades de papa criolla Ocarina y Colombia presentan un p valor>0.05 por lo que la prueba de Shapiro No rechaza la hipótesis nula y en consecuencia muestra distribución normal en los datos de conductancia estomática para las 2 variedades. Ahora que sabemos que los datos presentan una distribución normal es posible evaluar con una \(prueba-t\) para las medias, pero es necesario evaluar si existe o no igualdad de varianzas.

Pruebas para la igualdad de varianzas

Hipótesis

\[H_0:σ_{Colombia}=σ_{Ocarina} \\H_a:\sigma_{Colombia} \neq σ_{Ocarina}\]

tapply(Tabla_3$Conductancia, Tabla_3$Cultivar, mean) 
##  Colombia   Ocarina 
## 0.4514286 0.3550000
tapply(Tabla_3$Conductancia, Tabla_3$Cultivar, sd) 
##   Colombia    Ocarina 
## 0.03613163 0.04973004

Al calcular la desviación estándar de los datos de cada cultivar se puede observar que el valor obtenido de Ocarina no es muy diferente de Colombia, por lo cual se puede asume que ambas varianzas son estadísticamente iguales. Sin embargo, se aplican pruebas de igualdad de varianzas para confirmar o rechazar dicha afirmación.

Prueb_var=var.test(Tabla_3$Conductancia~Tabla_3$Cultivar);Prueb_var
## 
##  F test to compare two variances
## 
## data:  Tabla_3$Conductancia by Tabla_3$Cultivar
## F = 0.52788, num df = 13, denom df = 13, p-value = 0.2624
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.1694628 1.6443734
## sample estimates:
## ratio of variances 
##          0.5278827
ifelse(Prueb_var$p.value<0.05, "Varianzas desiguales", "Varianzas iguales")
## [1] "Varianzas iguales"
Prueb_var2= bartlett.test(list(Colombia,Ocarina));Prueb_var2
## 
##  Bartlett test of homogeneity of variances
## 
## data:  list(Colombia, Ocarina)
## Bartlett's K-squared = 1.2563, df = 1, p-value = 0.2624
ifelse(Prueb_var2$p.value<0.05, "Varianzas desiguales", "Varianzas iguales")
## [1] "Varianzas iguales"

De esta forma se concluye que las varianzas son estadísticamente iguales usando dos métodos distintos.

\(Prueba-t\) para dos muestras independientes

Para determinar si las medias de conductancia estomática son estadísticamente iguales en los cultivares de papa criolla, se realizó una \(prueba t-student\), con 95% de nivel de confianza y asumiendo igualdad de varianzas.

Planteamiento de la hipótesis

\[H_0:μ_{Colombia}=μ_{Ocarina}\\H_a:μ_{Colombia}\neq μ_{Ocarina}\]

pruebt_1=t.test(Tabla_3$Conductancia~Tabla_3$Cultivar,alternative="t", mu=0,var.equal=T, conf.level=0.95);pruebt_1
## 
##  Two Sample t-test
## 
## data:  Tabla_3$Conductancia by Tabla_3$Cultivar
## t = 5.8696, df = 26, p-value = 3.449e-06
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.06265916 0.13019798
## sample estimates:
## mean in group Colombia  mean in group Ocarina 
##              0.4514286              0.3550000
ifelse(pruebt_1$p.value<0.05,"Rechazo Ho", "No rechazo Ho")
## [1] "Rechazo Ho"

La \(prueba-t\) rechaza la hipótesis nula por lo que se concluye que en las dos variedades las medias de conductancia estomática son estadísticamente diferentes, bajo estrés hídrico presenta mayor conductancia es la variedad Colombia para ver esto en mayor detalle se plantea su visualización gráfica.

Gráficos de cultivar vs conductancia estomática

Gráfico 1 : Boxplot

boxplot(Tabla_3$Conductancia~Tabla_3$Cultivar, main="Medias y distribución de conductancia estomática para Colombia y Ocarina",size=0.05, col='aquamarine4')
points(c(1,2), c(mean(Colombia), mean(Ocarina)), pch =16 ,col="salmon")
text(1.50, mean(Colombia),'Media' ,font=8)
text(1.50, mean(Ocarina),'Media' ,font=8)

Gráfico 2: Boxplot y violin

library(ggplot2)
ggplot(data=Tabla_3, aes(x=Cultivar, y= Conductancia)) + 
  geom_jitter(size = 1, color = 'gray2', alpha = 0.5) +
  geom_violin(aes(fill= Cultivar), color = 'black', alpha = .8 ) +
  geom_boxplot(color = 'gray1', alpha = 0.7) +
    stat_summary(fun= mean, geom="point", shape=20, size=3, color = "red")+
  xlab('Cultivar') + 
  ylab('Conductancia estomática (mol/m^2*s)') +
  ggtitle('Medias y distribución conductancia estomática para Colombia y Ocarina') + 
theme(legend.position = "none")

Gráfico 3: Gráfico de densidad

ggplot2::ggplot(Tabla_3,aes(Conductancia,fill=Cultivar,color=Cultivar))+
  geom_density(alpha=0.2)+ xlim(0.22,0.55) + ggtitle("Distribución conductancia estomática para Colombia y Ocarina")

Como se aprecia Colombia tiene una mayor media y la distribución apunta a que bajo estres esta variedad tiene mayor velocidad de transpiración e intercambio gaseoso y que se ve claramente en la concentración de datos es mayor en Colombia y que se evidencia en la cercania de los datos en los diagramas de boxplot, en la representación de violin y en la gráfica donde es más leptocurtica y Ocarina muestra una curtosis mas mesocurtica..

La prueba y el artículo respalda las varianzas de los datos se pueden considerar estadísticamente iguales con una confianza del 95%. La media de los datos es una buena medida del comportamiento de las variedades de papa diploide. La variedad Colombia destacó y seria la recomendación respecto a Ocarina en un entorno con estres hídrico ya que la conductancia estomática se suele relacionar con la capacidad fotosintética, favoreciendo su crecimiento y rendimiento.

2.\(Prueba t\) para Dos muestras dependientes/pareadas

Se propuso un plan de fertilización en papa criolla tal como se muestra a continuación:

\[N \hspace{1cm} P_2O_5\hspace{1cm} K_2O\hspace{1cm} CaO\hspace{1cm} MgO\hspace{1cm} S\hspace{1cm} Fe\hspace{1cm} Mn\hspace{1cm} Cu\hspace{1cm} Zn\hspace{1cm} B\hspace{1cm} \\ 100\hspace{1.2cm} 50\hspace{1.2cm} 100\hspace{1.2cm} 30\hspace{1.2cm} 24\hspace{1.2cm} 20.0\hspace{1.2cm} 0\hspace{1.2cm} 0\hspace{1.1cm} 0.30\hspace{1cm} 2.00\hspace{1cm} 1.2\]

y se midió a los 45 y 77 días después de la siembra el peso de tubérculos (Kg/ha) más raíces encontrando los siguientes datos:

Peso_45<-c(69,66,72,68,65,66,67,68,69,68,66,68,64,67,60,68)
Peso_77<-c(873,850,832,834,843,840,885,790,905,910,920,840,832,800,759,812)
Tabla_4= data.frame(Peso= c(Peso_45, Peso_77), días= gl(2,16,32, c("45", "77")))

Prueba de Normalidad de datos Shapiro-wilk test

Hipótesis

\[H_0:\hspace{0.1cm}Los\hspace{0.1cm}datos\hspace{0.1cm}tienen\hspace{0.1cm}distribución\hspace{0.1cm}normal \\H_a:Los\hspace{0.1cm}datos\hspace{0.1cm}no\hspace{0.1cm}tienen\hspace{0.1cm}distribución\hspace{0.1cm}normal\]

st45= shapiro.test(Peso_45);st45
## 
##  Shapiro-Wilk normality test
## 
## data:  Peso_45
## W = 0.9099, p-value = 0.1159
ifelse(st45$p.value<0.05, 'Rechazo Ho', 'No rechazo Ho')
## [1] "No rechazo Ho"
st77= shapiro.test(Peso_77);st77
## 
##  Shapiro-Wilk normality test
## 
## data:  Peso_77
## W = 0.96381, p-value = 0.7311
ifelse(st77$p.value<0.05, 'Rechazo Ho', 'No rechazo Ho')
## [1] "No rechazo Ho"

Las variedades de papa criolla Ocarina y Colombia presentan un p valor>0.05 por lo que la prueba de Shapiro No rechaza la hipótesis nula y en consecuencia muestra distribución normal en los datos de conductancia estomática para las 2 variedades. Ahora que sabemos que los datos presentan una distribución normal es posible evaluar con una \(prueba-t\) para las medias, pero es necesario evaluar si existe o no igualdad de varianzas.

\(Prueba t\) para Dos muestras dependientes/pareadas

Hipótesis

\[H_0: \mu_{Peso_{45}}\leq\mu_{Peso_{77}}\\ H_a:\mu_{Peso_{45}}>\mu_{Peso_{77}}\]

Prueb_t2= t.test(Tabla_4$Peso~Tabla_4$días, alternative = "g", paired = T, conf.level=0.95); Prueb_t2
## 
##  Paired t-test
## 
## data:  Tabla_4$Peso by Tabla_4$días
## t = -71.15, df = 15, p-value = 1
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
##  -797.5533       Inf
## sample estimates:
## mean of the differences 
##                -778.375
ifelse(Prueb_t2$p.value<0.05, "Rechazo Ho","No rechazo Ho")
## [1] "No rechazo Ho"

La prueba t pareada muestra que no hubo un rechazo de la hipótesis Ho por lo que se dice que hubo un incrementó considerable de rendimiento en las dos evaluaciones registradas.

Gráficos de comportamiento de las medidas

boxplot(Tabla_4$Peso~Tabla_4$días, main="Rendimiento de los tubérculos a 45 y 77 días",size=0.05, col='aquamarine3') 
points(c(1,2), c(mean(Peso_45), mean(Peso_77)), pch =16 ,col="salmon") 
segments(1.5, mean(Peso_45), 1.5, mean(Peso_77), col = "orange")
text(1.5, 650, "Diferencia\n entre ambas\n medias", pos = 2)
text(1.50, mean(Peso_77),'Media' ,font=8)
text(1.50, mean(Peso_45),'Media' ,font=8)

En el gráfico se puede observar que efectivamente el rendimiento de los tubérculos a los 77 días es mayor que a los 45 días. Además, se observa que la diferencia entre ambas medias es bastante grande, y al aplicar la prueba t-student, esta diferencia se puede considerar evidencia estadistica suficiente para rechazar la hipótesis nula y por tanto, afirmar que los días afectan el rendimiento de los tuberculos.

Cambio relativo porcentual promedio entre 45 y 77 días

Media_45= mean(Peso_45)
Media_77= mean(Peso_77)

Ca_M=((Media_77 - Media_45)/Media_45*100); Ca_M #Cambio Relativo porcentual
## [1] 1162.838
Ca_M1=((Media_77 - Media_45)/Media_77*100); Ca_M1 #Cambio Relativo porcentual
## [1] 92.08133

Al relacionar el cambio relativo porcentual es evidente que creció el peso un 1162.838% desde los 45 días a los 77 y que se traduce en un 11.6 veces aproximadamente si se toma como referencia el peso de los 45 días o 92.1% aprox. si se toma como referencia el peso a los 77 días.

Coeficiente de correlación de Pearson

cor.test(Peso_45,Peso_77,method = "pearson")
## 
##  Pearson's product-moment correlation
## 
## data:  Peso_45 and Peso_77
## t = 1.472, df = 14, p-value = 0.1632
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.1583551  0.7294231
## sample estimates:
##       cor 
## 0.3660872
plot(Peso_77~Peso_45,pch=16,col="salmon", main = "Correlación entre el rendimiento a los 45 y 77 días")

En el gráfico de correlación, se observa que los puntos se encuentran bastante dispersos y no siguen un patron lineal (linea recta), por lo cual, mayor es existente una gran variación entre el peso a 45 y 77 días. Ademas, se obtiene un valor de correlación de Pearson cercano a cero y menor que 0.5, por lo cual se puede afirmar que la dependencia entre ambas variables es muy baja.

Conclusión

Estadísticamente se puede observar que hay incremento de la media de rendimiento de 77 días comparada a la media de 45 días. También, se muestra en los gráficos y pruebas correlación que existe baja correlación y en consewcuencia no podemos asegurar, como ya se habia dicho antes, que este resultado se deba al plan de fertilización.

3.Prueba de Wilcoxon de la suma de rangos para Dos muestras independientes

Se está evaluando la calidad de frito mediante la textura de las hojuelas de papa criolla en dos tipos de aceite (palma y maíz) utilizado para freír en condiciones controladas de tiempo y temperatura. Al final se recolectaron las hijuelas y se evaluó en una escala diagramática la calidad de frito (escala de 1 a 5, desde (1) no crujiente hasta (5) bastante crujientes). Los datos se muestran a continuación:

Tex_Pa=c(3,4,3,4,4,3,3,4,4,3,4,4,2,4,3,4,3,3,3,4,4) #Datos de Textura (calidad del frito) con aceite de palma
Tex_Ma=c(3,4,4,4,4,4,3,4,3,4,4,4,4,3,4,4,4,3,3,4,3) #Datos de Textura (calidad del frito) con aceite de maíz
Tab_1= data.frame(Tex_Pa, Tex_Ma)
Tab_2 = data.frame(Textura = c(Tex_Pa, Tex_Ma)) #Vector Textura
Tab_2$Aceite = gl(n=2, k=21, length= 42, labels = c("Palma", "Maíz"))

Determinar al 95% de nivel de confianza si existen diferencias estadísticas en las medianas de la textura para los dos tipos de aceite. Haga una representación gráfica para ilustrar el comportamiento de ambas medidas. Explique sus resultados.

Planteamiento de Hipótesis

Debido a que tenemos varibales que no son continuas se tendrá en cuenta las medianas para la textura y la prueba de Wilcoxon \[H_0:Mediana_{Tex_{Pa}}=Mediana_{Tex_{Ma}} \\H_a:Mediana_{Tex_{Pa}}\neq Mediana_{Tex_{Ma}}\] ### Prueba de wilcoxon para dos muestras independientes Las muestras independientes por lo que la calidad del frito en cuanto a textura en aceite de palma no influye en la calidad de frito en cuanto a textura en aceite de maiz, es decir, uno no afecta el otro.

wil_test=wilcox.test (Tex_Pa, Tex_Ma, mu = 0, alternativa = "t", conf.level = 0.95, 
            exact = FALSE, correct = FALSE) 
wil_test
## 
##  Wilcoxon rank sum test
## 
## data:  Tex_Pa and Tex_Ma
## W = 185.5, p-value = 0.3042
## alternative hypothesis: true location shift is not equal to 0
ifelse(wil_test$p.value<0.05, 'Rechazo Ho', 'No rechazo Ho')
## [1] "No rechazo Ho"

Con el p_valor no se rechaza la hipotesis nula, porque 0.3042> 0.05. Esto indica que no hay diferencia en la mediana de la calidad de textura, independientemente del aceite que se use, ya sea de palma o de maiz. Sin embargo, se hace un gráfico que acompañe estas interpretaciones y ayude a tomar desiciones si es el caso. Un grafico que muestre si las medianas de la calidad de textura de las papas en aceite de palma es igual a la calidad de textura de las papas en aceite de maiz:

Gráficos de la distribución de la calidad de fritura en los tipos de aceite

par(mfrow = c(1,2)) # Función para meter los dos gráficos en una sola pantalla
boxplot(Tex_Pa, ylim = c(1.5,4.5), main = 'Distribución calidad de fritura \n en aceite de palma', col='salmon')
text(1.38, median(Tex_Pa), 'Mediana',font=9)
boxplot(Tex_Ma, ylim = c(1.5,4.5), main = 'Distribución calidad de fritura \n en aceite de maíz', col='salmon')
text(1.38, median(Tex_Ma), 'Mediana', font=9)

ggplot(data = Tab_2 , aes(x = Aceite , y = Textura)) + 
  geom_jitter(size = 1, color = 'gray2', alpha = 0.5) +
  geom_violin(aes(fill = Aceite), color = 'black', alpha = .8 ) +
  geom_boxplot(color = 'black', alpha = 0.7) + 
    stat_summary(fun=median, geom="point", shape=23, size=2, color = "red")+
  xlab('Aceite') + 
  ylab('Textura') +
  ggtitle('Calidad de textura en ambos tipos de aceite') + 
  theme(legend.position = "none")

Conclusiones

Las representaciones gráficas dejan en evidencia que la distribución de los datos en el caso del aceite de maiz se observan valores mas uniformes que varian entre 3 y 4, con mayor concentración en el 4, mientras que en el aceite de palma se encuentran calidades más bajas aunque en baja frecuencia, que alcanzan valores de 2. Por lo tanto, sería mas beneficioso usar aceite de maíz ya que al haber mayor homogeneización de los datos, las hojuelas resultaran ser mas crujientes en la mayoría de situaciones.

La prueba de Wilcoxon permite concluir que independientemente del aceite utilizado, hay en su gran mayoría calidad de fritura menor o igual a 4, que el artículo llama categorías moderadamente crujiente y bastante crujiente, estas calidades se reconocen como buenas para comecializarse. Se puede elegir cualquiera de los dos. Es más importante tener presentes otros factores al momento de realizar un frito, la variedad de la papa, la cantidad de carbohidratos en posteriores análisis.