El déficit hídrico en la papa (S. tuberosum L.) reduce la conductancia estomática, lo que resulta en una disminución en la tasa de fotosíntesis y un aumento de especies reactivas de oxígeno (Ariza, et al, 2020)
Con los datos resportados de la conductancia estomática (gs: mol/m2s) en dos cultivares de papa diploide, Colombia y Ocarina los cuales estan bajo una condición de déficit de riego. Se designan las variables como: ce_col = Conductividad estomatica en Cultivar Colombia ce_oca = Conductividad estomatica en Cultivar Ocarina
ce_col <- c(0.45, 0.41, 0.41, 0.46, 0.39, 0.44, 0.48, 0.42, 0.44, 0.48, 0.50, 0.47, 0.44, 0.52)
ce_oca <- c(0.28, 0.25, 0.32, 0.34, 0.36, 0.40, 0.31, 0.36, 0.39, 0.41, 0.37, 0.42, 0.41)
La hipotesis planteada gira entorno a la igualdad de las medias de los cultivares
\[H_o: \mu_{Colombia} = \mu_{Ocarina}\\ H_a: \mu_{Colombia} \neq \mu_{Ocarina}\]
Para organizar mejor la información se coloca en un dataframe, sin embargo, se observa que la conductividad estomatica medida en ambos no es igual. Así pues, se saca la media de los datos del cultivar ocarina y se le asigna al espacio faltante del mismo. Se procede a nombrarlo como “oca_comp”
length(ce_col)
## [1] 14
length(ce_oca)
## [1] 13
mean(ce_oca)
## [1] 0.3553846
Oca_comp <- c(ce_oca, 0.35)
df1 <- data.frame(ce_col, Oca_comp)
names(df1) <- c('COLOMBIA', 'OCARINA')
daty= c(ce_col, Oca_comp)
datx=gl(n=2, k= 14, length = 28, labels = c('Colombia', 'Ocarina') )
df1
## COLOMBIA OCARINA
## 1 0.45 0.28
## 2 0.41 0.25
## 3 0.41 0.32
## 4 0.46 0.34
## 5 0.39 0.36
## 6 0.44 0.40
## 7 0.48 0.31
## 8 0.42 0.36
## 9 0.44 0.39
## 10 0.48 0.41
## 11 0.50 0.37
## 12 0.47 0.42
## 13 0.44 0.41
## 14 0.52 0.35
dff1 <- data.frame(Variedad=datx, Conductividad=daty)
Para verificar si los datos siguen una distribución normal se usa la prueba de shapiro correspondiente a la siguiente ecuación.
\[W = \frac{(\displaystyle\sum_{i=1}^n a_ix_{(i)})^2}{\displaystyle\sum_{i=1}n(x_i-\overline x)^2}\]
test_norm_col<-shapiro.test(ce_col); test_norm_col
##
## Shapiro-Wilk normality test
##
## data: ce_col
## W = 0.97833, p-value = 0.964
test_norm_oca<-shapiro.test(Oca_comp); test_norm_oca
##
## Shapiro-Wilk normality test
##
## data: Oca_comp
## W = 0.94443, p-value = 0.4781
prub_norm = data.frame(test_norm_col$p.value, test_norm_oca$p.value)
prub_norm
## test_norm_col.p.value test_norm_oca.p.value
## 1 0.9639648 0.4780639
Para confirmas la normalidad de los datos se realiza el shapiro test para ambas variables
ifelse(test_norm_col$p.value<0.05, "Datos no normales", "Datos normales")
## [1] "Datos normales"
ifelse(test_norm_oca$p.value<0.05, "Datos no normales", "Datos normales")
## [1] "Datos normales"
Por medio de la libreria “psych” se observa la media de los cultivares Colombia y Ocarina. Además, se verifica la igualdad de las varianzas siendo de 1.
library(psych)
d_col<-describe(ce_col); d_col
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 14 0.45 0.04 0.44 0.45 0.04 0.39 0.52 0.13 0.17 -1.05 0.01
d_oca<-describe(ce_oca); d_oca
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 13 0.36 0.05 0.36 0.36 0.06 0.25 0.42 0.17 -0.52 -1.05 0.01
CE_describe <-describeBy(ce_col, Oca_comp)
Para confirmar por otro metodo lo anteriormente mencionado se realizo la prueba de varianza.
prueba_var=var.test(ce_col, Oca_comp); prueba_var
##
## F test to compare two variances
##
## data: ce_col and Oca_comp
## F = 0.52114, num df = 13, denom df = 13, p-value = 0.2531
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.1672997 1.6233838
## sample estimates:
## ratio of variances
## 0.5211445
ifelse(prueba_var$p.value<0.05,'Varianza desiguales','Varianzas iguales')
## [1] "Varianzas iguales"
Acontinuación se muestra la función de t de student para muestras independientes y varianzas iguales
\[t.student=\frac{ \overline x_{Colombia} - \overline x_{Ocarina}}{\sqrt{s^2 (\frac{1}{n_{Colombia}}+\frac{1}{n_{Ocarina}})}}\]
pr1=t.test(ce_col, Oca_comp, alternative='t', var.equal=T); pr1
##
## Two Sample t-test
##
## data: ce_col and Oca_comp
## t = 5.6821, df = 26, p-value = 5.612e-06
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 0.06108902 0.13033955
## sample estimates:
## mean of x mean of y
## 0.4507143 0.3550000
ifelse(pr1$p.value < 0.05, 'Rechazo Ho', 'No rechazo Ho')
## [1] "Rechazo Ho"
Finalmente se rechaza la hipotesis nula, ya que las medias no son iguales en ambos cultivares. Para entender mejor el evento se enseñan los siguientes graficos
library(ggplot2)
##
## Attaching package: 'ggplot2'
## The following objects are masked from 'package:psych':
##
## %+%, alpha
df1 <- data.frame(ce_col, Oca_comp)
names(df1) <- c('COLOMBIA', 'OCARINA')
daty= c(ce_col, Oca_comp)
datx=gl(n=2, k= 14, length = 28, labels = c('Colombia', 'Ocarina') )
df1
## COLOMBIA OCARINA
## 1 0.45 0.28
## 2 0.41 0.25
## 3 0.41 0.32
## 4 0.46 0.34
## 5 0.39 0.36
## 6 0.44 0.40
## 7 0.48 0.31
## 8 0.42 0.36
## 9 0.44 0.39
## 10 0.48 0.41
## 11 0.50 0.37
## 12 0.47 0.42
## 13 0.44 0.41
## 14 0.52 0.35
dff1 <- data.frame(Variedad=datx, Conductividad=daty)
ggplot(dff1, aes(Conductividad, fill = Variedad))+geom_density(alpha=0.8)
ggplot(dff1, aes(y= Conductividad, x = Variedad, fill = Variedad))+geom_violin()+geom_boxplot()
La variedad Colombia muestra una conductancia mayor que la ocarina como se evidencia en el grafico. Ademas de esto, los boxplots en los diagramas de violines enseñan tambien una diferencia de medianas.
Según el articulo se puede afirmar que las varianzas son iguales debido a que en el paso de tiempo despues del octavo dia de deficit de riego la conductancia estomatica en baja y no se observa una variación, esto se puede confirmar con las anteriores pruebas realizadas.
Se propuso un plan de fertilizacion en papas criollas, se mide el peso de los tuberculos a los 44 dias, y posteriormente a los 77 dias. Se incrementa el rendimiento en las dos evaluaciones?
\[ H_o: \mu_{44d} = \mu_{77d}\\ H_a: \mu_{44} \neq \mu_{77d} \]
muestreo_44<-c(69,66,72,68,65,66,67,68,69,66,66,68,64,67,60,68);muestreo_44
## [1] 69 66 72 68 65 66 67 68 69 66 66 68 64 67 60 68
muestreo_77<-c(873,850,832,834,843,840,865,790,905,910,920,840,832,800,759,812);muestreo_77
## [1] 873 850 832 834 843 840 865 790 905 910 920 840 832 800 759 812
testnorm44<-shapiro.test(muestreo_44)
testnorm77<-shapiro.test(muestreo_77)
ifelse(testnorm44$p.value<0.05, 'no presenta distribucion normal','presenta distribucion normal')
## [1] "presenta distribucion normal"
ifelse(testnorm77$p.value<0.05,'no presenta distribucion normal','presenta distribucion normal')
## [1] "presenta distribucion normal"
library(psych)
describe(muestreo_44)
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 16 66.81 2.61 67 66.93 1.48 60 72 12 -0.63 1.03 0.65
describe(muestreo_77)
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 16 844.06 43.74 840 844.71 39.29 759 920 161 0.07 -0.73 10.93
df1<-data.frame(rtocri = c(muestreo_44, muestreo_77), dia_de_muestreo = gl(2, 16, 32, labels = c('muestreo_44_d','muestreo_77-d')));df1
## rtocri dia_de_muestreo
## 1 69 muestreo_44_d
## 2 66 muestreo_44_d
## 3 72 muestreo_44_d
## 4 68 muestreo_44_d
## 5 65 muestreo_44_d
## 6 66 muestreo_44_d
## 7 67 muestreo_44_d
## 8 68 muestreo_44_d
## 9 69 muestreo_44_d
## 10 66 muestreo_44_d
## 11 66 muestreo_44_d
## 12 68 muestreo_44_d
## 13 64 muestreo_44_d
## 14 67 muestreo_44_d
## 15 60 muestreo_44_d
## 16 68 muestreo_44_d
## 17 873 muestreo_77-d
## 18 850 muestreo_77-d
## 19 832 muestreo_77-d
## 20 834 muestreo_77-d
## 21 843 muestreo_77-d
## 22 840 muestreo_77-d
## 23 865 muestreo_77-d
## 24 790 muestreo_77-d
## 25 905 muestreo_77-d
## 26 910 muestreo_77-d
## 27 920 muestreo_77-d
## 28 840 muestreo_77-d
## 29 832 muestreo_77-d
## 30 800 muestreo_77-d
## 31 759 muestreo_77-d
## 32 812 muestreo_77-d
boxplot(df1$rtocri , df1$dia_de_muestreo)
axis(1, 1, '77 dias', pos = -200)
axis(1, 2, '44 dias', pos = -200)
pruebat<-t.test(muestreo_44, muestreo_77, alternative = 't', paired = T);pruebat
##
## Paired t-test
##
## data: muestreo_44 and muestreo_77
## t = -72.248, df = 15, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -800.1804 -754.3196
## sample estimates:
## mean of the differences
## -777.25
ifelse(pruebat$p.value<0.05, 'Rechazo Ho','No rechazo Ho')
## [1] "Rechazo Ho"
camb_rel<-((mean(muestreo_77)-mean(muestreo_44))/mean(muestreo_44))*100
rcamb<- round(camb_rel, 2)
c(rcamb, '%')
## [1] "1163.33" "%"
covpr<-cov(muestreo_44, muestreo_77)
de_m1<-sd(muestreo_44)
de_m2<-sd(muestreo_77)
co_cr_pear<-covpr/(de_m1*de_m2)
round(co_cr_pear, 2)
## [1] 0.3
Observando los datos de la estadistica descriptiva se puede asumir que hay diferencia entre las medias de los datos obtenidos en un muestreo y otro, idea que se refuerza al hacer la prueba t pareada y la grafica de cajas, ademas de esto el indice de correlacion de paerson es de 0.3, lo cual indica que hay una correlacion baja entre los datos obtenidos.
Para evaluar la calidad de frito mediante la textura de las hojuelas de papa criolla en dos tipos de aceite (palma y maíz) utilizado para freír en condiciones controladas de tiempo y temperatura. Se recolectaron las hijuelas y se evaluó en una escala diagramática la calidad de frito (escala de 1 a 5, desde (1) no crujiente hasta (5) bastante crujientes).
La hipotesis nula abarcara si existen diferencias estadísticas en las medianas de la textura para el tipo de aceite de palma y maiz.
\[H_0: Mediana_{Palma} = Mediana_{Maiz}\\ H_a: Mediana_{Palma} \neq Mediana_{Maiz}\]
Palma <- c(3, 4, 3, 4, 4, 3, 3, 4, 4, 3, 4, 4, 2, 4, 3, 4, 3, 3, 3, 4, 4)
Maiz <-c(3 , 4, 4, 4, 4, 4, 3, 4, 3, 4, 4, 4, 4, 3, 4, 4, 4, 3, 3, 4, 3)
length(Palma)
## [1] 21
En R ponemos los datos en un data.frame:
df3 <- data.frame(Palma, Maiz)
df3
## Palma Maiz
## 1 3 3
## 2 4 4
## 3 3 4
## 4 4 4
## 5 4 4
## 6 3 4
## 7 3 3
## 8 4 4
## 9 4 3
## 10 3 4
## 11 4 4
## 12 4 4
## 13 2 4
## 14 4 3
## 15 3 4
## 16 4 4
## 17 3 4
## 18 3 3
## 19 3 3
## 20 4 4
## 21 4 3
df4 <- data.frame(Calidad_de_Fritura= c(Palma, Maiz), Aceite=gl(n=2, k=21, length = 42, labels = c('Palma', 'Maiz')))
df4
## Calidad_de_Fritura Aceite
## 1 3 Palma
## 2 4 Palma
## 3 3 Palma
## 4 4 Palma
## 5 4 Palma
## 6 3 Palma
## 7 3 Palma
## 8 4 Palma
## 9 4 Palma
## 10 3 Palma
## 11 4 Palma
## 12 4 Palma
## 13 2 Palma
## 14 4 Palma
## 15 3 Palma
## 16 4 Palma
## 17 3 Palma
## 18 3 Palma
## 19 3 Palma
## 20 4 Palma
## 21 4 Palma
## 22 3 Maiz
## 23 4 Maiz
## 24 4 Maiz
## 25 4 Maiz
## 26 4 Maiz
## 27 4 Maiz
## 28 3 Maiz
## 29 4 Maiz
## 30 3 Maiz
## 31 4 Maiz
## 32 4 Maiz
## 33 4 Maiz
## 34 4 Maiz
## 35 3 Maiz
## 36 4 Maiz
## 37 4 Maiz
## 38 4 Maiz
## 39 3 Maiz
## 40 3 Maiz
## 41 4 Maiz
## 42 3 Maiz
Se usa la libreria psych para conocer los valores estadisticos basicos de cada uno
library(psych)
data_palma<-describe(Palma); data_palma
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 21 3.48 0.6 4 3.53 0 2 4 2 -0.57 -0.8 0.13
data_maiz<-describe(Maiz); data_maiz
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 21 3.67 0.48 4 3.71 0 3 4 1 -0.66 -1.64 0.11
Se observa que ambas medias son diferentes y la medianas iguales Para tener certeza de usar la distribución wilcoxon se realizan los siguientes tests.
pr_var2<-var.test(Palma, Maiz)
ifelse(pr_var2$p.value<0.05, 'Varianzas diferentes', 'Varianzas iguales' )
## [1] "Varianzas iguales"
Para saber si las variables no tienen distribución normal, se realiza el shapiro.test.
rnorm_palma<- shapiro.test(Palma); rnorm_palma
##
## Shapiro-Wilk normality test
##
## data: Palma
## W = 0.72901, p-value = 6.474e-05
ifelse(rnorm_palma$p.value<0.05, 'Datos sin normalidad', 'Datos con normalidad')
## [1] "Datos sin normalidad"
rnorm_maiz<- shapiro.test(Maiz); rnorm_maiz
##
## Shapiro-Wilk normality test
##
## data: Maiz
## W = 0.59907, p-value = 1.925e-06
ifelse(rnorm_maiz$p.value<0.05, 'Datos sin normalidad', 'Datos con normalidad')
## [1] "Datos sin normalidad"
Ambas variables no cumplen con la distribución normal, por lo que no se puede usar la prueba t pareada. Se tiene que probar con Wilcoxon.
wil_test <- wilcox.test(Palma, Maiz, mu = 0, alternative = 't', conf.level = 0.95)
wil_test$p.value
## [1] 0.3111338
ifelse(wil_test$p.value<0.05, 'Rechazo Ho', 'No Rechazo Ho')
## [1] "No Rechazo Ho"
Se acepta la hipotesis nula ya que las medianas de la textura de las hojuelas de papa criolla freidas en dos tipos de aceite de palma y maiz son iguales.
library(ggplot2)
df3 <- data.frame(Palma, Maiz)
df3
## Palma Maiz
## 1 3 3
## 2 4 4
## 3 3 4
## 4 4 4
## 5 4 4
## 6 3 4
## 7 3 3
## 8 4 4
## 9 4 3
## 10 3 4
## 11 4 4
## 12 4 4
## 13 2 4
## 14 4 3
## 15 3 4
## 16 4 4
## 17 3 4
## 18 3 3
## 19 3 3
## 20 4 4
## 21 4 3
df4 <- data.frame(Calidad_de_Fritura= c(Palma, Maiz), Aceite=gl(n=2, k=21, length = 42, labels = c('Palma', 'Maiz')))
ggplot(df4, aes(x = Aceite, y = Calidad_de_Fritura, fill = Aceite))+geom_violin()+geom_boxplot(width=0.1)
En el grafico se muestra una mayor concentracion de los datos en la mediana, siendo de 4, se observa ademas que el percentil 0.5 y 0.75 son iguales. Por otro lado, en las papas freidas con aceite de palma hubo una mayor amplitud de la calificacion de fritura con respecto al aceite de palma.