Se realizó un experimento para evaluar el cultivo de tomate con la implementación de cubresuelos. Para ello se implementó un diseño experimental completamente aleatorizado (DCA) 2 x 2, utilizando la variedad Roble F1 como material vegetal. De este modo, se tomaron 160 plantas como unidad experimental donde se usó tela en polipropileno bicolor, con dos alternativas de plásticos de polietileno: AgroPlast N y Agroclear y Tela en polipropileno bicolor, influenciados con dos alternativas de plásticos de polietileno (AgroPlast N y Agroclear), dividas en 2 factores cada uno con 2 tratamientos para un total de 40 plantas por factor con su respectivo tratamiento, distribuidas asÃ:
Las variables que se tuvieron en cuenta para el análisis fueron las siguentes:
Despues de realizar una depuración de los datos, organización de las variables y estimación de datos anómalos, se realizó un analisis descriptivo univariado, gráficos de cajas de Tukey bivariadas. Para algunas de las variables cuantitativas, se evaluó su correlación por medio del coeficiente de correlación de Pearson. Finalmente, después de evaluar la normalidad de las variables cuantitativas, se pasó a desarrollar análisis de varianza y en algunos casos, donde se presentó colinealidad, se planteó un modelo de análisis de covarianza.
Para algunos casos, donde no se cumplió el supuesto de normalidad, se utilizó la prueba no paramétrica de Kruskal-Wallis. Los resultados se muestran a continuación.
A continuación presenta la matriz de correlación. La idea es validar si existe alta correlación entre las diferentes variables cuantitativas a analizar. Seguidamente, se presentará un resumen estadÃstico descriptivo para cada una de las variables en mención.
## Prom_Temp Max_Temp Min_Temp Prom_HR Max_HR Min_HR Prom_Pt_rocio Max_Pt_rocio Min_Pt_rocio
## Prom_Temp 1.0000000 0.78454547 0.48292456 -0.78688365 -0.52184321 -0.62434727 0.7758118 0.5579261 0.37083807
## Max_Temp 0.7845455 1.00000000 0.10005451 -0.71681406 -0.52522985 -0.77096426 0.4921462 0.6701434 -0.02243057
## Min_Temp 0.4829246 0.10005451 1.00000000 -0.06982822 -0.24462544 0.05302242 0.6959283 0.2058364 0.96125513
## Prom_HR -0.7868837 -0.71681406 -0.06982822 1.00000000 0.49282083 0.86553724 -0.2280591 -0.1895741 0.07129684
## Max_HR -0.5218432 -0.52522985 -0.24462544 0.49282083 1.00000000 0.30354960 -0.3492620 -0.4598514 -0.04742794
## Min_HR -0.6243473 -0.77096426 0.05302242 0.86553724 0.30354960 1.00000000 -0.0932813 -0.1662728 0.15816141
## Prom_Pt_rocio 0.7758118 0.49214624 0.69592826 -0.22805907 -0.34926200 -0.09328130 1.0000000 0.6953649 0.65537750
## Max_Pt_rocio 0.5579261 0.67014342 0.20583642 -0.18957406 -0.45985139 -0.16627280 0.6953649 1.0000000 0.11337170
## Min_Pt_rocio 0.3708381 -0.02243057 0.96125513 0.07129684 -0.04742794 0.15816141 0.6553775 0.1133717 1.00000000
Los resultados muestran que algunas de las temperaturas promedio están altamente correlacionadas con la temperatura máxima la mÃnima (r > 0,70). También con el punto de de rocÃo. Existe el caso especial del mÃnimo punto de rocÃo con la temperatura mÃnima (r = 0,9612), indica que una de las variables ya es redundante.
De acuerdo a la matriz de correlacicÃon, se observan que algunas variables tienen alta correlación (correlación de Pearson), con otras. Lo que indica que posiblemente haya que introducirlas como covariables en los análisis de varianza posteriores.
A acotinuación de presentan unas graficas de cajas para cada una de las variables cuantitativas, respecto al factor principal (tratamiento).
Se muestran los diagramas de cajas de Tukey, donde la lÃnea de la mitad de los rectángulos (la variación del centro de la variables), es la mediana, cua medida de tendencia central acumula el 50% de los datos acumulados por la variable en estudio. Este análisis es muy poderoso y muestra que las cajas aproximádamente en la misma posicion horizontal, indican que probablemente no haya diferencias estadÃsticamente significativas entre las medias de los tratamientos. Por ejemplo, es probable que en el mÃnimo de tempetarura, no se produzca efecto para los tratamientos. También es importante resaltar que la variable Maximo de Humedad Relativa, que muestra un comportamiento muy extraño en el factor A + SCS: Sin Cubresuelos-AgroClear. Donde cada unode ellos se define como: + (Cubresuelos- AgroClear): A+CS + (Cubresuelos-AgroPlast N): APN+CS + (Sin Cubresuelos-AgroPlast N): APN+SCS + (Sin Cubresuelos-AgroClear): A+SCS
A continuación se presentan unos resultados que muestran el analisis de la variación respecto a la media de las variables cuantitativas en estudio.
| Tabla Nº (.) Resumen EstadÃstico Descriptivo Techo y Cobertura. | |||||||
|  Total |  |  Techo |  |  Cobertura | |||
|---|---|---|---|---|---|---|---|
| Â Â | Â | Â AÂ | Â APNÂ | Â | Â CSÂ | Â SCSÂ | |
|  Promedio de Temp, °C  | |||||||
|    Media | 18.5 |  | 17.9 | 19.1 |  | 18.8 | 18.1 |
|    D.E. | 1.4 |  | 1.1 | 1.4 |  | 1.4 | 1.3 |
| Â Â Â CV(%)Â | 7.6 | Â | 6.4 | 7.2 | Â | 7.6 | 7.0 |
| Â Â Â N Â | 488.0 | Â | 244.0 | 244.0 | Â | 244.0 | 244.0 |
|  Máx de Temp, °C  | |||||||
|    Media | 28.0 |  | 26.0 | 29.9 |  | 29.0 | 26.9 |
|    D.E. | 3.5 |  | 2.3 | 3.3 |  | 3.6 | 2.9 |
| Â Â Â CV(%)Â | 12.4 | Â | 9.0 | 11.0 | Â | 12.6 | 10.8 |
| Â Â Â N Â | 488.0 | Â | 244.0 | 244.0 | Â | 244.0 | 244.0 |
|  MÃn de Temp, °C  | |||||||
|    Media | 13.7 |  | 13.7 | 13.8 |  | 13.8 | 13.7 |
|    D.E. | 1.0 |  | 1.0 | 0.9 |  | 0.9 | 1.0 |
| Â Â Â CV(%)Â | 7.0 | Â | 7.1 | 6.8 | Â | 6.7 | 7.3 |
| Â Â Â N Â | 488.0 | Â | 244.0 | 244.0 | Â | 244.0 | 244.0 |
| Â Promedio de HR, % Â | |||||||
|    Media | 86.8 |  | 88.3 | 85.3 |  | 85.4 | 88.2 |
|    D.E. | 4.2 |  | 4.0 | 3.9 |  | 4.0 | 3.9 |
| Â Â Â CV(%)Â | 4.8 | Â | 4.6 | 4.5 | Â | 4.7 | 4.4 |
| Â Â Â N Â | 488.0 | Â | 244.0 | 244.0 | Â | 244.0 | 244.0 |
|  Máx de HR, %  | |||||||
|    Media | 99.0 |  | 99.7 | 98.4 |  | 98.7 | 99.3 |
|    D.E. | 0.9 |  | 0.5 | 0.8 |  | 0.9 | 0.9 |
| Â Â Â CV(%)Â | 0.9 | Â | 0.5 | 0.8 | Â | 0.9 | 0.9 |
| Â Â Â N Â | 488.0 | Â | 244.0 | 244.0 | Â | 244.0 | 244.0 |
| Â MÃn de HR, % Â | |||||||
|    Media | 57.8 |  | 60.3 | 55.4 |  | 54.8 | 60.9 |
|    D.E. | 10.3 |  | 10.3 | 9.6 |  | 9.7 | 10.0 |
| Â Â Â CV(%)Â | 17.7 | Â | 17.1 | 17.4 | Â | 17.6 | 16.4 |
| Â Â Â N Â | 488.0 | Â | 244.0 | 244.0 | Â | 244.0 | 244.0 |
|  Promedio de Punto de rocÃo, °C  | |||||||
|    Media | 15.7 |  | 15.4 | 16.0 |  | 15.7 | 15.7 |
|    D.E. | 0.9 |  | 0.9 | 0.7 |  | 0.8 | 1.0 |
| Â Â Â CV(%)Â | 5.6 | Â | 5.9 | 4.6 | Â | 5.0 | 6.2 |
| Â Â Â N Â | 488.0 | Â | 244.0 | 244.0 | Â | 244.0 | 244.0 |
|  Máximo de Punto de rocÃo, °C  | |||||||
|    Media | 20.1 |  | 18.8 | 21.5 |  | 20.2 | 20.1 |
|    D.E. | 2.1 |  | 1.6 | 1.6 |  | 1.9 | 2.3 |
| Â Â Â CV(%)Â | 10.3 | Â | 8.6 | 7.3 | Â | 9.3 | 11.3 |
| Â Â Â N Â | 488.0 | Â | 244.0 | 244.0 | Â | 244.0 | 244.0 |
|  MÃnimo de Punto de rocÃo, °C  | |||||||
|    Media | 13.1 |  | 13.2 | 13.0 |  | 13.1 | 13.1 |
|    D.E. | 0.9 |  | 1.0 | 0.9 |  | 0.9 | 1.0 |
| Â Â Â CV(%)Â | 7.2 | Â | 7.4 | 6.9 | Â | 6.7 | 7.7 |
| Â Â Â N Â | 488.0 | Â | 244.0 | 244.0 | Â | 244.0 | 244.0 |
Al respecto es importante destacar que hay variables que son casi constantes como por ejemplo la variable Max_HR (CV = 0,9%) y un poco mas Prom_HR (CV= 5%),lo que indica un comportamiento extraño, que se aleja un poco de la variacion natural de las variables.
## Df Sum Sq Mean Sq F value Pr(>F)
## Techo 1 1037 1037 265.3 <2e-16 ***
## Cobertura 1 964 964 246.7 <2e-16 ***
## Min_HR 1 4678 4678 1197.0 <2e-16 ***
## Residuals 484 1891 4
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
De acuerdo con los resultados, hay efecto significativo (p<0,001), de la variable Prom_HR, sobre los factores del tratamiento. Seguidamente se observan cuales son las medias estadisticamente distintas entre los factores, aplicand el test de Tukey.
## Df Sum Sq Mean Sq F value Pr(>F)
## Techo 1 178.7 178.7 19037 <2e-16 ***
## Cobertura 1 54.7 54.7 5829 <2e-16 ***
## Max_Temp 1 350.1 350.1 37300 <2e-16 ***
## Prom_HR 1 101.0 101.0 10763 <2e-16 ***
## Prom_Pt_rocio 1 258.5 258.5 27543 <2e-16 ***
## Residuals 482 4.5 0.0
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Tener en cuenta que mÃnima temperatura y máxima temperatura, estan correlacionados. Se quitó min temp y apareció la significación estadistica. El problema fue la multicolinealidad.
## Df Sum Sq Mean Sq F value Pr(>F)
## Techo 1 45.34 45.34 303.596 <2e-16 ***
## Cobertura 1 0.22 0.22 1.473 0.225
## Min_Temp 1 174.43 174.43 1168.132 <2e-16 ***
## Max_Pt_rocio 1 86.46 86.46 578.979 <2e-16 ***
## Residuals 483 72.13 0.15
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Solo interesa el resultado, conglomerado final
## Df Sum Sq Mean Sq F value Pr(>F)
## Clasificación 3 4932578 1644193 47.81 <2e-16 ***
## Residuals 88 3026059 34387
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Simultaneous Tests for General Linear Hypotheses
##
## Multiple Comparisons of Means: Tukey Contrasts
##
##
## Fit: aov(formula = Peso..Kg. ~ Clasificación, data = gcosecha)
##
## Linear Hypotheses:
## Estimate Std. Error t value Pr(>|t|)
## Primera - Extra == 0 531.68 54.68 9.723 <0.001 ***
## Segunda - Extra == 0 110.81 54.68 2.026 0.1862
## Tercera - Extra == 0 -61.74 54.68 -1.129 0.6726
## Segunda - Primera == 0 -420.87 54.68 -7.697 <0.001 ***
## Tercera - Primera == 0 -593.43 54.68 -10.852 <0.001 ***
## Tercera - Segunda == 0 -172.56 54.68 -3.156 0.0115 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## (Adjusted p values reported -- single-step method)
### Analisis de Varianza
## Df Sum Sq Mean Sq F value Pr(>F)
## Techo 1 0.06 0.0605 0.146 0.704
## Cobertura 1 0.10 0.0995 0.240 0.626
## Residuals 77 31.95 0.4149
##
## Simultaneous Tests for General Linear Hypotheses
##
## Multiple Comparisons of Means: Tukey Contrasts
##
##
## Fit: aov(formula = lPeso ~ Techo + Cobertura, data = calidad)
##
## Linear Hypotheses:
## Estimate Std. Error t value Pr(>|t|)
## APN - AGC == 0 -0.055 0.144 -0.382 0.704
## (Adjusted p values reported -- single-step method)
##
## Simultaneous Tests for General Linear Hypotheses
##
## Multiple Comparisons of Means: Tukey Contrasts
##
##
## Fit: aov(formula = lPeso ~ Techo + Cobertura, data = calidad)
##
## Linear Hypotheses:
## Estimate Std. Error t value Pr(>|t|)
## SCS - CS == 0 -0.07052 0.14404 -0.49 0.626
## (Adjusted p values reported -- single-step method)
A continuación se asumira que la variable peso de producción por planta, tiene una distribución gamma. Para este caso solo se tuvieron en cuenta los valores de peso mayores a 1 kg, ya que logaritmo de un valor menor que 1 es negativo.
##
## Call:
## glm(formula = Peso ~ Techo + Cobertura, family = Gamma(link = "log"),
## data = calidad)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.66375 -0.94213 -0.01595 0.47750 1.26818
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.3255 0.1478 15.734 <2e-16 ***
## TechoAPN -0.1708 0.1723 -0.991 0.326
## CoberturaSCS 0.1194 0.1727 0.691 0.492
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for Gamma family taken to be 0.4896609)
##
## Null deviance: 46.868 on 65 degrees of freedom
## Residual deviance: 46.123 on 63 degrees of freedom
## AIC: 436.2
##
## Number of Fisher Scoring iterations: 5
Se aplicó un analisis no parametrico, libre de distribución de probabilidades
## # A tibble: 4 × 7
## # Groups: Techo [2]
## Techo Cobertura count mean sd median IQR
## <fct> <fct> <int> <dbl> <dbl> <dbl> <dbl>
## 1 AGC CS 17 10.1 8.37 8.52 12.0
## 2 AGC SCS 16 11.7 8.30 12.9 15.3
## 3 APN CS 18 8.74 6.01 10.3 10.7
## 4 APN SCS 15 9.57 5.26 9.21 6.06
##
## Kruskal-Wallis rank sum test
##
## data: Peso by Techo
## Kruskal-Wallis chi-squared = 0.43623, df = 1, p-value = 0.5089
##
## Kruskal-Wallis rank sum test
##
## data: Peso by Cobertura
## Kruskal-Wallis chi-squared = 0.74104, df = 1, p-value = 0.3893
Cuandose aplicó el test no paramétrico de Kruskal-Wallis, nuevamente el p-valor es mucho mayor del 0,05 lo que indica que no se detectan diferencias significativas entre las medias del peso.
## Df Sum Sq Mean Sq F value Pr(>F)
## Techo 1 0.454 0.4536 2.399 0.140
## Cobertura 1 0.037 0.0371 0.196 0.663
## Residuals 17 3.214 0.1891
##
## Simultaneous Tests for General Linear Hypotheses
##
## Multiple Comparisons of Means: Tukey Contrasts
##
##
## Fit: aov(formula = Peso ~ Techo + Cobertura, data = rendi)
##
## Linear Hypotheses:
## Estimate Std. Error t value Pr(>|t|)
## APN - AGC == 0 -0.3012 0.1945 -1.549 0.14
## (Adjusted p values reported -- single-step method)
##
## Simultaneous Tests for General Linear Hypotheses
##
## Multiple Comparisons of Means: Tukey Contrasts
##
##
## Fit: aov(formula = Peso ~ Techo + Cobertura, data = rendi)
##
## Linear Hypotheses:
## Estimate Std. Error t value Pr(>|t|)
## SCS - CS == 0 -0.08614 0.19447 -0.443 0.663
## (Adjusted p values reported -- single-step method)
## # A tibble: 4 × 7
## # Groups: Techo [2]
## Techo Cobertura count mean sd median IQR
## <fct> <fct> <int> <dbl> <dbl> <dbl> <dbl>
## 1 AGC CS 5 1.26 0.436 1.09 0.115
## 2 AGC SCS 5 1.10 0.634 1.16 0.523
## 3 APN CS 5 0.881 0.299 0.861 0.0247
## 4 APN SCS 5 0.869 0.339 0.921 0.0865
##
## Kruskal-Wallis rank sum test
##
## data: Peso by Techo
## Kruskal-Wallis chi-squared = 2.52, df = 1, p-value = 0.1124
##
## Kruskal-Wallis rank sum test
##
## data: Peso by Cobertura
## Kruskal-Wallis chi-squared = 0.051429, df = 1, p-value = 0.8206
La variable Techo con respecto al rendimiento, produce un p-valor de 0,1124; lo que indica leve significación estadistica. El peso no muestra diferencias por cobertura. # Variables de Crecimiento ## Crecimiento
cor(crec[,5:8])
## DimT RacF DisRac_cm A1Rac
## DimT 1.0000000 0.18651341 -0.253271894 -0.172132331
## RacF 0.1865134 1.00000000 -0.081801175 -0.176115904
## DisRac_cm -0.2532719 -0.08180117 1.000000000 -0.005973896
## A1Rac -0.1721323 -0.17611590 -0.005973896 1.000000000
## Df Sum Sq Mean Sq F value Pr(>F)
## Cobertura 1 52.89 52.89 25.89 1.41e-06 ***
## Techo 1 105.51 105.51 51.65 6.93e-11 ***
## Residuals 116 237.00 2.04
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Simultaneous Tests for General Linear Hypotheses
##
## Multiple Comparisons of Means: Tukey Contrasts
##
##
## Fit: aov(formula = DimT ~ Cobertura + Techo, data = crec)
##
## Linear Hypotheses:
## Estimate Std. Error t value Pr(>|t|)
## SCS - CS == 0 -1.559 0.265 -5.883 3.98e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## (Adjusted p values reported -- single-step method)
##
## Simultaneous Tests for General Linear Hypotheses
##
## Multiple Comparisons of Means: Tukey Contrasts
##
##
## Fit: aov(formula = DimT ~ Cobertura + Techo, data = crec)
##
## Linear Hypotheses:
## Estimate Std. Error t value Pr(>|t|)
## APN - AGC == 0 -1.8992 0.2643 -7.186 6.93e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## (Adjusted p values reported -- single-step method)
## Df Sum Sq Mean Sq F value Pr(>F)
## Cobertura 1 20.1 20.07 4.823 0.03009 *
## Techo 1 18.0 17.98 4.321 0.03987 *
## Cobertura:Techo 1 37.9 37.94 9.118 0.00312 **
## Residuals 115 478.5 4.16
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Df Sum Sq Mean Sq F value Pr(>F)
## Cobertura 1 13.0 13.02 3.675 0.05771 .
## Techo 1 35.9 35.93 10.141 0.00187 **
## Cobertura:Techo 1 19.0 19.02 5.367 0.02229 *
## Residuals 115 407.4 3.54
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Df Sum Sq Mean Sq F value Pr(>F)
## Cobertura 1 1660 1659.7 60.346 3.64e-12 ***
## Techo 1 0 0.0 0.000 0.997
## Cobertura:Techo 1 1 0.9 0.034 0.855
## Residuals 115 3163 27.5
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1