## Warning: Continuous x aesthetic -- did you forget aes(group=...)?
De acuerdo con la primera gráfica, el consumo de oxígeno por parte de los moluscos tiende a ser mayor cuando la concentración de agua de mar no es tan alta (50%), ya que se observa que la mayoría de los datos se encuentra por encima de 10. Por otro lado, el grupo de los moluscos que fueron tratados en una concentración del 100% fue el segundo grupo con más consumo de oxígeno, estando la mitad de los datos por encima de 8.6. Finalmente, el grupo de moluscos con concentraciones del 75% presentó una tendencia a un consumo menor, pues el rango de valores en el que se ubican los datos es el más bajo (valor máximo=13.2 y mediana=6.43), por lo que no hay una clara relación inversa entre la concentración de agua y el consumo de oxígeno.
Ahora bien, si dividimos los resultados según el tipo de molusco, se evidencia que todavía persiste esa tendencia de: 50% mayor consumo, luego 100% y por último 75%. No obstante, se pueden detallar algunas diferencias entre el tipo A y B, por ejemplo la variación en los datos de los moluscos tipo A no es tan alta como en los tipo B, además, el valor máximo de todos los datos pertenece a un molusco A mientras que el más bajo es de uno B. También cabe resaltar que la mediana en los moluscos B tanto de 75% como de 100% son bastante cercanos.
##
## Call:
## lm(formula = cons_oxigeno ~ moluscos$con_agua + tipo_molusco)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.1750 -1.9877 -0.7019 2.1244 6.1450
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 12.9463 0.8521 15.193 < 2e-16 ***
## moluscos$con_agua75 -5.2581 1.0436 -5.038 8.49e-06 ***
## moluscos$con_agua100 -3.5794 1.0436 -3.430 0.00132 **
## tipo_moluscoB -1.3913 0.8521 -1.633 0.10966
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.952 on 44 degrees of freedom
## Multiple R-squared: 0.3986, Adjusted R-squared: 0.3575
## F-statistic: 9.719 on 3 and 44 DF, p-value: 4.866e-05
Modelo de regresión lineal: \(y=12.9463-5.2581x_1-3.5794x_2-1.3913x_3\)
Para la estimación de este modelo se usaron como datos base la concentración de 50% y los moluscos tipo A ya que los valores de dichas variables se deben de tomar como factores. Teniendo en cuenta lo anterior, el valor del intercepto (12.9463) representa la media en el consumo de oxígeno cuando un molusco A está en una concentración de agua de mar del 50%, el cual es muy significativo porque el valor p es menor a 2e-16. Por otra parte, el \(\beta\) para c_agua75 quiere decir que al 75% de concentración el consumo de oxígeno se reduce en -5.2581 con respecto al 50% y su valor p (8.49e-06) confirma que es altamente influyente en la variable respuesta del modelo. Sobre c_agua100, la interpretación en similar pues da a entender que el consumo baja en -3.5794 con una concentración de 100% en comparación con 50% y su valor p (0.00132) demuestra que tiene un buen nivel de significancia pero no tan alto como el de los casos anteriores.
Por último, el estimado para molusco B es -1.3913 y denota que en moluscos tipo B el consumo disminuye en -1.3913 con respecto a los moluscos A, sin embargo, en este caso el valor de p es muy elevado (0.10966), lo cual quiere decir que el tipo de molusco se trata de una variable que no supone un cambio muy significativo en el modelo, en otras palabras, no hay mucha diferencia entre un molusco A y uno B que estén bajo los mismos tratamientos.
## Analysis of Variance Table
##
## Response: cons_oxigeno
## Df Sum Sq Mean Sq F value Pr(>F)
## moluscos$con_agua 2 230.82 115.408 13.2457 3.14e-05 ***
## tipo_molusco 1 23.23 23.227 2.6658 0.1097
## Residuals 44 383.37 8.713
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## $statistics
## MSerror Df Mean CV t.value LSD
## 8.712897 44 9.304792 31.72303 2.015368 2.103248
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none moluscos$con_agua 3 0.05
##
## $means
## cons_oxigeno std r LCL UCL Min Max Q25 Q50
## 100 8.67125 3.000940 16 7.184029 10.158471 3.68 14.0 6.140 8.595
## 50 12.25062 3.199643 16 10.763404 13.737846 6.38 18.8 10.085 11.455
## 75 6.99250 2.804093 16 5.505279 8.479721 1.80 13.2 5.200 6.430
## Q75
## 100 10.5750
## 50 14.5000
## 75 8.7675
##
## $comparison
## NULL
##
## $groups
## cons_oxigeno groups
## 50 12.25062 a
## 100 8.67125 b
## 75 6.99250 b
##
## attr(,"class")
## [1] "group"
Debido a que el análisis ANOVA indicó que hay una diferencia significativa entre las medias del consumo de oxígeno según la concentración de agua de mar, es pertinente realizar un post-ANOVA de este tratamiento, el cual reúne en un mismo grupo a 75 y 100 mientras que el de 50 quedó solo en otro grupo, esto da a entender que 75 y 100 tienen una similitud alta en cuanto a valores de consumo de oxígeno se refiere y que 50 está más distanciado de ellos.
Hipótesis: Hay mayor riqueza de especies de moluscos cuando los cantos intermareales son grandes y las épocas del año no influyen demasiado en esa riqueza.
##
## Call:
## lm(formula = numero_spp ~ canto_size + epoca)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6.0937 -1.5312 -0.1563 1.2969 5.4062
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.1563 0.7460 9.592 1.69e-13 ***
## canto_sizeS2 -1.4375 0.7976 -1.802 0.0768 .
## canto_sizeS3 -3.9375 0.7976 -4.937 7.27e-06 ***
## canto_sizeS4 -5.0000 0.7976 -6.269 5.19e-08 ***
## epocaT2 0.4375 0.7976 0.549 0.5855
## epocaT3 0.3750 0.7976 0.470 0.6400
## epocaT4 -0.1875 0.7976 -0.235 0.8150
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.256 on 57 degrees of freedom
## Multiple R-squared: 0.4677, Adjusted R-squared: 0.4117
## F-statistic: 8.348 on 6 and 57 DF, p-value: 1.666e-06
Modelo: \(riqueza=7.1563-1.4375S_2-3.9375S_3-5S_4+0.4375T_2+0.3750T_3-0.1875T_4\)
Para poder estimar este modelo, hay que tener en cuenta que tanto el tamaño del canto como la época del año son variables categóricas, se requiere establecer una condición como referencia. En este caso sería el canto S1 y la época T1. De acuerdo a los resultados, las únicas condiciones que influyen significativamente en el modelo son S3 y S4 mientras que con S2 no se presenta eso. Esto quiere decir que el número de especies registrado con S2 es similar al de S1. En relación con la época, ninguna es significante dentro de la función del modelo, lo cual implica que no alteran demasiado la riqueza con respecto a T1.
## Analysis of Variance Table
##
## Response: numero_spp
## Df Sum Sq Mean Sq F value Pr(>F)
## canto_size 3 250.563 83.521 16.4126 8.323e-08 ***
## epoca 3 4.312 1.437 0.2825 0.8378
## Residuals 57 290.062 5.089
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## $statistics
## MSerror Df Mean CV t.value LSD
## 5.088816 57 4.71875 47.80589 2.002465 1.597086
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none canto_size 4 0.05
##
## $means
## numero_spp std r LCL UCL Min Max Q25 Q50 Q75
## S1 7.3125 1.922455 16 6.183189 8.441811 4 11 6.75 7 8.00
## S2 5.8750 2.963669 16 4.745689 7.004311 0 11 3.75 6 8.00
## S3 3.3750 2.276694 16 2.245689 4.504311 0 9 2.00 3 4.25
## S4 2.3125 1.400893 16 1.183189 3.441811 0 5 1.00 2 3.25
##
## $comparison
## NULL
##
## $groups
## numero_spp groups
## S1 7.3125 a
## S2 5.8750 a
## S3 3.3750 b
## S4 2.3125 b
##
## attr(,"class")
## [1] "group"
Al llevar a cabo el análisis ANOVA, este expone que existe una diferencia significativa entre las medias de cada tamaño del canto, pero para la época las medias son similares. Con base en este resultado, se procedió a ejecutar una prueba postanova para la variable de los cantos.
Por medio de la prueba de LSD se agrupó dentro de un mismo grupo a S1 y S2 debido a la cercanía que hay entre sus medias (7.3125 y 5.875 respectivamente), por eso es que en el modelo, S2 no es tan significativo. Por otra parte, las medias de S3 y S4 son muy distintas a las otras dos pero son similares entre sí, por lo que fueron colocadas en el grupo b y por eso mismo es que son significativas en el modelo, pues sus medias son estadísticamente diferentes a las de S1.
Con base en estos análisis, se confirma la hipóteis de que los cantos más grandes (S1 y S2) permiten que haya una mayor riqueza de especies de molusco, mientras que la época del año no altera demasiado la riqueza, es decir, en todas las épocas se observa una cantidad similar de especies siempre y cuando el tamaño del canto intermareal sea el mismo.
##
## Call:
## lm(formula = masa ~ dieta)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.940 -2.680 0.440 2.095 3.980
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 64.620 1.330 48.593 < 2e-16 ***
## dietaB 6.680 1.881 3.552 0.002655 **
## dietaC 8.920 1.881 4.743 0.000221 ***
## dietaD -1.380 1.881 -0.734 0.473691
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.974 on 16 degrees of freedom
## Multiple R-squared: 0.7275, Adjusted R-squared: 0.6764
## F-statistic: 14.24 on 3 and 16 DF, p-value: 8.833e-05
## Analysis of Variance Table
##
## Response: masa
## Df Sum Sq Mean Sq F value Pr(>F)
## dieta 3 377.71 125.902 14.239 8.833e-05 ***
## Residuals 16 141.47 8.842
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Modelo: \(masa=64.620 +6.680B+8.920C-1.380D\)
Para determinar si las medias de los pesos para cada dieta son estadísticamente iguales se realizó un análisis de varianza (ANOVA). Con base en los resultados del análisis, se puede afirmar que existen diferencias significativas entre los pesos que proporciona cada dieta, pues el valor p obtenido es 8.833e-05, el cual es mucho menor a 0.05, por lo que indica que todas las medias no son estadísticamente iguales y por ello se puede proceder a hacer una prueba postanova.
## $statistics
## MSerror Df Mean CV t.value LSD
## 8.842 16 68.175 4.361643 2.119905 3.986775
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none dieta 4 0.05
##
## $means
## masa std r LCL UCL Min Max Q25 Q50 Q75
## A 64.62 3.345445 5 61.80092 67.43908 60.8 68.6 61.7 65.0 67.0
## B 71.30 3.068387 5 68.48092 74.11908 67.7 75.0 68.7 71.8 73.3
## C 73.54 2.987139 5 70.72092 76.35908 69.6 77.1 71.5 74.3 75.2
## D 63.24 2.416195 5 60.42092 66.05908 60.3 66.7 61.9 63.1 64.2
##
## $comparison
## NULL
##
## $groups
## masa groups
## C 73.54 a
## B 71.30 a
## A 64.62 b
## D 63.24 b
##
## attr(,"class")
## [1] "group"
Tras realizar una prueba de comparación múltiple entre las dietas en función de los pesos resultantes de cada una, se puede evidenciar que la media de la dieta C es similar al de la B, por lo que la prueba las reunió en un mismo grupo (a). De igual forma, esto mismo ocurrió entre las dietas A y D, pues se agruparon en el grupo b debido a la proximidad entre sus medias. Teniendo en cuenta estos resultados, se recomienda usar la dieta C en caso de que se desee incrementar el peso de los cerdos. En caso de querer reducirlo es mejor emplear la dieta D.
## The following object is masked from moluscos:
##
## cons_oxigeno
De acuerdo al boxplot generado de los datos, el consumo de oxígeno presenta una relación directa con la temperatura, pues el consumo es alto cuando la temperatura también es alta mientras que a temperatura baja el consumo es bajo y para temperatura media ocurre lo mismo. En cuanto al sexo, no hay una diferencia muy amplia entre machos y hembras en cada nivel de temperatura, por lo que se puede hipotetizar que el sexo no es un factor muy influyente en el consumo de oxígeno.
##
## Call:
## lm(formula = cons_oxi ~ temperatura + sexo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.3750 -0.1625 -0.0125 0.1812 0.4000
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.02500 0.09276 32.612 < 2e-16 ***
## temperaturaBaja -1.37500 0.11361 -12.103 1.17e-10 ***
## temperaturaMedia -0.62500 0.11361 -5.501 2.19e-05 ***
## sexoM -0.02500 0.09276 -0.270 0.79
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2272 on 20 degrees of freedom
## Multiple R-squared: 0.8802, Adjusted R-squared: 0.8622
## F-statistic: 48.99 on 3 and 20 DF, p-value: 2.124e-09
## Analysis of Variance Table
##
## Response: cons_oxi
## Df Sum Sq Mean Sq F value Pr(>F)
## temperatura 2 7.5833 3.7917 73.4463 6.108e-10 ***
## sexo 1 0.0037 0.0037 0.0726 0.7903
## Residuals 20 1.0325 0.0516
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Modelo: \(consumo=3.025-1.375Baja-0.625Media-0.025Macho\)
Debido a que las dos variables (temperatura y sexo) no presentan datos numéricos, es necesario tratarlos como factores, por lo que en la estimación del modelo se establecieron la temperatura alta y las hembras como referencia o base. Por esa razón, el valor del intercepto (3.025) representa el valor del consumo en hembras de cangrejo expuestas a altas temperaturas, pero según el modelo, si la temperatura es media el consumo se reduce 0.625 mientras que si es baja la disminución es de 1.375 (ambas con respecto a la temperatura alta). En cambio, cuando los cangrejos machos son expuestos, la tasa de consumo no es tan diferente al de las hembras, pues solo se reduce en 0.025.
En cuanto al análisis ANOVA, este muestra un valor p de 6.108e-10 para la variable temperatura y de 0.7903 para el sexo. Estos resultados indican que hay una diferencia significativa entre las medias del consumo en cada temperatura pero esto no se observa para el sexo, es decir, el valor del consumo de oxígeno en machos y hembras es estadísticamente igual. Con base en esto se procede a hacer una prueba postanova en la temperatura.
## $statistics
## MSerror Df Mean CV t.value LSD
## 0.051625 20 2.345833 9.685742 2.085963 0.2369773
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none temperatura 3 0.05
##
## $means
## cons_oxi std r LCL UCL Min Max Q25 Q50 Q75
## Alta 3.0125 0.2232071 8 2.844932 3.180068 2.7 3.4 2.875 3.00 3.125
## Baja 1.6375 0.1922610 8 1.469932 1.805068 1.4 1.9 1.475 1.65 1.800
## Media 2.3875 0.2474874 8 2.219932 2.555068 2.0 2.7 2.250 2.40 2.600
##
## $comparison
## NULL
##
## $groups
## cons_oxi groups
## Alta 3.0125 a
## Media 2.3875 b
## Baja 1.6375 c
##
## attr(,"class")
## [1] "group"
Los resultados de esta prueba confirman que cuanto mayor sea la temperatura, mayor será la tasa de consumo de oxígeno, pues el valor de la media para cada tratamiento varía significativamente (3.01 para alta, 2.38 para media y 1.63 para baja) y eso se evidencia con el hecho de que cada nivel de temperatura fue agrupado en un grupo distinto (a, b y c).
##plot(temp_media)
##plot(precipitation)
temp_optima=temp_media>22&temp_media<28
##plot(temp_optima)
aptitud_temp=sum(temp_optima)
precipitation_optima=precipitation>125&precipitation<300
##plot(precipitation_optima)
aptitud_precip=sum(precipitation_optima)
##ambos=stack(aptitud_temp,aptitud_precip)
##plot(ambos)
t=aptitud_temp>9
p=aptitud_precip>9
ambos=t*p
plot(aptitud_temp)
plot(aptitud_precip)
plot(ambos)
En el primer mapa se muestran las zonas del mundo que en algún momento del año presentan las condiciones de temperatura aptas (22.5-28°C), además contiene una escala que indica durante cuántos meses se da este rango, los colores cálidos representan pocos meses y los verdoso muchos meses. Como era de esperarse, en las zonas tropicales se observan esas temperaturas durante todo el año o gran parte de este, mientras que en zonas subtropicales estas condiciones solo ocurren durante pocos meses (generalmente en verano).
El segundo mapa exhibe la misma estructura y composición que el primero, con la diferencia de que muestra los lugares con precipitaciones mensuales entre 125 y 290 mm. Para este caso, nuevamente las zonas donde ocurre esto todo el año son las tropicales, especialmente en el amazonas y en el sudeste asiático. No obstante, también es posible que estas condiciones se presenten en unos pocos lugares de las zonas templadas, como en el sur de Chile, en costas canadienses y escandinavas y también en Nueva Zelanda.
A pesar de todos esos lugares donde se observan esas condiciones de temperatura y precipitación, cuando revisamos en qué zonas se dan ambas de forma simultánea, vemos que los sitios se reducen estrictamente a países ubicados cerca al ecuador, es decir en Sudamérica, África central y el sudeste asiático.
mundo=shapefile("~/Universidad Javeriana/Bioestadistica/shape_global/shape_global/g2008_0.shp")
polombia=mundo$ADM0_NAME=="Colombia"
colombia=mundo[polombia,]
indo=mundo$ADM0_NAME=="Indonesia"
indonesia=mundo[indo,]
pili=mundo$ADM0_NAME=="Philippines"
filipinas=mundo[pili,]
##plot(colombia)
##plot(indonesia)
##plot(filipinas)
cultivos_col=crop(ambos,colombia)
cultivos_colombia=mask(cultivos_col,colombia)
cultivos_indo=crop(ambos,indonesia)
cultivos_indonesia=mask(cultivos_indo,indonesia)
cultivos_pili=crop(ambos,filipinas)
cultivos_filipinas=mask(cultivos_pili,filipinas)
plot(cultivos_colombia)
plot(cultivos_indonesia)
plot(cultivos_filipinas)
Entre los países donde se pueden encontrar las condiciones de temperatura y precipitación apta para cultivar caña de azúcar están Colombia, Indonesia y Filipinas. Para Colombia esto ocurre principalmente en la región amazónica y algunos lugares del Pacífico y los Andes. En el caso de Indonesia, las condiciones se dan en gran parte del país, esencialmente en las islas del norte. Por último, en Filipinas se observa únicamente en el sur, pues se trata de un país que está entre la zona tropical y subtropical.
loc1=cbind(-76.91588907001292,3.9041245214421347)
plot(cultivos_colombia)
points(loc1,col="black",pch=16)
extraer1=extract(temp_media,loc1)
plot(extraer1[1,],type="b", xlab="Meses", ylab="Temperatura")
extraer11=extract(precipitation,loc1)
plot(extraer11[1,],type="b", xlab="Meses", ylab="Precipitación")
loc2=cbind(-76.06858053651762,4.469817846336185)
plot(cultivos_colombia)
points(loc2,col="black",pch=16)
extraer2=extract(temp_media,loc2)
plot(extraer2[1,],type="b", xlab="Meses", ylab="Temperatura")
extraer22=extract(precipitation,loc2)
plot(extraer22[1,],type="b", xlab="Meses", ylab="Precipitación")
loc3=cbind(-76.42363833140817,3.4434823063849884)
plot(cultivos_colombia)
points(loc3,col="black",pch=16)
extraer3=extract(temp_media,loc3)
plot(extraer3[1,],type="b", xlab="Meses", ylab="Temperatura")
extraer33=extract(precipitation,loc3)
plot(extraer33[1,],type="b", xlab="Meses", ylab="Precipitación")
Sobre el primer punto, el clima de esa localización se caracteriza por tener temperaturas entre 25.5 y 26.2°C y unas precipitaciones mensuales de 250 a 600 mm, lo cual tiene sentido porque se trata de una zona del Chocó Biogeográfico (región de mucha humedad y lluvias). Para el punto 2, se trata de un lugar en el norte de Valle del Cauca donde la temperatura en ligeramente menor al punto 1 (23-24.2°C) y en cuanto a la precipitación, es notablemente menor (80-200 mm mensuales), pues esta parte del departamento no hace parte del Chocó Biogeográfico. Finalmente, el punto 3 se ubica en un área rural cerca de Cali y se evidencia que la temperatura de este lugar es muy similar al del norte e incluso conserva un patrón parecido. Esto mismo sucede cuando revisamos la precipitación del punto 3.