Desarrollo parcial 1

1.

Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (gr) de una planta forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa y se registraron las características del suelo en el que crecía (pH, Salinidad, Zinc y Potasio).

load("C:/Users/Andres F. Cruz/Downloads/Salinidad.RData")
Salinidad
##     Biomasa   pH Salinidad    Zinc Potasio
## 1   765.280 5.00        33 16.4524 1441.67
## 2   954.017 4.70        35 13.9852 1299.19
## 3   827.686 4.20        32 15.3276 1154.27
## 4   755.072 4.40        30 17.3128 1045.15
## 5   896.176 5.55        33 22.3312  521.62
## 6  1422.836 5.50        33 12.2778 1273.02
## 7   821.069 4.25        36 17.8225 1346.35
## 8  1008.804 4.45        30 14.3516 1253.88
## 9  1306.494 4.75        38 13.6826 1242.65
## 10 1039.637 4.60        30 11.7566 1282.95
## 11 1193.223 4.10        30  9.8820  553.69
## 12  777.474 3.45        37 16.6752  494.74
## 13  818.127 3.45        33 12.3730  526.97
## 14 1203.568 4.10        36  9.4058  571.14
## 15  977.515 3.50        30 14.9302  408.64
## 16  369.823 3.25        30 31.2865  646.65
## 17  509.872 3.25        27 30.1652  514.03
## 18  448.315 3.20        29 28.5901  350.73
## 19  615.091 3.35        34 17.8795  496.29
## 20  545.538 3.30        36 18.5056  580.92
## 21  436.552 3.25        30 22.1344  535.82
## 22  465.907 3.25        28 28.6101  490.34
## 23  664.601 3.20        31 23.1908  552.39
## 24  502.466 3.20        31 24.6917  661.32
## 25  496.797 3.35        35 22.6758  672.12
## 26 2270.294 7.10        29  0.3729  525.65
## 27 2332.220 7.35        35  0.2703  563.13
## 28 2162.531 7.45        35  0.3205  497.96
## 29 2222.588 7.45        30  0.2648  458.38
## 30 2337.326 7.40        30  0.2105  498.25
## 31 1349.192 4.85        26 18.9875  936.26
## 32 1058.976 4.60        29 20.9687  894.79
## 33 1408.206 5.20        25 23.9841  941.36
## 34 1491.276 4.75        26 19.9727 1038.79
## 35 1254.872 5.20        26 21.3864  898.05
## 36 1152.341 4.55        25 23.7063  989.87
## 37  568.455 3.95        26 30.5589  951.28
## 38  612.447 3.70        26 26.8415  929.83
## 39  654.825 3.75        27 27.7292  925.42
## 40  991.829 4.15        27 21.5699  954.11
## 41 1895.942 5.60        24 19.6531  720.72
## 42 1346.880 5.35        27 20.3295  782.09
## 43 1482.793 5.50        26 19.5880  773.30
## 44 1145.643 5.50        28 20.1328  829.26
## 45 1137.193 5.40        28 19.2420  856.96
summary(Salinidad)
##     Biomasa             pH          Salinidad          Zinc        
##  Min.   : 369.8   Min.   :3.200   Min.   :24.00   Min.   : 0.2105  
##  1st Qu.: 654.8   1st Qu.:3.450   1st Qu.:27.00   1st Qu.:13.9852  
##  Median : 991.8   Median :4.450   Median :30.00   Median :19.2420  
##  Mean   :1082.2   Mean   :4.609   Mean   :30.27   Mean   :17.8308  
##  3rd Qu.:1346.9   3rd Qu.:5.350   3rd Qu.:33.00   3rd Qu.:22.6758  
##  Max.   :2337.3   Max.   :7.450   Max.   :38.00   Max.   :31.2865  
##     Potasio      
##  Min.   : 350.7  
##  1st Qu.: 527.0  
##  Median : 773.3  
##  Mean   : 797.4  
##  3rd Qu.: 954.1  
##  Max.   :1441.7

Se utiliza la funcion summary ya que poseemos una base de datos extensa, esta funcion nos proporciona datos como el minimo, el maximo los diferentes cuartiles y la media de los todos los datos presentes en cada caracteristica de la base de datos. esta informacion es imporante para los analisis que se realizaran mas adelante.

Analsis y exploracion de datos univariados

require(ggplot2)
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 3.5.3
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 3.5.3
## -- Attaching packages -------------------------- tidyverse 1.3.0 --
## v tibble  2.1.3     v dplyr   0.8.5
## v tidyr   1.0.2     v stringr 1.4.0
## v readr   1.3.1     v forcats 0.5.0
## v purrr   0.3.3
## Warning: package 'tibble' was built under R version 3.5.3
## Warning: package 'tidyr' was built under R version 3.5.3
## Warning: package 'readr' was built under R version 3.5.3
## Warning: package 'purrr' was built under R version 3.5.3
## Warning: package 'dplyr' was built under R version 3.5.3
## Warning: package 'stringr' was built under R version 3.5.3
## Warning: package 'forcats' was built under R version 3.5.3
## -- Conflicts ----------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
theme_set(theme_bw())

Se realiza el llamado a las librerias ggplot2 para realizar las graficas del analisis y la libreria tidyverse para la funcion theme_set que sera aplicado tambien a las graficas.

Salinidad

Salinidad$Salinidad
##  [1] 33 35 32 30 33 33 36 30 38 30 30 37 33 36 30 30 27 29 34 36 30 28 31
## [24] 31 35 29 35 35 30 30 26 29 25 26 26 25 26 26 27 27 24 27 26 28 28
summary(Salinidad$Salinidad)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   24.00   27.00   30.00   30.27   33.00   38.00
ggplot(Salinidad,aes(x=Salinidad))+geom_histogram()+ggtitle("Concentracion de Salinidad")+ylab("Cantidad")+xlab("Salinidad")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Segun el histograma anterior y los valeres de maximos y minimos calculados en el summary, la salinidad que se exponen en el suelo de esta muestra se presenta en un rango entre 24 y 38, ademas la mediana y y la media que son 30 y 30.27 , al ser similares demuestran que la distribucion de esta caracteristica en la muestra es simetrica.

Zinc

Salinidad$Zinc
##  [1] 16.4524 13.9852 15.3276 17.3128 22.3312 12.2778 17.8225 14.3516
##  [9] 13.6826 11.7566  9.8820 16.6752 12.3730  9.4058 14.9302 31.2865
## [17] 30.1652 28.5901 17.8795 18.5056 22.1344 28.6101 23.1908 24.6917
## [25] 22.6758  0.3729  0.2703  0.3205  0.2648  0.2105 18.9875 20.9687
## [33] 23.9841 19.9727 21.3864 23.7063 30.5589 26.8415 27.7292 21.5699
## [41] 19.6531 20.3295 19.5880 20.1328 19.2420
summary(Salinidad$Zinc)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.2105 13.9852 19.2420 17.8308 22.6758 31.2865
ggplot(Salinidad,aes(x=Zinc))+geom_histogram()+ggtitle("Concentracion de Zinc")+ylab("Cantidad")+xlab("Zinc")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Segun el histograma anterior y los valeres de maximos y minimos calculados en el summary, la concentracion de zinc que se presenta en el suelo de esta muestra, se exponen en un rango entre 0.2105 y 31.2865 , ademas la mediana y y la media que son 19.2420 y 17.8308 respectivamente, al diferir en sus valores por alrededor de 2 unidades siendo la mediana mayor que la media, demuestran que la distribucion de esta caracteristica en la muestra es asimetrica negativa.

Potasio

Salinidad$Potasio
##  [1] 1441.67 1299.19 1154.27 1045.15  521.62 1273.02 1346.35 1253.88
##  [9] 1242.65 1282.95  553.69  494.74  526.97  571.14  408.64  646.65
## [17]  514.03  350.73  496.29  580.92  535.82  490.34  552.39  661.32
## [25]  672.12  525.65  563.13  497.96  458.38  498.25  936.26  894.79
## [33]  941.36 1038.79  898.05  989.87  951.28  929.83  925.42  954.11
## [41]  720.72  782.09  773.30  829.26  856.96
summary(Salinidad$Potasio)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   350.7   527.0   773.3   797.4   954.1  1441.7
ggplot(Salinidad,aes(x=Potasio))+geom_histogram()+ggtitle("Concentracion de Potasio")+ylab("Cantidad")+xlab("Potasio")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Segun el histograma anterior y los valeres de maximos y minimos calculados en el summary, la concentracion de zinc que se presenta en el suelo de esta muestra, se exponen en un rango entre 350.7 y 1441.7 , ademas la mediana y y la media que son 773.3 y 797.4 respectivamente, al diferir en sus valores por alrededor de 24.1 unidades siendo la mediana menor que la media, demuestran que la distribucion de esta caracteristica en la muestra es asimetrica positiva.

pH

Salinidad$pH
##  [1] 5.00 4.70 4.20 4.40 5.55 5.50 4.25 4.45 4.75 4.60 4.10 3.45 3.45 4.10
## [15] 3.50 3.25 3.25 3.20 3.35 3.30 3.25 3.25 3.20 3.20 3.35 7.10 7.35 7.45
## [29] 7.45 7.40 4.85 4.60 5.20 4.75 5.20 4.55 3.95 3.70 3.75 4.15 5.60 5.35
## [43] 5.50 5.50 5.40
summary(Salinidad$pH)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.200   3.450   4.450   4.609   5.350   7.450
ggplot(Salinidad,aes(x=pH))+geom_histogram()+ggtitle("Concentracion de pH")+ylab("Cantidad")+xlab("pH")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Segun el histograma anterior y los valeres de maximos y minimos calculados en el summary, la concentracion de pH que se presenta en el suelo de esta muestra, se exponen en un rango entre 3.200 y 7.450 , ademas la mediana y y la media que son 4.450 y 4.609 respectivamente siendo similares entre ellas, demuestrando que la distribucion de esta caracteristica en la muestra es simetrica.

Analsis y exploracion de datos bivariados

Relación entre la biomasa y las covariables pH, Salinidad,Zinc Y Potasio

Relacion biomasa y salinidad

ggplot(Salinidad,aes(x=Salinidad,y =Biomasa))+geom_point()+geom_smooth(color = 'red')+ggtitle("Relacion Biomasa y salinidad ")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Al realizar el diagrama de puntos para correlacionar las caracteristicas de salinidad y biomasa no se presenta ninguna realcion entre ellas debido a la dispersion dispareja y sin tendencia de los puntos como se puede observar en la linea roja y el amplio intervalo de confianza del ajuste dictado por la banda gris.

Relacion biomasa y pH

ggplot(Salinidad,aes(x=pH,y =Biomasa))+geom_point()+geom_smooth(color = 'red')+ggtitle("Relacion Biomasa y pH ")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Al realizar el diagrama de puntos para correlacionar las caracteristicas de pH y biomasa se presenta relacion entre ellas debido a la dispersion con tendencia positiva y proporcional de los puntos como se puede observar en la linea roja y el reducido intervalo de confianza del ajuste dictado por la banda gris.

Relacion biomasa y Zinc

ggplot(Salinidad,aes(x=Zinc,y =Biomasa))+geom_point()+geom_smooth(color = 'red')+ggtitle("Relacion Biomasa y Zinc ")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Al realizar el diagrama de puntos para correlacionar las caracteristicas de zinc y biomasa se presenta una realcion entre ellas debido a la dispersion con tendencia negativa de los puntos como se puede observar en la linea roja y el reducido intervalo de confianza del ajuste dictado por la banda gris.

Relacion biomasa y Potasio

ggplot(Salinidad,aes(x=Potasio,y =Biomasa))+geom_point()+geom_smooth(color = 'red')+ggtitle("Relacion Biomasa y Potasio ")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Al realizar el diagrama de puntos para correlacionar las caracteristicas de Potasio y biomasa no se presenta ninguna realcion entre ellas debido a la dispersion dispareja y sin tendencia de los puntos como se puede observar en la linea roja y el amplio intervalo de confianza del ajuste dictado por la banda gris.

Conclusiones

Segun los analisis realizados, en en la exploracion bivariada observamos que la caracteristica pH presenta una correlacion positiva con la respuesta biomasa, dictando asi que a mayores niveles de pH se va a presentar mas biomasa en la planta, estos datos coinciden con planteado por Rivera et al.(2018).

Tambien podemos observarque la caracteristica Zinc tambien tiene una correlacion, pero en este caso es negativa, ya que se muestra que entre menos concentacion de zinc se presente en el suelo mas repuesta de la biomasa se presenta, coinsidiendo con lo planteado por Casierra-Posada y Poveda(2005).

2.

Dos tipos de moluscos A y B fueron sometidos a tres concentraciones distintas de agua de mar (100%, 75% y 50%) y se observó el consumo de oxígeno midiendo la proporción de O2 por unidad de peso seco del molusco.

Cargamos la base de datos

load("C:/Users/Andres F. Cruz/Downloads/moluscos.RData")
BD_moluscos
## # A tibble: 48 x 3
##    c_agua molusco cons_o
##     <dbl> <chr>    <dbl>
##  1    100 A         7.16
##  2    100 A         8.26
##  3    100 A         6.78
##  4    100 A        14   
##  5    100 A        13.6 
##  6    100 A        11.1 
##  7    100 A         8.93
##  8    100 A         9.66
##  9    100 B         6.14
## 10    100 B         6.14
## # ... with 38 more rows
summary(BD_moluscos)
##      c_agua      molusco              cons_o      
##  Min.   : 50   Length:48          Min.   : 1.800  
##  1st Qu.: 50   Class :character   1st Qu.: 6.312  
##  Median : 75   Mode  :character   Median : 9.700  
##  Mean   : 75                      Mean   : 9.305  
##  3rd Qu.:100                      3rd Qu.:11.232  
##  Max.   :100                      Max.   :18.800

Se utiliza la funcion summary ya que poseemos una base de datos extensa, esta funcion nos proporciona datos como el minimo, el maximo los diferentes cuartiles y la media de los todos los datos presentes en cada caracteristica de la base de datos. esta informacion es imporante para los analisis que se realizaran mas adelante.

Analsis y exploracion de datos univariados

require(ggplot2)
library(tidyverse)

theme_set(theme_bw())

Se realiza el llamado a las librerias ggplot2 para realizar las graficas del analisis y la libreria tidyverse para la funcion theme_set que sera aplicado tambien a las graficas.

ggplot(BD_moluscos,aes(x=c_agua))+geom_bar()+facet_grid(~molusco)+ xlab("Concentracion de agua ")+ ylab ("Cantidad")

En esta grafica de barras podemos observar la distribucion de moluscos segun su tipo, ya sea A o B y tambien la concentracion de agua dividida en 3 sub grupos (50,75,100)% , cada sub grupo contiene 8 individuos y cada grupo contiene 24 indivuos, dando una muestra total de 48 individuos.

graciasa este grafico tambien podemos evidenciar que el diseño exprimental se encuentra balanceado.

Caracteristicas

Consumo de oxigeno

ggplot(BD_moluscos,aes(x=cons_o))+geom_histogram()+ggtitle("Consumo de Oxigeno")+ylab("Cantidad")+xlab("Concentracion de oxigeno")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

En este histograma realizado, se puede observar que el consumo de oxigeno que se presenta en los moluscos varia en un rango de entre 1.80 hasta 18.80.

Tambien podemos observar que segun el summary de concentracion de oxigeno poseen una mediana de 9.70 y una media de 9.305, siendo estas muy similares determinando que la distribucion de la caracteristica es simetrica.

Analsis y exploracion de datos bivariados

ggplot(BD_moluscos, aes(x=c_agua, y=cons_o, fill=molusco))+ geom_boxplot(color = 'black', alpha = 0.7)+ggtitle("Consumo de oxigeno y Concentracion de agua")+ylab("Consumo de Oxigeno")+xlab("Concentracion de agua")

Conclusiones

Segun el grafico de cajas realizado para la exploracion de datos bivariados, podemos concluir que los molucos del tipo A consumen mas oxigeno que los del tipo B, la diferencia se observa en el rango de ambas, sin embargo no podemos concluir en que concentracion ya que en grafico no se puede apreciar cual es en la que mejor se comportan, esto puede deberse a un error de programacion.

Bibliografia

  • Casierra-Posada, F. y Poveda, J, 2005 . La toxicidad por exceso de Mn y Zn disminuye la producción de materia seca, los pigmentos foliares y la calidad del fruto en fresa (Fragaria sp. cv. Camarosa). Agronomía Colombiana. 23(2).

  • Rivera, E.; Sánchez, M. y Domínguez, H. 2018. pH como factor de crecimiento en plantas. RIC.4.