Parcial #1 Bioestadistica

Punto #1

Base de datos salinidad

## Cargamos la base de datos "salinidad" para analizar los datos
load("C:/Users/U S E R/Documents/Documents france/Documentos U/Bioestadistica/Parcial #1/YDRAY-Salinidad.Rdata")
Salinidad
##     Biomasa   pH Salinidad    Zinc Potasio
## 1   765.280 5.00        33 16.4524 1441.67
## 2   954.017 4.70        35 13.9852 1299.19
## 3   827.686 4.20        32 15.3276 1154.27
## 4   755.072 4.40        30 17.3128 1045.15
## 5   896.176 5.55        33 22.3312  521.62
## 6  1422.836 5.50        33 12.2778 1273.02
## 7   821.069 4.25        36 17.8225 1346.35
## 8  1008.804 4.45        30 14.3516 1253.88
## 9  1306.494 4.75        38 13.6826 1242.65
## 10 1039.637 4.60        30 11.7566 1282.95
## 11 1193.223 4.10        30  9.8820  553.69
## 12  777.474 3.45        37 16.6752  494.74
## 13  818.127 3.45        33 12.3730  526.97
## 14 1203.568 4.10        36  9.4058  571.14
## 15  977.515 3.50        30 14.9302  408.64
## 16  369.823 3.25        30 31.2865  646.65
## 17  509.872 3.25        27 30.1652  514.03
## 18  448.315 3.20        29 28.5901  350.73
## 19  615.091 3.35        34 17.8795  496.29
## 20  545.538 3.30        36 18.5056  580.92
## 21  436.552 3.25        30 22.1344  535.82
## 22  465.907 3.25        28 28.6101  490.34
## 23  664.601 3.20        31 23.1908  552.39
## 24  502.466 3.20        31 24.6917  661.32
## 25  496.797 3.35        35 22.6758  672.12
## 26 2270.294 7.10        29  0.3729  525.65
## 27 2332.220 7.35        35  0.2703  563.13
## 28 2162.531 7.45        35  0.3205  497.96
## 29 2222.588 7.45        30  0.2648  458.38
## 30 2337.326 7.40        30  0.2105  498.25
## 31 1349.192 4.85        26 18.9875  936.26
## 32 1058.976 4.60        29 20.9687  894.79
## 33 1408.206 5.20        25 23.9841  941.36
## 34 1491.276 4.75        26 19.9727 1038.79
## 35 1254.872 5.20        26 21.3864  898.05
## 36 1152.341 4.55        25 23.7063  989.87
## 37  568.455 3.95        26 30.5589  951.28
## 38  612.447 3.70        26 26.8415  929.83
## 39  654.825 3.75        27 27.7292  925.42
## 40  991.829 4.15        27 21.5699  954.11
## 41 1895.942 5.60        24 19.6531  720.72
## 42 1346.880 5.35        27 20.3295  782.09
## 43 1482.793 5.50        26 19.5880  773.30
## 44 1145.643 5.50        28 20.1328  829.26
## 45 1137.193 5.40        28 19.2420  856.96
summary(Salinidad)
##     Biomasa             pH          Salinidad          Zinc        
##  Min.   : 369.8   Min.   :3.200   Min.   :24.00   Min.   : 0.2105  
##  1st Qu.: 654.8   1st Qu.:3.450   1st Qu.:27.00   1st Qu.:13.9852  
##  Median : 991.8   Median :4.450   Median :30.00   Median :19.2420  
##  Mean   :1082.2   Mean   :4.609   Mean   :30.27   Mean   :17.8308  
##  3rd Qu.:1346.9   3rd Qu.:5.350   3rd Qu.:33.00   3rd Qu.:22.6758  
##  Max.   :2337.3   Max.   :7.450   Max.   :38.00   Max.   :31.2865  
##     Potasio      
##  Min.   : 350.7  
##  1st Qu.: 527.0  
##  Median : 773.3  
##  Mean   : 797.4  
##  3rd Qu.: 954.1  
##  Max.   :1441.7

Se utilizo la función summary para calcular distintos valores como la media, promedio, cuartiles, la mediana, etc… para estudiar las relaciones entre estos datos.

Analisis de datos Univariados

Salinidad

require(ggplot2)
## Loading required package: ggplot2
ggplot(data=Salinidad,aes(x=Salinidad))+geom_histogram()+theme_bw()+xlab("Concentración de sal")+ylab("Frecuancia")+ggtitle("Cocentración de sal")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Se puede observar en la gráfica que la concentración de sal en el suelo tiene un mínimo de 24, un máximo de 38, una mediana de 30.00 y un promedio de 30.27, la concentración mas frecuenta de sal se observa en 30.00. Los datos nos indican que la muestra es asimétrica positiva.

Ph

require(ggplot2)
ggplot(data=Salinidad,aes(x=pH))+geom_histogram()+theme_bw()+xlab("Escala de pH")+ylab("Frecuancia")+ggtitle("Niveles de pH")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

En esta gráfica podemos observar las escalas de ph que se encuentran en el suelo, se observa que la escala promedio de pH en el suelo es de 4.4, un valor Mínimo de 3.2 y máximo de 7.4.

Zinc

require(ggplot2)
ggplot(data=Salinidad,aes(x=Zinc))+geom_histogram()+theme_bw()+xlab("Concentración de zinc")+ylab("Cantidad")+ggtitle("Concentración de Zinc en el suelo")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

En este gráfico podemos observa la concentración de zinc de suelo, vemos que la presencia de zinc varían en un rango entre 0.2 y 31.2 y presenta una concentración promedio es de 17.8. Un dato a tener en cuenta es que el promedio es menor a la mediana lo que quiere decir que es una muestra asimétrica negativa.

Potasio

require(ggplot2)
ggplot(data=Salinidad,aes(x=Potasio))+geom_histogram()+theme_bw()+xlab("Concentración de potasio")+ylab("Cantidad")+ggtitle("Concentración de Potasio en el suelo")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Aquí podemos observar que la concentración promedio de potasio del suelo es de 797.4. Los valores de potasio en suelo se encuentran en un rango de 350.7 a 1441.7 y su promedio al ser mayor que la mediana representa una muestra asimétrica positiva.

Analisis de Datos bivariados

Relacion entre concentración de salinidad y Biomasa

require(ggplot2)
ggplot(data=Salinidad,aes(x=Salinidad,y=Biomasa))+geom_point()+theme_bw()+xlab("Salinidad")+ylab("Biomasa")+geom_smooth(color="orange")+ggtitle("Relación entre Biomasa y salinidad")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

En esta gráfica de correlación no podemos identificar una relación entre la Biomasa y la salinidad puesto que los datos se encuentran muy dispersos lo que nos dice que este factor no influye en el desarrollo de la biomasa.

Relación entre Biomasa y pH

require(ggplot2)
ggplot(data=Salinidad,aes(x=Biomasa,y=pH))+geom_point()+theme_bw()+xlab("Biomasa")+ylab("Nivel de pH")+ggtitle("Relación entre Biomasa y pH")+geom_smooth(color="orange")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Se puede ver que existe una relación entre el pH y la Biomasa, entre menores sean los niveles de pH en suelo se producirá un medio ácido que no permitirá que el organismo desarrolle Biomasa, por otro parte los niveles altos de ph cercanos a 7 permiten que se desarrolle una gran concentración de Biomasa.

Relación Biomasa y Zinc

require(ggplot2)
ggplot(data=Salinidad,aes(x=Biomasa,y=Zinc))+geom_point()+theme_bw()+xlab("Biomasa")+ylab("Concentración de Zinc")+ggtitle("Relación entre Biomasa y Zinc")+geom_smooth(color="orange")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

En esta grafica podemos observar que que entre menores sean las concentraciones de Zinc se va a ver un aumento en la Biomasa del organismo. En el punto minimo de Zinc el cual es 350.7 se observa el pico mas alto de desarrollo en Biomasa mientras que en el punto maximo de Zinc se produce lo contrario.

Conclusiones

Los dos factores que tiene mas relevancia en el desarrollo de la biomasa de plantas forrajeras fueron el Zinc y el pH, estas dos variables dependiendo de sus niveles de concentración en suelo podían reducir (Correlación negativa) o aumentar (Correlación positiva) la biomasa del organismo.

Punto #2

Base de datos Moluscos

## Cargamos la base de datos "BD_moluscos" para analizar los datos
load("C:/Users/U S E R/Documents/Documents france/Documentos U/Bioestadistica/Parcial #1/YDRAY-moluscos.Rdata")
BD_moluscos
## # A tibble: 48 x 3
##    c_agua molusco cons_o
##     <dbl> <chr>    <dbl>
##  1    100 A         7.16
##  2    100 A         8.26
##  3    100 A         6.78
##  4    100 A        14   
##  5    100 A        13.6 
##  6    100 A        11.1 
##  7    100 A         8.93
##  8    100 A         9.66
##  9    100 B         6.14
## 10    100 B         6.14
## # ... with 38 more rows
summary(BD_moluscos)
##      c_agua      molusco              cons_o      
##  Min.   : 50   Length:48          Min.   : 1.800  
##  1st Qu.: 50   Class :character   1st Qu.: 6.312  
##  Median : 75   Mode  :character   Median : 9.700  
##  Mean   : 75                      Mean   : 9.305  
##  3rd Qu.:100                      3rd Qu.:11.232  
##  Max.   :100                      Max.   :18.800

Utilizamos la función summary para calcular todos los datos necesarios para el estudio de la relación entre estos.

Analisis de datos univariados

Concentración de agua de mar

require(ggplot2)
ggplot(data=BD_moluscos,aes(x=c_agua,colour=molusco))+geom_bar()+theme_bw()+xlab("Concentración de agua de mar")+ylab("Cantidad")+ggtitle("Cocentración de agua de mar")+facet_grid(~molusco)

En el gráfico podemos observar la distribución de los individuos de estudio los cuales fueron divididos en 2 grupos, grupo A y B y dentro de ellos 3 sub grupos divididos por concentración de agua de mar (50%. 75% y 100%). Un diseño experimental estable.

Consumo de Oxigeno

require(plotly)
## Loading required package: plotly
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
ggplot(data=BD_moluscos,aes(y=cons_o,fill=molusco))+geom_boxplot()+theme_bw()+xlab("Concentración de Oxigeno")+ylab("Consumo de O2")+ggtitle("Consumo de O2")+facet_grid(~molusco)

En este gráfico podemos observar el consumo de oxigeno de los moluscos separado por grupos, vemos que los datos varían mucho con un mínimo de 1.8 y un máximo de 18.8 en el grupo B y en el grupo A se observa un consumo mínimo por encima de 5 y un máximo de por menor de 15 para el grupo A, promedio de consumo de oxigeno es 9.3 en el grupo A y menor a 9 en el grupo B.

Analisis de datos bivariados

Relación Consumo de oxigeno y concentración de agua

require(ggplot2)
ggplot(data=BD_moluscos,aes(x=c_agua,y=cons_o, colour=molusco))+geom_point()+theme_bw()+xlab("Concentración de agua de mar")+ylab("Consumo de O.")+geom_smooth()+facet_grid(~molusco)+ggtitle("Relacion consumo de oxigeno y concentración de agua")

Se observa en el gráfico una relación entre las variables Concentración de agua de mar y consumo de oxigeno en los dos grupos de moluscos.

Conclusiones

En este gráfico podemos observar que las variables consumo de oxigeno y concentración de agua de mar están relacionadas, se puede apreciar que en bajas concentraciones de agua de mar el consumo de oxigeno en los dos grupos es muy similar aunque en el grupo de B los moluscos consumen un poco mas de oxigeno, pero al aumentar las concentraciones de agua de mar vemos que el consumo de oxigeno disminuye radicalmente para los dos grupos. Aunque en el grupo A parece lograr adaptarse mucho mejor a las grandes concentraciones de agua aumentando su consumo de oxigeno un poco en grandes concentraciones el grupo B no lo puede hacer con la misma eficiencia.