Para el estudio de la relacion entre ciertas caracteristicas abioticas del suelo y la produccion de biomasa (gr) de una planta forrajera se obtuvieron 45 muestras que fueron expuestas a diferentes concentraciones y cantidades de pH, Salinidad, Zinc y Potasio

 load("D:/Escritorio/bioestadistica/parcial 1 OGG/YDRAY-Salinidad (1).RData")
Salinidad
##     Biomasa   pH Salinidad    Zinc Potasio
## 1   765.280 5.00        33 16.4524 1441.67
## 2   954.017 4.70        35 13.9852 1299.19
## 3   827.686 4.20        32 15.3276 1154.27
## 4   755.072 4.40        30 17.3128 1045.15
## 5   896.176 5.55        33 22.3312  521.62
## 6  1422.836 5.50        33 12.2778 1273.02
## 7   821.069 4.25        36 17.8225 1346.35
## 8  1008.804 4.45        30 14.3516 1253.88
## 9  1306.494 4.75        38 13.6826 1242.65
## 10 1039.637 4.60        30 11.7566 1282.95
## 11 1193.223 4.10        30  9.8820  553.69
## 12  777.474 3.45        37 16.6752  494.74
## 13  818.127 3.45        33 12.3730  526.97
## 14 1203.568 4.10        36  9.4058  571.14
## 15  977.515 3.50        30 14.9302  408.64
## 16  369.823 3.25        30 31.2865  646.65
## 17  509.872 3.25        27 30.1652  514.03
## 18  448.315 3.20        29 28.5901  350.73
## 19  615.091 3.35        34 17.8795  496.29
## 20  545.538 3.30        36 18.5056  580.92
## 21  436.552 3.25        30 22.1344  535.82
## 22  465.907 3.25        28 28.6101  490.34
## 23  664.601 3.20        31 23.1908  552.39
## 24  502.466 3.20        31 24.6917  661.32
## 25  496.797 3.35        35 22.6758  672.12
## 26 2270.294 7.10        29  0.3729  525.65
## 27 2332.220 7.35        35  0.2703  563.13
## 28 2162.531 7.45        35  0.3205  497.96
## 29 2222.588 7.45        30  0.2648  458.38
## 30 2337.326 7.40        30  0.2105  498.25
## 31 1349.192 4.85        26 18.9875  936.26
## 32 1058.976 4.60        29 20.9687  894.79
## 33 1408.206 5.20        25 23.9841  941.36
## 34 1491.276 4.75        26 19.9727 1038.79
## 35 1254.872 5.20        26 21.3864  898.05
## 36 1152.341 4.55        25 23.7063  989.87
## 37  568.455 3.95        26 30.5589  951.28
## 38  612.447 3.70        26 26.8415  929.83
## 39  654.825 3.75        27 27.7292  925.42
## 40  991.829 4.15        27 21.5699  954.11
## 41 1895.942 5.60        24 19.6531  720.72
## 42 1346.880 5.35        27 20.3295  782.09
## 43 1482.793 5.50        26 19.5880  773.30
## 44 1145.643 5.50        28 20.1328  829.26
## 45 1137.193 5.40        28 19.2420  856.96
summary(Salinidad)
##     Biomasa             pH          Salinidad          Zinc        
##  Min.   : 369.8   Min.   :3.200   Min.   :24.00   Min.   : 0.2105  
##  1st Qu.: 654.8   1st Qu.:3.450   1st Qu.:27.00   1st Qu.:13.9852  
##  Median : 991.8   Median :4.450   Median :30.00   Median :19.2420  
##  Mean   :1082.2   Mean   :4.609   Mean   :30.27   Mean   :17.8308  
##  3rd Qu.:1346.9   3rd Qu.:5.350   3rd Qu.:33.00   3rd Qu.:22.6758  
##  Max.   :2337.3   Max.   :7.450   Max.   :38.00   Max.   :31.2865  
##     Potasio      
##  Min.   : 350.7  
##  1st Qu.: 527.0  
##  Median : 773.3  
##  Mean   : 797.4  
##  3rd Qu.: 954.1  
##  Max.   :1441.7

Se emplea la funcion summary debido a que se esta utilizando una amplia base de datos, esta nos arroja datos importantes como la media, la mediana,maximos, minimos y los cuartiles de los datos de cada caracteristica en la base de datos, informacion que es relevante para el analisis que se realizara mas adelante.

##Analsis exploratorio de datos univariados

require(ggplot2)
## Loading required package: ggplot2
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v tibble  3.1.3     v dplyr   1.0.7
## v tidyr   1.1.3     v stringr 1.4.0
## v readr   2.0.1     v forcats 0.5.1
## v purrr   0.3.4
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()

Se emplea el llamado de librerias ggplot2 con el fin de realizar las graficas y como apoyo la libreria tidyverse

###Salinidad

Salinidad$Salinidad
##  [1] 33 35 32 30 33 33 36 30 38 30 30 37 33 36 30 30 27 29 34 36 30 28 31 31 35
## [26] 29 35 35 30 30 26 29 25 26 26 25 26 26 27 27 24 27 26 28 28
summary(Salinidad$Salinidad)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   24.00   27.00   30.00   30.27   33.00   38.00
ggplot(Salinidad,aes(x=Salinidad))+geom_histogram()+ggtitle("Concentracion de Salinidad")+ylab("Cantidad")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

ggplot(Salinidad,aes(x=Salinidad))+geom_boxplot()+ggtitle("Concentracion de Salinidad")+ylab("Cantidad")+xlab("Salinidad")

segun la grafica anterior se observa que la salinidad en el suelo presenta un rango entre 24 y 38, junto con una media de 30.27 y una mediana de 30, en el histograma no se observa una distribucion clara pero en el diagrama de cajas si se percibe cierta simetria.

variacion:

sd(Salinidad$Salinidad)
## [1] 3.719726
c_V=sd(Salinidad$Salinidad)/mean(Salinidad$Salinidad)

El coeficiente de variacion es del 12% indicando cierta variabilidad (no homegeneidad)

###Potasio

Salinidad$Potasio
##  [1] 1441.67 1299.19 1154.27 1045.15  521.62 1273.02 1346.35 1253.88 1242.65
## [10] 1282.95  553.69  494.74  526.97  571.14  408.64  646.65  514.03  350.73
## [19]  496.29  580.92  535.82  490.34  552.39  661.32  672.12  525.65  563.13
## [28]  497.96  458.38  498.25  936.26  894.79  941.36 1038.79  898.05  989.87
## [37]  951.28  929.83  925.42  954.11  720.72  782.09  773.30  829.26  856.96
summary(Salinidad$Potasio)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   350.7   527.0   773.3   797.4   954.1  1441.7
ggplot(Salinidad,aes(x=Potasio))+geom_histogram()+ggtitle("Concentracion de Potasio")+ylab("Cantidad")+xlab("Potasio")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

ggplot(Salinidad,aes(x=Potasio))+geom_boxplot()+ggtitle("Concentracion de Potasio")+ylab("Cantidad")+xlab("Potasio")

Segun la grafica anterior se observa que la concentracion de potasio en el suelo presenta un rango entre 350.7 y 1441.7 junto con una media de 797.4 y una mediana de 773.3 no mostrando una distribucion definida.

Variacion:

sd(Salinidad$Potasio)
## [1] 297.576
c_V=sd(Salinidad$Potasio)/mean(Salinidad$Potasio)

El coeficiente de variacion es igual al 37.31%, es decir que es muy variable.

###Zinc

Salinidad$Zinc
##  [1] 16.4524 13.9852 15.3276 17.3128 22.3312 12.2778 17.8225 14.3516 13.6826
## [10] 11.7566  9.8820 16.6752 12.3730  9.4058 14.9302 31.2865 30.1652 28.5901
## [19] 17.8795 18.5056 22.1344 28.6101 23.1908 24.6917 22.6758  0.3729  0.2703
## [28]  0.3205  0.2648  0.2105 18.9875 20.9687 23.9841 19.9727 21.3864 23.7063
## [37] 30.5589 26.8415 27.7292 21.5699 19.6531 20.3295 19.5880 20.1328 19.2420
summary(Salinidad$Zinc)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.2105 13.9852 19.2420 17.8308 22.6758 31.2865
ggplot(Salinidad,aes(x=Zinc))+geom_histogram()+ggtitle("Concentracion de Zinc")+ylab("Cantidad")+xlab("Zinc")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

ggplot(Salinidad,aes(x=Zinc))+geom_boxplot()+ggtitle("Concentracion de Zinc")+ylab("Cantidad")+xlab("Zinc")

Segun la grafica anterior se observa que la concentracion de zinc en el suelo presenta un rango entre 0.2105 y 31.2865, junto con una media de 17.8308 y mediana de 19.2420, mostrando una distribuicion no tan clara pero se observan unos datos atipicos.

Variacion:

sd(Salinidad$Zinc)
## [1] 8.274169
c_V=sd(Salinidad$Zinc)/mean(Salinidad$Zinc)

El coeficiente de variacion es igual a 46.4%, es decir que es muy variable.

###pH

Salinidad$pH
##  [1] 5.00 4.70 4.20 4.40 5.55 5.50 4.25 4.45 4.75 4.60 4.10 3.45 3.45 4.10 3.50
## [16] 3.25 3.25 3.20 3.35 3.30 3.25 3.25 3.20 3.20 3.35 7.10 7.35 7.45 7.45 7.40
## [31] 4.85 4.60 5.20 4.75 5.20 4.55 3.95 3.70 3.75 4.15 5.60 5.35 5.50 5.50 5.40
summary(Salinidad$pH)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.200   3.450   4.450   4.609   5.350   7.450
ggplot(Salinidad,aes(x=pH))+geom_histogram()+ggtitle("Concentracion de pH")+ylab("Cantidad")+xlab("pH")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

ggplot(Salinidad,aes(x=pH))+geom_boxplot()+ggtitle("Concentracion de pH")+ylab("Cantidad")+xlab("ph")

Segun la grafica anterior se observa que el pH en el suelo presenta un rango entre 3.200 y 7.450, junto con una media 4.609 y mediana de 4.450,no mostrando una distribucion simetrica.

Variacion:

sd(Salinidad$pH)
## [1] 1.254731
c_V=sd(Salinidad$pH)/mean(Salinidad$pH)

El coeficiente de variacion es del 27%, es decir que es muy variable.

###Analsis exploratorio bivariado:

Relacion entre la biomasa y las covariables pH, Salinidad,Zinc Y Potasio

####Relacion biomasa y salinidad

ggplot(Salinidad,aes(x=Salinidad,y =Biomasa))+geom_point()+geom_smooth()+ggtitle("Relacion Biomasa y salinidad ")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Se observa una relacion debil entre los niveles de salinidad y la produccion de biomasa, ya que los puntos no estan cerca la linea de tendencia.

###Relacion biomasa y Zinc

ggplot(Salinidad,aes(x=Zinc,y =Biomasa))+geom_point()+geom_smooth(color = 'red')+ggtitle("Relacion Biomasa y Zinc ")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Se observa una relacion entre la produccion de biomasa y las concentraciones de zinc en suelo con tendencia negativa debido a la concentracion de los puntos alrededor de la linea de tendencia roja y el reducido intervalo de confianza del ajuste reprensentado en la banda gris; es decir que a mayores concentraciones de zinc en el suelo menor produccion de biomasa.

###Relacion biomasa y pH

ggplot(Salinidad,aes(x=pH,y =Biomasa))+geom_point()+geom_smooth(color = 'red')+ggtitle("Relacion Biomasa y pH ")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Se observa una relacion entre la produccion de biomasa y el ph en el suelo con tendencia positiva proporcional a los puntos sobre la linea roja de tendencia y un reducido intervalo de confianza del ajuste reprensentado en la banda gris;es decir que hay una relacion directamente proporcional en la produccion de biomasa y el pH del suelo.

###Relacion biomasa y Potasio

ggplot(Salinidad,aes(x=Potasio,y =Biomasa))+geom_point()+geom_smooth(color = 'red')+ggtitle("Relacion Biomasa y Potasio ")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Al realizar el grafico de dispersion que representa la correlacion entre las concentraciones de potasio presentes en el suelo y la biomasa producida, no se observa ninguna relacion entre ellas gracias a una dispersion dispareja y sin tendencia de los puntos hacia la linea roja de tendencia central, y un amplio intervalo de confianza del ajuste representado por la banda gris.

#2.

Dos tipos de moluscos A y B fueron sometidos a tres concentraciones distintas de agua de mar (100%, 75% y 50%) y se observo el consumo de oxigeno midiendo la proporcion de O2 por unidad de peso seco del molusco.

load("D:/Escritorio/bioestadistica/parcial 1 OGG/YDRAY-moluscos (1).RData")
BD_moluscos
## # A tibble: 48 x 3
##    c_agua molusco cons_o
##     <dbl> <chr>    <dbl>
##  1    100 A         7.16
##  2    100 A         8.26
##  3    100 A         6.78
##  4    100 A        14   
##  5    100 A        13.6 
##  6    100 A        11.1 
##  7    100 A         8.93
##  8    100 A         9.66
##  9    100 B         6.14
## 10    100 B         6.14
## # ... with 38 more rows
summary(BD_moluscos)
##      c_agua      molusco              cons_o      
##  Min.   : 50   Length:48          Min.   : 1.800  
##  1st Qu.: 50   Class :character   1st Qu.: 6.312  
##  Median : 75   Mode  :character   Median : 9.700  
##  Mean   : 75                      Mean   : 9.305  
##  3rd Qu.:100                      3rd Qu.:11.232  
##  Max.   :100                      Max.   :18.800

Se emplea la funcion summary debido a que se esta utilizando una amplia base de datos, esta nos arroja datos importantes como la media, la mediana,maximos, minimos y los cuartiles de los datos de cada caracteristica en la base de datos, informacion que es relevante para el analisis que se realizara mas adelante.

##Analsis exploratorio univariado

require(ggplot2)
library(tidyverse)

Se emplea el llamado de librerias ggplot2 con el fin de realizar las graficas y como apoyo la libreria tidyverse

ggplot(BD_moluscos,aes(x=c_agua))+geom_bar()+facet_grid(~molusco)+ xlab("Concentracion de agua ")+ ylab ("Cantidad")

La grafica de barras muestra la distribucion de moluscos segun su tipo (A,B), la concentracion de agua dividida en 3 subgrupos (100%,75%,50%), donde cada subgrupo contiene 8 individuos y cada grupo contiene 24 individuos para un total de 48 individuos.

###Caracteristicas

###Consumo de oxigeno

ggplot(BD_moluscos,aes(x=cons_o))+geom_histogram()+ggtitle("Consumo de Oxigeno")+ylab("Cantidad")+xlab("Concentracion de oxigeno")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

En esta grafica se puede apreciar que la media y mediana de la concetracion de oxigeno segun el summary son de 9.305 y 9.70, al ser conectraciones casi identicas se determina que posee una distribucion simetrica; ademas se observa que el rango varia entre 1.80 hasta 18.80, es decir que a una concentracion de oxigeno de 9.305, hay un mayor consumo de oxigeno por parte de los individuos.

analisis exploratorio bivariado

ggplot(BD_moluscos, aes(y=cons_o, x=c_agua, fill= c_agua))+geom_boxplot()+facet_grid(~molusco)+xlab("Concentración agua")+ylab("Consumo de oxígeno")+ggtitle("Tipo de molusco")
## Warning: Continuous x aesthetic -- did you forget aes(group=...)?

Segun el grafico de cajas realizado para la exploracion de datos bivariados, podemos concluir que los moluscos del tipo A consumen mas oxigeno que los del tipo B, la diferencia se observa en el rango de ambas, sin embargo no podemos concluir en que concentracion de O2 ya que en grafico no se puede apreciar cual es en la que mejor se comportan, esto puede deberse a un error de programacion.