##EJERCICO 1
Se realizará un análisis de la relación entre ciertas características del suelo y la producción de biomasa de varias muestras de una planta forrajera.
load("C:/Users/beatriz/beatriz/bioestadistica/parcial 1/Salinidad.RData")
datosS=Salinidad
head(datosS)
## Biomasa pH Salinidad Zinc Potasio
## 1 765.280 5.00 33 16.4524 1441.67
## 2 954.017 4.70 35 13.9852 1299.19
## 3 827.686 4.20 32 15.3276 1154.27
## 4 755.072 4.40 30 17.3128 1045.15
## 5 896.176 5.55 33 22.3312 521.62
## 6 1422.836 5.50 33 12.2778 1273.02
Según lo que se observa en la tabla, esta contiene 5 variables: la Biomasa en gramos de la planta forrajera y las siguentes son características de suelo: el pH, la Salinidad, el Zinc y el Potasio.
##exploracion de datos
require(ggplot2)
## Loading required package: ggplot2
s1=ggplot(data = datosS, aes(x=Biomasa, col=I("blue")))+geom_histogram()+theme_bw()
s1
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Gráfico 1: El pico de los datos de la producción de biomasa de la planta forrajera se encuentra un poco menor a los 500gr, con una frecuencia de cuatro; asimismo se registran seis intervalos de datos en una frecuencia de tres, entre 500gr a 1300gr aproximadamente. Se presentan datos atipicos alrededor de los 2000gr.
s2=ggplot(data = datosS, aes(x=pH, col=I("blue")))+geom_histogram()+theme_bw()
s2
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Gráfico 2: El nivel de pH de mayor frecuencia se encuentra entre 3 a 3.5 niveles de pH. Indicando que la mayoría las muestras de plantas forrajeras en sus suelos, presentan un pH ácido. También se registran datos atipicos que estan a un pH de entre 6.9 a 8.
s3=ggplot(data = datosS, aes(x=Salinidad, col=I("blue")))+geom_histogram()+theme_bw()
s3
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Gráfico 3: El dato de salinidad en el suelo de las muestras de plantas forrajeras que se presenta con más frecuencia, esta en torno a 30 aproximademente.
s4=ggplot(data = datosS, aes(x=Zinc, col=I("blue")))+geom_histogram()+theme_bw()
s4
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Gráfico 4: Los datos más frecuentes de zinc se registran alrededor de 0, sin embargo, estos datos son atipicos; Esta informacion expone que el suelo en la mayoría de las muestras es bajo en zinc.La segunda frecuencia mas alta de la cantidad de zinc en suelo es menor a 20 con una frecuencia de cuatro.
s5=ggplot(data = datosS, aes(x=Potasio, col=I("blue")))+geom_histogram()+theme_bw()
s5
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Tabla 5: La mayor frecuencia de potasio en el suelo indica ser de 1000 aproximadamente, seguido de tres intervalos con la misma frecuencia y la cantidad de potasio de entre 500 a 600 aproximadamente.
S1=ggplot(data = datosS, aes(y=Biomasa, x=pH, colour=pH))+geom_point()+geom_smooth(se=F)+theme_bw()
S1
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
Gráfico 1: La mayoría de los datos que relaciona en pH y la biomasa estan en el cuadrante inferior izquierdo. El gráfico expone la relacion directa que existe entre la producción de biomasa y el pH, es decir, que a medida que la producción de biomasa en la plantas forrajeras aumenta, el suelo presenta menor acidez. Sin embargo, se presentan datos atipicos en el momento en que el pH es mayor a 7 y la producción de biomasa a mas de 2000 gr. Esto demuestra que las plantas con poca producción de biomasa necesitan de un suelo más o menos ácido, aproximadamente 4 a 6.
S2=ggplot(data = datosS, aes(y=Biomasa, x=Salinidad, colour=Salinidad))+geom_point()+geom_smooth(se=F)+theme_bw()
S2
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
Gráfico 2: A pesar de que la línea suavisada indica el patrón dominante, los datos estan muy dispersos en relación a la línea; lo que demuestra que no hay relación entre la producción de biomasa y la salinidad del suelo.
S3=ggplot(data = datosS, aes(y=Biomasa, x=Zinc, colour=Zinc))+geom_point()+geom_smooth(se=F)+theme_bw()
S3
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
Gráfico 3: La línea suavisada revela el patrón dominante del gráfico, lo que demuestra que los datos de la biomasa en relación a la cantidad de zinc se encuentran principalmente en el cuadrante inferior en dirección a la derecha. Lo que presenta el gráfico es que a medida que disminuye en producción de biomasa en las plantas forrajeras, la cantidad del zinc en el suelo aumenta; pero presenta cierta constancia en el momento que el zinc esta entre 15 a 20 y la producción de biomasa alrededor de los 1000gr, luego vuelve a descender.También se presentan datos atipicos cuando el zinc esta alrededor de 0 y la producción de biomasa incrementada, asimismo cuando el zinc esta cerca de 20 y la producción de biomasa a los 1800 aproximadamente.
S4=ggplot(data = datosS, aes(y=Biomasa, x=Potasio, colour=Potasio))+geom_point()+geom_smooth(se=F)+theme_bw()
S4
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
Gráfico 4: El patrón dominante se encuentra en el cuadrante inferior y es mas o menos constante respecto a la produccion de biomasa, sin embargo los datos se encuentran muy dispersos en el cuadrante respecto a la línea suavisada por lo cual, no se evidencia relación clara entre la producción de biomasa y el potasio en suelo.
Las variables que presentan mejor relación con la biomasa son el pH y el zinc. Cuando hay una producción de biomasa baja, el suelo es más o menos ácido; asimismo, cuando la biomasa esta reducida, el zinc en el suelo está en mayor cantidad. Haciendo probable analizar el pH y el zinc, es decir, que la fijación del zinc en la planta forrajera es mejor cuando el pH del suelo esta entre 4 a 6.
##EJERCICIO 2
se realizará un análisis de las concentraciones de agua de mar a la que fueron sometidos dos tipos de moluscos, además del consumo de oxígeno de cada uno.
load("C:/Users/beatriz/beatriz/bioestadistica/parcial 1/moluscos.RData")
Moluscos=BD_moluscos
head(Moluscos)
## # A tibble: 6 x 3
## c_agua molusco cons_o
## <dbl> <chr> <dbl>
## 1 100 A 7.16
## 2 100 A 8.26
## 3 100 A 6.78
## 4 100 A 14
## 5 100 A 13.6
## 6 100 A 11.1
Según lo expuesto en la tabla, esta comprende 3 variables: las 3 concentraciones de agua de mar (c_agua), el tipo de molusco a utilizar (molusco) y el oxígeno que es consumido por los individuos (cons_o).
##exploracion de datos
m1=ggplot(data = Moluscos, aes(x=c_agua, fill=c_agua))+geom_bar()+theme_bw()
m1
Gráfico 1: El gráfico de la concentración de agua presenta balance en sus datos, debido a que solo hay tres datos 50%, 75% y 100%.
m2=ggplot(data = Moluscos, aes(x=molusco, fill=molusco))+geom_bar()+theme_bw()
m2
Gráfico 2: Este gráfico también presenta balance en sus datos, puesto que solo hay dos datos, Molusco A y Molusco B.
m3=ggplot(data = Moluscos, aes(x=cons_o, fill=cons_o, col=I("red")))+geom_histogram()+theme_bw()
m3
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Gráfico 3: El dato que se presenta con mayor frecuencia en el consumo de oxígeno se encuentra en torno a 10. También presentan datos atipicos mayores a 15 y menor a 3.
M1=ggplot(data = Moluscos, aes(y=cons_o, x=c_agua))+geom_point()+theme_bw()
M1
Gráfico 1: Se realiza la comparación del consumo de oxígeno del molusco y la concentración de agua de mar a la que fueron sometidos. Los moluscos que se encuentran en el 50% de concentracion de agua de mar consumen más oxígeno, seguido de los que estan en un 100% de concentración y por último los que fueron sometidos a un 75% de concentración de agua de mar.
M2=ggplot(data = Moluscos, aes(y=cons_o, x=c_agua, fill=molusco))+geom_boxplot()+facet_grid(~c_agua)+theme_bw()
M2
Gráfico 2: El gráfico de cajas muestra de forma más detallada como es el consumo de oxígeno y las concentraciones de agua de mar en relación al tipo de molusco (A y B). En la concentraciÓn del 50% los moluscos presentan un mayor consumo de oxígeno en relación al resto de las concentraciones de agua de mar.
Concentración al 50% de agua de mar: El tipo de molusco B presenta un consumo de oxígeno importante a comparación con los moluscos tipo A, los cuales estos últimos presentan datos atipicos.
Concentración al 75% de agua de mar: En esta concentración se presentan los niveles más bajos de consumo de oxígeno y ambos tipos de moluscos presentan variabilidades similares. El molusco tipo A en este caso muestra mayor consumo de oxígeno, además de tener datos atipicos.
Concentración al 100% de agua de mar: En el tipo de molusco A se evidencia un consumo de oxígeno superior al tipo de molusco B.
En ambas gráficas la relación de consumo de oxígeno y concentración de agua no cambio para los tipos de moluscos A y B.