Pontificia Universidad Javeriana Cali Facultad de Ingeniería y Ciencias Programa de Matemáticas Aplicadas Asignatura Bioestadística PARCIAL 1 Punto 1 – Datos Salinidad Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (gr) de una planta forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa (respuesta Y) y se registraron las características (covariables X) del suelo en el que crecía (pH, Salinidad, Zinc y Potasio).
load("C:/Users/Juan David Betancour/Downloads/YDRAY-Salinidad.RData")
#Data frame (Salinidad)
sum(Salinidad$Biomasa)
## [1] 48697.77
mean(Salinidad$Biomasa)
## [1] 1082.173
sd(Salinidad$Biomasa)
## [1] 546.2874
min(Salinidad$Biomasa)
## [1] 369.823
median(Salinidad$Biomasa)
## [1] 991.829
max(Salinidad$Biomasa)
## [1] 2337.326
sum(Salinidad$pH)
## [1] 207.4
mean(Salinidad$pH)
## [1] 4.608889
sd(Salinidad$pH)
## [1] 1.254731
min(Salinidad$pH)
## [1] 3.2
median(Salinidad$pH)
## [1] 4.45
max(Salinidad$pH)
## [1] 7.45
sum(Salinidad$Salinidad)
## [1] 1362
mean(Salinidad$Salinidad)
## [1] 30.26667
sd(Salinidad$Salinidad)
## [1] 3.719726
min(Salinidad$Salinidad)
## [1] 24
median(Salinidad$Salinidad)
## [1] 30
max(Salinidad$Salinidad)
## [1] 38
sum(Salinidad$zinc)
## [1] 0
sd(Salinidad$zinc)
## [1] NA
median(Salinidad$zinc)
## NULL
sum(Salinidad$potasio)
## [1] 0
mean(Salinidad$potasio)
## Warning in mean.default(Salinidad$potasio): argument is not numeric or logical:
## returning NA
## [1] NA
sd(Salinidad$potasio)
## [1] NA
min(Salinidad$potasio)
## Warning in min(Salinidad$potasio): ningún argumento finito para min; retornando
## Inf
## [1] Inf
median(Salinidad$potasio)
## NULL
max(Salinidad$potasio)
## Warning in max(Salinidad$potasio): ningun argumento finito para max; retornando
## -Inf
## [1] -Inf
hist(Salinidad$Biomasa, col="yellow", main="Histograma de la Biomasa", xlab ="Biomasa", ylab="Frecuencia" , xlim=c(369.823, 2337.326
), ylim=c(0, 10),breaks=15)
hist(Salinidad$Salinidad, col="red", main="Histograma de la Salinidad ")
hist(Salinidad$Zinc, col="green", main="Histograma del Zinc ")
hist(Salinidad$Potasio, col="Purple", main="Histograma del Potasio ", xlim=c(350.73, 1441.67), ylim=c(0, 20))
Es difícil realizar una correcta interpretación sin tener las unidades de medida pero si ignoramos eso tenemos que: En cuanto a la biomasa, su valor máximo es de 2337.326 y su mínimo es de 369.823 con un promedio de 1082.173. El pH mínimo es de 3.20 y el máximo es de 7.45 con un promedio de 4.608889 por lo que se puede decir que estas plantas crecieron en ambientes ácidos en términos generales. La salinidad mínima es de 24 y la máxima de 38 con un promedio de 30.26667. La unidadd de zinc mínima es de 30.26667 mientras que la máxima es de 31.2865. El valor máximo de potasio es de 1441.67 y el mínimo es de 350.73. (Por motivos que desconozco los valores del zinc y el potasio no fueron arrojados usando los métodos con los que se obtuvieron los demás valores)
require(ggplot2)
## Loading required package: ggplot2
ggplot(data=Salinidad, aes(y=Biomasa, x=Zinc))+geom_point()+theme_bw()+xlab("Zinc")+ylab("Biomasa")+geom_smooth()
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
ggplot(data=Salinidad, aes(y=Biomasa, x=Potasio, colour=pH))+geom_point()+theme_bw()+xlab("Potasio")+ylab("Biomasa")+geom_smooth()
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
require(ggplot2)
data(Salinidad)
## Warning in data(Salinidad): data set 'Salinidad' not found
ggplot(data = Salinidad,aes(y=Biomasa,x=pH,))+geom_point()+theme_bw()+xlab("pH")+ylab("Biomasa")+geom_smooth()
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
ggplot(data = Salinidad,aes(y=Biomasa,x=Salinidad,))+geom_point()+theme_bw()+xlab("Salinidad")+ylab("Biomasa")+geom_smooth()
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
Los niveles de Zinc y el pH presentan una mayor relación con la Biomasa interactuando con un decrecimiento no constante y un crecimiento constante respectivamente.
Punto 2 – Datos Moluscos Dos tipos de moluscos A y B fueron sometidos a tres concentraciones distintas de agua de mar (100%, 75% y 50%) y se observó el consumo de oxígeno midiendo la proporción de O2 por unidad de peso seco del molusco. a. Realice un análisis exploratorio univariado para cada característica e interpretar
load("C:/Users/Juan David Betancour/Downloads/YDRAY-moluscos.RData")
sum(BD_moluscos$c_agua)
## [1] 3600
mean(BD_moluscos$c_agua)
## [1] 75
sd(BD_moluscos$c_agua)
## [1] 20.62842
min(BD_moluscos$c_agua)
## [1] 50
median(BD_moluscos$c_agua)
## [1] 75
max(BD_moluscos$c_agua)
## [1] 100
min(BD_moluscos$molusco)
## [1] "A"
max(BD_moluscos$molusco)
## [1] "B"
sum(BD_moluscos$cons_o)
## [1] 446.63
mean(BD_moluscos$cons_o)
## [1] 9.304792
sd(BD_moluscos$cons_o)
## [1] 3.682652
min(BD_moluscos$cons_o)
## [1] 1.8
median(BD_moluscos$cons_o)
## [1] 9.7
max(BD_moluscos$cons_o)
## [1] 18.8
hist(BD_moluscos$cons_o, xlab ="Consumo de oxígeno", ylab="Frecuencia" , xlim=c(1.80, 18.80), ylim=c(0, 15),breaks=15, col="orange", main="Histograma de consumo de oxígeno")
boxplot(BD_moluscos$cons_o, col="green", main="Boxplot de consumo de oxígeno")
hist(BD_moluscos$c_agua, col="yellow", main="Histograma del Consumo de agua", xlab ="Concentración de agua de mar", ylab="Frecuencia" , xlim=c(50, 100), ylim=c(0, 49),breaks=15)
En tres diferentes concentraciones de agua de mar se colocaron los moluscos, las concentraciones eran 50, 75 y 100. Se usaron dos especies de moluscos no especificadas, simplemente llamadas A y B. La variable a considerar con estos moluscos en diferentes concentraciones de agua de mar fue el consumo de oxígeno, El consumo máximo de oxígeno fue de 18.80 por la especie A en una concentración de agua de mar de 50, el mínimo fue de 1.80 por la especie B en una concentración de agua de mar de 75.
require(ggplot2)
ggplot(data=BD_moluscos, aes(y=cons_o, x=c_agua))+geom_point()+theme_bw()+xlab("Concentración de agua de mar")+ylab("Consumo de oxígeno")+geom_smooth()
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric =
## parametric, : pseudoinverse used at 49.75
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric =
## parametric, : neighborhood radius 50.25
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric =
## parametric, : reciprocal condition number 9.1868e-017
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric =
## parametric, : There are other near singularities as well. 2525.1
## Warning in predLoess(object$y, object$x, newx = if
## (is.null(newdata)) object$x else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : pseudoinverse used at
## 49.75
## Warning in predLoess(object$y, object$x, newx = if
## (is.null(newdata)) object$x else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : neighborhood radius
## 50.25
## Warning in predLoess(object$y, object$x, newx = if
## (is.null(newdata)) object$x else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : reciprocal condition
## number 9.1868e-017
## Warning in predLoess(object$y, object$x, newx = if
## (is.null(newdata)) object$x else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : There are other near
## singularities as well. 2525.1
hist(BD_moluscos$c_agua, col="yellow", main="Histograma del Consumo de agua")
En la concentración de 50 el consumo de oxígeno es mayor para ambas especies mientras que el menor consumo se dió en la concentración de 75.
##Nota: Se recomienda realizar gráficos usando la librería ggplot y complementarlos con ##indicadores para las interpretaciones