load("C:/Users/USUARIO/Desktop/Universidad 2021-2/BIOESTADISTICA/EVALUACIÓN/YDRAY-base.RData")
Datos=Salinidad
En una investigación se realizo un estudio entre las caracteristicas del sueño y la producción de biomasa (gr) de una planta forrajera natural, para esto se obtuvo 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa y se registraron las características del suelo en el que crecía. Caracteristicas del suelo medidas en el estudio: pH, Salinidad, Zinc y Potasio.
Teniendo en cuenta la información anterior, se quiere realizar analisis exploratorio univariado y bivariado para los resultados obtenidos.
mean(Datos$Biomasa, na.rm=TRUE)
## [1] 1082.173
median(Datos$Biomasa, na.rm=TRUE)
## [1] 991.829
sd(Datos$Biomasa, na.rm=TRUE)
## [1] 546.2874
min(Datos$Biomasa, na.rm=TRUE)
## [1] 369.823
max(Datos$Biomasa, na.rm=TRUE)
## [1] 2337.326
length(Datos$Biomasa)
## [1] 45
hist(Datos$Biomasa, main = "Histograma de la Biomasa", xlab = "Biomasa", ylab = "Frecuencia", col = "yellow")
boxplot(Datos$Biomasa, main = "Boxplot de la Biomasa", ylab = "Biomasa", col= "yellow")
DESCRIPCIÓN:
-> Para la primera variable explorada la cual fue la de BIOMASA, se obtuvo los siguientes resultados de la media, mediana, desviación estándar, el valor máximo y el valor mínimo registrados.
DATOS TOTALES RECOLECTADOS: 45
Media: 1082.173 -> Esto quiere decir que 1082 es el promedio de los datos de la biosfera obtenidos.
Mediana: 991.829 -> Esto quiere decir que 991.8 es el valor que se encuentra en la posición central al haber organizado los datos de la biosfera obtenidos.
Desviación estándar: 546.2874 -> Esto quiere decir que 546.6 indica que tan dispersos están los datos, en este caso tiene una gran disperción.
Valor mínimo: 369.823 -> Esto quiere decir que 369.823 es el valor minimo registrado en los datos de la biosfera obtenidos.
Valor máximo: 2337.326 -> Esto quiere decir que 2337.326 es el mayor valor registrado en los datos de la biosfera obtenidos.
-> Posteriormente al obtener los resultados, se quiso realizar un histograma y un gráfico de cajas, donde se puede observar que:
HISTOGRAMA: Este fue empleado para poder evidenciar la frecuencia de los resultados obtenidos de la BIOMASA y de esto se puede concluir que:
Hay una frecuencia mayor en los datos obtenidos entre 500 y 1500 gr de biomasa; es decir que, entre los 500 y 1500gr de biomasa hay una gran cantidad de los datos obtenidos que se repiten.
La menor frecuencia obtenida fue entre 1500 y 2000 gr de biomasa; es decir que, hubo muy pocos resultados obtenidos de biomasa de 1500 y 2000 gr
GRAFICO DE CAJAS: Fue empleado para mostrar grupos de datos numéricos a través de sus cuartiles, donde los resultados observados fueron que:
En la parte inferior, se evidencia el valor mínimo registrado de la biomasa, el cual fue 370gr aproximadamente.
Posteriormente, en la “caja” o rango Inter-cuartil representada de color amarillo, se encuentra la mediana, representada por la línea horizontal en negrilla, la cual nos indica que en nuestros datos tomados tenemos 992gr aproximadamente como el valor de posición central en un conjunto de los resultados de la biomasa obtenidos en la investigación.
Por último, en la parte superior, se evidencia el valor máximo registrado de la biomasa, el cual fue 2337gr.
mean(Datos$pH, na.rm=TRUE)
## [1] 4.608889
median(Datos$pH, na.rm=TRUE)
## [1] 4.45
sd(Datos$pH, na.rm=TRUE)
## [1] 1.254731
min(Datos$pH, na.rm=TRUE)
## [1] 3.2
max(Salinidad$pH, na.rm=TRUE)
## [1] 7.45
length(Salinidad$pH)
## [1] 45
hist(Salinidad$pH, main = "Histograma del pH", xlab = "pH", ylab = "Frecuencia", col = "light green")
boxplot(Salinidad$pH, main = "Boxplot del pH", ylab = "pH", col="light green")
DESCRIPCIÓN:
-> La segunda variable explorada fue el pH, donde se obtuvo los siguientes resultados de la media, mediana, desviación estándar, el valor máximo y el valor mínimo registrados.
DATOS TOTALES RECOLECTADOS: 45
Media: 4.608889 -> Esto quiere decir que 4.608889 es el promedio de los datos del pH obtenidos; el promedio da como resultado un pH ACIDO.
Mediana: 4.45 -> Esto quiere decir que 4.45 es el valor que se encuentra en la posición central a haber organizado los datos del pH obtenidos; el valor de la mediana representa un pH ACIDO.
Desviación estándar: 1.254731 -> Esto quiere decir que 1.254731 indica que tan dispersos están los datos, en este caso no tiene una gran disperción.
Valor mínimo: 3.2 -> Esto quiere decir que 3.2 es el valor minimo registrado en los datos del pH obtenidos; este dato minimo representa un pH ACIDO.
Valor máximo: 7.45 -> Esto quiere decir que 7.45 es el mayor valor registrado en los datos del pH obtenidos; esto representa que el dato maximo obtenido es de un pH NEUTRO.
-> Posteriormente al obtener los resultados, se quiso realizar un histograma y un gráfico de cajas, donde se puede observar que:
HISTOGRAMA: Este fue empleado para poder evidenciar la frecuencia de los resultados obtenidos del pH y de esto se puede concluir que:
Hay una frecuencia mayor en los valores de pH entre 3 a 3.5; es decir que, entre los datos con pH de 3 a 3.5 es donde hay una gran cantidad de los datos obtenidos que se repiten.
La menor frecuencia obtenida fue envidenciada en los valores de pH entre 3.5 a 4 y de 5.5 a 6; es decir que, hubo muy pocos resultados obtenidos con esos valores de pH.
GRAFICO DE CAJAS: Fue empleado para mostrar grupos de datos numéricos a través de sus cuartiles, donde los resultados observados fueron que:
En la parte inferior, se evidencia el valor mínimo registrado del pH, el cual fue 3.2 (pH ACIDO).
Posteriormente, en la “caja” o rango Inter-cuartil representada de color verde, se encuentra la mediana, representada por la línea horizontal en negrilla, la cual nos indica que en nuestros datos tomados tenemos un pH de 4.45 aproximadamente como el valor de posición central en un conjunto de los resultados obtenidos en la investigación.
Por último, en la parte superior, se evidencia el valor máximo registrado de pH, el cual fue 7.45 (pH NEUTRO).
mean(Salinidad$Salinidad, na.rm=TRUE)
## [1] 30.26667
median(Salinidad$Salinidad, na.rm=TRUE)
## [1] 30
sd(Salinidad$Salinidad, na.rm=TRUE)
## [1] 3.719726
min(Salinidad$Salinidad, na.rm=TRUE)
## [1] 24
max(Salinidad$Salinidad, na.rm=TRUE)
## [1] 38
length(Salinidad$Salinidad)
## [1] 45
hist(Salinidad$Salinidad, main = "Histograma de la Salinidad", xlab = "Salinidad", ylab = "Frecuencia", col = "light blue")
boxplot(Salinidad$Salinidad, main = "Boxplot de la Salinidad", ylab= "Salinidad", col ="light blue")
DESCRIPCIÓN:
-> La tercer variable explorada fue la de SALINIDAD, donde se obtuvo los siguientes resultados de la media, mediana, desviación estándar, el valor máximo y el valor mínimo registrados.
DATOS TOTALES RECOLECTADOS: 45
Media: 30.26667 -> Esto quiere decir que 30.26667 es el promedio de los datos de la salinidad obtenidos.
Mediana: 30 -> Esto quiere decir que 30 es el valor que se encuentra en la posición central al haber organizado los datos de la salinidad obtenidos.
Desviación estándar: 3.719726 -> Esto quiere decir que 3.719726 indica que tan dispersos están los datos, en este caso no se evidencia una gran disperción.
Valor mínimo: 24 -> Esto quiere decir que 24 es el valor minimo registrado en los datos de la salinidad obtenidos.
Valor máximo: 38 -> Esto quiere decir que 2337.326 es el mayor valor registrado en los datos de la salinidad obtenidos.
-> Posteriormente al obtener los resultados, se quiso realizar un histograma y un gráfico de cajas, donde se puede observar que:
HISTOGRAMA: Este fue empleado para poder evidenciar la frecuencia de los resultados obtenidos de la SALINIDAD y de esto se puede concluir que:
Hay una frecuencia mayor en los datos obtenidos entre 28 a 30 de salinidad; es decir que, entre los 28 a 30 de salinidad hay una gran cantidad de los datos obtenidos que se repiten.
La menor frecuencia obtenida fue entre 36 y 38 de salinidad; es decir que, hubo muy pocos resultados obtenidos de salinidad de 36 a 38.
GRAFICO DE CAJAS: Fue empleado para mostrar grupos de datos numéricos a través de sus cuartiles, donde los resultados observados fueron que:
En la parte inferior, se evidencia el valor mínimo registrado de la salinidad, el cual fue 24 aproximadamente.
Posteriormente, en la “caja” o rango Inter-cuartil representada de color azul, se encuentra la mediana, representada por la línea horizontal en negrilla, la cual nos indica que en nuestros datos tomados tenemos 30 como el valor de posición central en un conjunto de los resultados de la salinidad obtenidos en la investigación.
Por último, en la parte superior, se evidencia el valor máximo registrado de la salinad, el cual fue 38.
mean(Salinidad$Zinc, na.rm=TRUE)
## [1] 17.8308
median(Salinidad$Zinc, na.rm=TRUE)
## [1] 19.242
sd(Salinidad$Zinc, na.rm=TRUE)
## [1] 8.274169
min(Salinidad$Zinc, na.rm=TRUE)
## [1] 0.2105
max(Salinidad$Zinc, na.rm=TRUE)
## [1] 31.2865
length(Salinidad$Zinc)
## [1] 45
hist(Salinidad$Zinc, main = "Histograma del Zinc", xlab = "Zinc", ylab = "Frecuencia", col = "light pink")
boxplot(Salinidad$Zinc, main = "Boxplot del Zinc", ylab="Zinc", col="light pink")
DESCRIPCIÓN:
-> La tercer variable explorada fue la de ZINC, donde se obtuvo los siguientes resultados de la media, mediana, desviación estándar, el valor máximo y el valor mínimo registrados.
DATOS TOTALES RECOLECTADOS: 45
Media: 17.8308 -> Esto quiere decir que 17.8308 es el promedio de los datos del zinc obtenidos.
Mediana: 19.242 -> Esto quiere decir que 19.242 es el valor que se encuentra en la posición central al haber organizado los datos del zinc obtenidos.
Desviación estándar: 8.274169 -> Esto quiere decir que 8.274169 indica que tan dispersos están los datos, en este se evidencia una disperción entre ellos.
Valor mínimo: 0.2105 -> Esto quiere decir que 0.2105 es el valor minimo registrado en los datos del zinc obtenidos.
Valor máximo: 31.2865 -> Esto quiere decir que 31.2865 es el mayor valor registrado en los datos del zinc obtenidos.
-> Posteriormente al obtener los resultados, se quiso realizar un histograma y un gráfico de cajas, donde se puede observar que:
HISTOGRAMA: Este fue empleado para poder evidenciar la frecuencia de los resultados obtenidos del ZINC y de esto se puede concluir que:
Hay una frecuencia mayor en los datos obtenidos de zinc entre 15 a 25; es decir que, hay una gran cantidad de datos obtenidos que se repiten del zinc entre 15 a 25.
La menor frecuencia obtenida fue entre los valores de zinc de 5 a 10; es decir que, hubo muy pocos resultados obtenidos de zinc que fueran entre 5 y 10.
GRAFICO DE CAJAS: Fue empleado para mostrar grupos de datos numéricos a través de sus cuartiles, donde los resultados observados fueron que:
En la parte inferior, se evidencia el valor atípico (representado por el punto) registrado del zinc, el cual fue 0.2105. Este es un valor atípico, ya que es numéricamene distante al resto de los varoles presentados en los resultados obtenidos del zinc.
Posteriormente, en la “caja” o rango Inter-cuartil representada de color rosado, se encuentra la mediana, representada por la línea horizontal en negrilla, la cual nos indica que en nuestros datos tomados tenemos 19.242 como el valor de posición central en un conjunto de los resultados del zinc obtenidos en la investigación.
Por último, en la parte superior, se evidencia el valor máximo registrado del zinc, el cual fue 31.2865.
mean(Datos$Potasio, na.rm=TRUE)
## [1] 797.3778
median(Datos$Potasio, na.rm=TRUE)
## [1] 773.3
sd(Datos$Potasio, na.rm=TRUE)
## [1] 297.576
min(Datos$Potasio, na.rm=TRUE)
## [1] 350.73
max(Datos$Potasio, na.rm=TRUE)
## [1] 1441.67
length(Datos$Potasio)
## [1] 45
hist(Datos$Potasio, main = "Histograma del Potasio", xlab = "Potasio", ylab = "Frecuencia", col = "orchid")
boxplot(Datos$Potasio, main = "Boxplot del Potasio",ylab = "Potasio", col="orchid")
DESCRIPCIÓN:
-> La última variable explorada fue la de POTASIO, donde se obtuvo los siguientes resultados de la media, mediana, desviación estándar, el valor máximo y el valor mínimo registrados.
DATOS TOTALES RECOLECTADOS: 45
Media: 797.3778 -> Esto quiere decir que 797.3778 es el promedio de los datos del potasio obtenidos.
Mediana: 773.3 -> Esto quiere decir que 773.3 es el valor que se encuentra en la posición central al haber organizado los datos del potasio obtenidos.
Desviación estándar: 297.576 -> Esto quiere decir que 297.576 indica que tan dispersos están los datos, en este se evidencia una gran disperción entre ellos.
Valor mínimo: 350.73 -> Esto quiere decir que 350.73 es el valor minimo registrado en los datos del potasio obtenidos.
Valor máximo: 1441.67 -> Esto quiere decir que 1441.67 es el mayor valor registrado en los datos del potasio obtenidos.
-> Posteriormente al obtener los resultados, se quiso realizar un histograma y un gráfico de cajas, donde se puede observar que:
HISTOGRAMA: Este fue empleado para poder evidenciar la frecuencia de los resultados obtenidos del POTASIO y de esto se puede concluir que:
Hay una frecuencia mayor en los datos obtenidos de potasio entre 400 a 600; es decir que, hay una gran cantidad de datos obtenidos que se repiten del potasio entre 400 a 600.
La menor frecuencia obtenida fue entre los valores de potasio de 200 a 400 y de 1400 a 1600; es decir que, hubo muy pocos resultados obtenidos de potasio que fueran entre esos valores.
GRAFICO DE CAJAS: Fue empleado para mostrar grupos de datos numéricos a través de sus cuartiles, donde los resultados observados fueron que:
En la parte inferior, se evidencia el valor minimo registrado del potasio, el cual fue 350.73
Posteriormente, en la “caja” o rango Inter-cuartil representada de color morado, se encuentra la mediana, representada por la línea horizontal en negrilla, la cual nos indica que en nuestros datos tomados tenemos 773.3 como el valor de posición central en un conjunto de los resultados del potasio obtenidos en la investigación.
Por último, en la parte superior, se evidencia el valor máximo registrado del potasio, el cual fue 1441.67
require(ggplot2)
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.0.5
data(Datos)
## Warning in data(Datos): data set 'Datos' not found
ggplot(data = Datos,aes(y=Biomasa,x=pH,))+geom_point()+theme_bw()+xlab("pH")+ylab("Biomasa")+geom_smooth(color = 'blue')+ ggtitle("Relacion Biomasa y pH ")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
DESCRIPCIÓN:
-> Se realizo un diagrama de puntos para poder correlacionar las variables de BIOMASA y pH obtenidos en los resultados de la investigación.
Observando la gráfica, se puede evidenciar la relación entre ellas debido a la dispersión con tendencia positiva y proporcional de los puntos, esto se evidencia en la “línea azul” y el intervalo de confianza del ajuste el cual esta reducido (representado de color gris)
Con esto observado, podríamos concluir que la característica pH presenta una correlación positiva con la biomasa, por lo tanto, se puede decir que mayor nivel de pH se va a presentar una mayor cantidad de biomasa en la planta.
ggplot(data = Datos,aes(y=Biomasa,x=Salinidad,))+geom_point()+theme_bw()+xlab("Salinidad")+ylab("Biomasa")+geom_smooth(color = 'blue')+ ggtitle("Relacion Biomasa y Salinidad ")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
DESCRIPCIÓN:
-> Se realizo un diagrama de puntos para poder correlacionar las variables de BIOMASA y SALINIDAD obtenidos en los resultados de la investigación.
Observando la gráfica, se puede evidenciar que no se presenta ninguna relación entre ellas, esto se puede pensar, ya que hay una dispersión dispareja y sin una tendencia de los puntos (observado por la línea azul), además, la gráfica muestra un gran intervalo de confianza del ajuste (representado de color gris
ggplot(data = Salinidad,aes(y=Biomasa,x=Zinc,))+geom_point()+theme_bw()+xlab("Zinc")+ylab("Biomasa")+geom_smooth(color = 'blue')+ ggtitle("Relacion Biomasa y Zinc ")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
DESCRIPCIÓN:
-> Se realizo un diagrama de puntos para poder correlacionar las variables de BIOMASA y ZINC obtenidos en los resultados de la investigación.
Observando la gráfica, se puede evidenciar la relación entre ellas debido a la dispersión con tendencia negativa, esto se evidencia en la “línea azul” y el intervalo de confianza del ajuste el cual esta reducido. (representado de color gris)
Con esto observado, podríamos concluir que la variable de Zinc tiene una correlación, pero es negativa, ya que se muestra que entre menos concentración de zinc se presente en el suelo más repuesta de la biomasa se va a presentar.
ggplot(data = Salinidad,aes(y=Biomasa,x=Potasio,))+geom_point()+theme_bw()+xlab("Potasio")+ylab("Biomasa")+geom_smooth(color = 'blue')+ ggtitle("Relacion Biomasa y Potasio")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
DESCRIPCIÓN:
-> Se realizo un diagrama de puntos para poder correlacionar las variables de BIOMASA y POTASIO obtenidos en los resultados de la investigación.
Observando la gráfica, se puede evidenciar que no se presenta ninguna relación entre ellas, esto se puede pensar, ya que hay una dispersión dispareja y sin una tendencia de los puntos (observado por la línea azul), además, la gráfica muestra un gran intervalo de confianza del ajuste (representado de color gris
load("C:/Users/USUARIO/Desktop/Universidad 2021-2/BIOESTADISTICA/EVALUACIÓN/YDRAY-moluscos.RData")
En una investigación se realizó un estudio donde dos tipos de moluscos A y B fueron sometidos a tres concentraciones distintas de agua de mar (100%, 75% y 50%) y también se observó el consumo de oxígeno midiendo la proporción de O2 por unidad de peso seco del molusco.
Teniendo en cuenta la información anterior, se quiere realizar analisis exploratorio univariado y bivariado para los resultados obtenidos.
#vARIABLE MOLUSCO (CUALITATIVA)
summary(BD_moluscos$molusco)
## Length Class Mode
## 48 character character
labs=c("A","B");
pct=round(table(BD_moluscos$molusco)/sum(table(BD_moluscos$molusco))*100);
labs=paste(labs, pct);labs=paste(labs, "%", sep = " ")
pie(table(BD_moluscos$molusco), xlab= "Tipo de moluscos: A y B",labels=labs, main="Diagrama de torta de los moluscos")
DESCRIPCIÓN:
DATOS TOTALES RECOLECTADOS: 45
mean(BD_moluscos$c_agua, na.rm=TRUE)
## [1] 75
median(BD_moluscos$c_agua, na.rm=TRUE)
## [1] 75
sd(BD_moluscos$c_agua, na.rm=TRUE)
## [1] 20.62842
min(BD_moluscos$c_agua, na.rm=TRUE)
## [1] 50
max(BD_moluscos$c_agua, na.rm=TRUE)
## [1] 100
length(BD_moluscos$c_agua)
## [1] 48
hist(BD_moluscos$c_agua, main = "Histograma de la concentración del agua", xlab = "Concentración del agua", ylab = "Frecuencia", col = "purple")
DESCRIPCIÓN:
-> La variable explorada fue la de CONCENTRACIÓN DEL AGUA DE MAR, donde se obtuvo los siguientes resultados de la media, mediana, desviación estándar, el valor máximo y el valor mínimo registrados.
DATOS TOTALES RECOLECTADOS: 48
Media: 75 -> Esto quiere decir que 75 es el promedio de los datos de la CONCENTRACIÓN DEL AGUA DE MAR obtenidos.
Mediana: 75 -> Esto quiere decir que 75 es el valor que se encuentra en la posición central al haber organizado los datos de la CONCENTRACIÓN DEL AGUA DE MAR obtenidos.
Desviación estándar: 20.62842 -> Esto quiere decir que 20.62842 indica que tan dispersos están los datos, en este se evidencia una disperción entre ellos.
Valor mínimo: 50 -> Esto quiere decir que 50 es el valor minimo registrado en los datos de la CONCENTRACIÓN DEL AGUA DE MAR obtenidos.
Valor máximo: 100 -> Esto quiere decir que 100 es el mayor valor registrado en los datos de la CONCENTRACIÓN DEL AGUA DE MAR.
-> Posteriormente al obtener los resultados, se quiso realizar un histograma, donde se puede observar que:
HISTOGRAMA: Este fue empleado para poder evidenciar la frecuencia de los resultados obtenidos de la CONCENTRACIÓN DEL AGUA DE MAR y de esto se puede concluir que:
mean(BD_moluscos$cons_o, na.rm=TRUE)
## [1] 9.304792
median(BD_moluscos$cons_o, na.rm=TRUE)
## [1] 9.7
sd(BD_moluscos$cons_o, na.rm=TRUE)
## [1] 3.682652
min(BD_moluscos$cons_o, na.rm=TRUE)
## [1] 1.8
max(BD_moluscos$cons_o, na.rm=TRUE)
## [1] 18.8
length(BD_moluscos$cons_o)
## [1] 48
hist(BD_moluscos$cons_o, main = "Histograma del consumo de oxigeno", xlab = "Consumo de Oxigeno", ylab = "Frecuencia", col = "gold")
boxplot(BD_moluscos$cons_o, main = "Boxplot del consumo de oxigeno", ylab = "Consumo de Oxigeno",col="gold")
DESCRIPCIÓN:
-> La variable explorada fue la de CONSUMO DEL OXIGENO, donde se obtuvo los siguientes resultados de la media, mediana, desviación estándar, el valor máximo y el valor mínimo registrados.
DATOS TOTALES RECOLECTADOS: 48
Media: 9.304792 -> Esto quiere decir que 9.304792 es el promedio de los datos del consumo de oxigeno obtenidos.
Mediana: 9.7 -> Esto quiere decir que 9.7 es el valor que se encuentra en la posición central al haber organizado los datos del consumo de oxigeno obtenidos.
Desviación estándar: 3.682652 -> Esto quiere decir que 3.682652 indica que tan dispersos están los datos, en este se evidencia una pequeña disperción entre ellos.
Valor mínimo: 1.8 -> Esto quiere decir que 1.8 es el valor minimo registrado en los datos del consumo de oxigeno obtenidos.
Valor máximo: 18.8 -> Esto quiere decir que 18.8 es el mayor valor registrado en los datos del consumo de oxigeno obtenidos.
-> Posteriormente al obtener los resultados, se quiso realizar un histograma y un gráfico de cajas, donde se puede observar que:
HISTOGRAMA: Este fue empleado para poder evidenciar la frecuencia de los resultados obtenidos del CONSUMO DEL OXIGENO y de esto se puede concluir que:
Hay una frecuencia mayor en los datos obtenidos de consumo de oxigeno entre 5 a 15; es decir que, hay una gran cantidad de datos obtenidos que se repiten del consumo de oxigeno entre 5 a 15.
La menor frecuencia obtenida fue entre los valores del consumo de oxigeno de 0 a 5 y de 15 a 20; es decir que, hubo muy pocos resultados obtenidos de consumo de oxigeno que fueran entre esos valores.
GRAFICO DE CAJAS: Fue empleado para mostrar grupos de datos numéricos a través de sus cuartiles, donde los resultados observados fueron que:
En la parte inferior, se evidencia el valor minimo registrado del consumo de oxigeno, el cual fue 1.8
Posteriormente, en la “caja” o rango Inter-cuartil representada de color amarillo, se encuentra la mediana, representada por la línea horizontal en negrilla, la cual nos indica que en nuestros datos tomados tenemos 9.7 como el valor de posición central en un conjunto de los resultados del consumo de oxigeno obtenidos en la investigación.
Por último, en la parte superior, se evidencia el valor máximo registrado del cpnsumo de oxigeno, el cual fue 18.8
tapply(BD_moluscos$c_agua, BD_moluscos$molusco, mean,na.rm=TRUE)
## A B
## 75 75
boxplot(BD_moluscos$c_agua ~ BD_moluscos$molusco, main = "Boxplot - Concentración de agua de los moluscos A y B", xlab= "Tipos de moluscos",ylab = "Concentración de agua" , col="light blue")
DESCRIPCIÓN:
tapply(BD_moluscos$cons_o, BD_moluscos$molusco, mean,na.rm=TRUE)
## A B
## 10.000417 8.609167
boxplot(BD_moluscos$cons_o~ BD_moluscos$molusco, main = "Boxplot - Consumo de oxigeno de los moluscos A y B", xlab= "Tipos de moluscos",ylab = "Consumo de oxigeno", col="brown")
DESRIPCIÓN:
Se quiso realizar un diagrama de cajas, donde se pueda evidenciar la correlación entre los tipos de moluscos (A y B) con el CONSUMO DE OXIGENO, por lo tanto, al observar el fiagrama podemos concluir que los moluscos del tipo A van a consumir más oxigeno que los moluscos de tipo B, esto lo podemos observar gracias a la diferencia que se observa en el rango que presentan estos en el diagrama.
Algo que también podemos observar en el diagrama, es que a los moluscos de tipo A se les pudo registrar que el consumo de oxígeno no era tan dispersos, es decir, su valor mínimo fue de 5 aproximadamente y e valor máximo fue de 14 aproximadamente (y un dato atípico de 20 aproximadamente), cosa que no ocurre con los moluscos de tipo B, ya que estos tienen el menor valor en 1 aproximadamente y el dato mayor en 18 aproximadamente, así que este presenta una mayor dispersión