Fábrica de Chocolates
Este estudio se enfoca en determinar si el proceso de fabricación de barras de chocolate cumple con los estándares de peso establecidos por la fábrica. Se busca demostrar si existe una diferencia mayor a 1.5 gramos en el peso habitual de las barras y si la variabilidad en el peso es aceptable. Esto se logra mediante el análisis de una muestra aleatoria de barras de chocolate y su comparación con los criterios de calidad predefinidos.
# Cargar el paquete para leer archivos Excel
library(readxl)
# Cargar los datos desde el archivo Excel
datos <- read_excel("Situación 1.xlsx")
# Visualizar los primeros registros de los datos
head(datos)
## # A tibble: 6 × 3
## `Peso Pre` Densidad `Peso post`
## <chr> <dbl> <dbl>
## 1 29.61 1.97 30.7
## 2 27.99 1.9 29.7
## 3 30.17 2.03 29.0
## 4 30.97 2.06 30.2
## 5 28.93 1.94 30.3
## 6 27.27 1.86 29.6
\[ \left\{ \begin{array}{ll} H_0: & diferencia=media-nominal <= 1.5\\ H_1: & diferencia=media-nominal > 1.5 \end{array} \right. \]
Hipótesis nula (H0): El proceso de fabricación de barras de chocolate estable si la diferencia entre la media del peso y el peso nominal es mayor a 1.5 gramos.
Hipótesis alternativa (H1): El proceso de fabricación de barras de chocolate estable si la diferencia entre la media del peso y el peso nominal es menor o igual a 1.5 gramos.
binom.test(30,50,0.15, alternative ="less" , conf.level = 0.95)
##
## Exact binomial test
##
## data: 30 and 50
## number of successes = 30, number of trials = 50, p-value = 1
## alternative hypothesis: true probability of success is less than 0.15
## 95 percent confidence interval:
## 0.0000000 0.7168694
## sample estimates:
## probability of success
## 0.6
Definiendo estas dos hipotesis se espera:
Rechazar la hipótesis nula.Puesto que hay suficiente evidencia en los datos para concluir que el proceso de fabricación no cumple con los estándares de peso establecidos. En el contexto del problema que estamos abordando. La hipótesis nula afirmaría que la diferencia entre la media del peso de las barras de chocolate y el peso nominal establecido por la fábrica es igual o menor a 1.5 gramos. Sin embargo, si los datos muestran una diferencia mayor a 1.5 gramos, esto indicaría que el proceso de fabricación no está produciendo barras de chocolate dentro de los estándares de peso establecidos. Por lo tanto, se rechaza la hipótesis nula en favor de la hipótesis 1, que sugiere que existe una diferencia mayor a 1.5 gramos en el peso habitual de las barras de chocolate.
Los Indicadores apropiados para diagnosticar la hipótesis de la fábrica de chocolate son los de tendencia central, como: la media aritmética, la moda y la mediana, puesto que estos ayudan a identificar y describir el comportamiento de los datos de manera simplificada.
# Indicadores de resumen estadístico de los datos para diagnosticar hipotesis
summary(datos)
## Peso Pre Densidad Peso post
## Length:50 Min. :1.830 Min. :28.94
## Class :character 1st Qu.:1.893 1st Qu.:29.61
## Mode :character Median :1.930 Median :29.93
## Mean :1.929 Mean :29.96
## 3rd Qu.:1.960 3rd Qu.:30.28
## Max. :2.060 Max. :31.18
## NA's :10
Teniendo en cuenta la siguiente imagen se llego a la conclusion
El análisis de los datos de densidad de la mezcla de chocolate junto con el peso de las barras permite explorar su posible relación. Si encontramos una correlación, sugiere que las variaciones en la densidad podrían influir en el peso de las barras. Al correlacionar estos datos, podemos identificar patrones. Por ejemplo, una baja densidad podría implicar una disminución en el peso de las barras. Con esta información, se pueden ajustar procesos para mantener una densidad más consistente, lo que podría reducir la variabilidad en el peso de las barras. En conclusión, al considerar estos datos, podemos abordar las causas subyacentes de la variabilidad en el peso de las barras de chocolate, contribuyendo a mejorar la calidad del producto. Es esencial tener información precisa sobre la densidad, ya que afecta directamente el peso de la barra de chocolate.
Interpretacion de datos
Esta gráfica muestra claramente que, previo a la intervención, había un problema evidente con la variabilidad en el peso de los chocolates, el cual se encontraba fuera del rango deseado. Específicamente, alrededor del 40% de los chocolates tenían un peso inferior a 28,5 gramos.
En el gráfico, se contrasta el peso de las barras de chocolate con su densidad antes de la estandarización. Se aprecia una relación lineal directa, con puntos que tienden a desplazarse en direcciones opuestas, de arriba hacia abajo. Este patrón sugiere una falta de uniformidad en los productos, donde algunas barras podrían ser más densas y/o pesadas que otras.
La gráfica ilustra el impacto de la intervención y la normalización de la densidad en la mezcla de chocolate. En ella, se contrasta el peso de las barras de chocolate con su frecuencia de ocurrencia. Además, se muestra el rango del peso nominal, que varía entre 28.5g y 31.5g, evidenciando que todas las barras de chocolate se encuentran dentro de este rango, lo que confirma que cumplen con el peso nominal establecido.
El gráfico muestra dos conjuntos de datos distintos. El primero está relacionado con un estudio que examina el peso de 50 barras de chocolate antes de un proceso de estandarización de la densidad de la mezcla utilizada en su fabricación, mientras que el segundo conjunto de datos refleja un estudio similar, pero después de este proceso de estandarización.
Las líneas de color rojo punteadas en el gráfico representan el peso nominal máximo (31.5 gramos) y mínimo (28.5 gramos) establecido por la fábrica. Es evidente que el conjunto de datos “Peso Pre” está claramente por encima del rango mencionado, mientras que el conjunto “Peso Post” se encuentra dentro de este rango.
En resumen, se observa que antes de la estandarización de la densidad, el peso de las barras de chocolate excede los límites establecidos, mientras que después de este proceso, el peso se ajusta dentro de estos límites.
La tabla ofrece un análisis comparativo utilizando indicadores de resumen para los estudios previos y posteriores a la estandarización de la densidad. Se evidencia que, antes de la estandarización, el promedio del peso se situaba por debajo del peso nominal, mientras que después se encuentra dentro de los límites establecidos. En cuanto a la desviación estándar, se observa una mayor variabilidad antes de la intervención, reflejada en un coeficiente de variación más alto. Destaca una diferencia significativa en el porcentaje de LEI (Límite de Especificación Inferior), puesto que previo a la intervención, las barras de chocolate a menudo caían por debajo del peso nominal.
Se tienen los siguientes datos que se encuentran en el archivo en Excel denominado Situación 2, corresponde a la toma de datos por 30 semanas los 7 días a la semana de la demanda en toneladas de un producto, a partir de los datos y realizando un análisis exploratorio exhaustivo de los datos.
######### ----------- LECTURA DE LA DATA ---------- ############
b2=read_excel("Situación 2.xlsx", sheet = "data")
attach(b2)
| Nombre variable | Descripcion |
|---|---|
| semana | # semanas |
| Dias | Nombre dias de la semana |
hist (Lunes,main = "Lunes",
xlab = "Demanda",
ylab = "Frecuencia")
var(Lunes) # Varinza de los datos Lunes
## [1] 1.413518
sd(Lunes) # Desviacion estandar
## [1] 1.188915
promLunes = mean(Lunes); promLunes # Promedio
## [1] 9.611667
cv = sd(Lunes)/promLunes; cv # Coeficiente de variacion
## [1] 0.1236949
q = quantile(Lunes) # Calculando los indicadores de posición
quantile(Lunes, prob=seq(0, 1, length = 11))
## 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
## 7.620 8.180 8.540 9.150 9.294 9.665 9.776 10.097 10.380 10.747 12.590
q35<-quantile(Lunes, prob=c(0.35)) # Calculando el percentil 35
q35
## 35%
## 9.219
q80=quantile(Lunes, prob=c(0.80)) # Percentil - Decil 80
boxplot(Lunes, horizontal = TRUE)
abline(v=c(q35),col="red", lty=c(2),lwd=c(1)) # Agrega línea del percentil 35
# Resumen estadístico de los datos dia Lunes
summary(Lunes)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 7.620 8.738 9.665 9.612 10.338 12.590
hist (Martes,main = "Martes",
xlab = "Demanda",
ylab = "Frecuencia")
var(Martes) # Varinza de los datos Martes
## [1] 1.311942
sd(Martes) # Desviacion estandar
## [1] 1.1454
promMartes = mean(Martes); promMartes # Promedio
## [1] 9.924
cv = sd(Martes)/promMartes; cv # Coeficiente de variacion
## [1] 0.1154172
q = quantile(Martes) # Calculando los indicadores de posición
quantile(Martes, prob=seq(0, 1, length = 11))
## 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
## 7.810 8.577 8.726 9.189 9.586 9.785 10.354 10.552 10.914 11.359 12.190
q35<-quantile(Martes, prob=c(0.35)) # Calculando el percentil 35
q35
## 35%
## 9.3625
q80=quantile(Martes, prob=c(0.80)) # Percentil - Decil 80
boxplot(Martes, horizontal = TRUE)
abline(v=c(q35),col="red", lty=c(2),lwd=c(1)) # Agrega línea del percentil 35
# Resumen estadístico de los datos dia Martes
summary(Martes)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 7.810 8.910 9.785 9.924 10.602 12.190
hist (Miercoles,main = "Miercoles",
xlab = "Demanda",
ylab = "Frecuencia")
var(Miercoles) # Varinza de los datos Miercoles
## [1] 1.297369
sd(Miercoles) # Desviacion estandar
## [1] 1.139021
promMiercoles = mean(Miercoles); promMiercoles # Promedio
## [1] 11.20367
cv = sd(Miercoles)/promMiercoles; cv # Coeficiente de variacion
## [1] 0.101665
q = quantile(Miercoles) # Calculando los indicadores de posición
quantile(Miercoles, prob=seq(0, 1, length = 11))
## 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
## 8.870 9.776 10.294 10.556 10.682 11.225 11.700 11.843 12.274 12.636 13.130
q35<-quantile(Miercoles, prob=c(0.35)) # Calculando el percentil 35
q35
## 35%
## 10.653
q80=quantile(Miercoles, prob=c(0.80)) # Percentil - Decil 80
boxplot(Miercoles, horizontal = TRUE)
abline(v=c(q35),col="red", lty=c(2),lwd=c(1)) # Agrega línea del percentil 35
# Resumen estadístico de los datos dia Miercoles
summary(Miercoles)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 8.87 10.42 11.22 11.20 12.10 13.13
hist (Jueves,main = "Jueves",
xlab = "Demanda",
ylab = "Frecuencia")
var(Jueves) # Varinza de los datos Jueves
## [1] 1.222613
sd(Jueves) # Desviacion estandar
## [1] 1.105718
promJueves = mean(Jueves); promJueves # Promedio
## [1] 11.16267
cv = sd(Jueves)/promJueves; cv # Coeficiente de variacion
## [1] 0.09905505
q = quantile(Jueves) # Calculando los indicadores de posición
quantile(Jueves, prob=seq(0, 1, length = 11))
## 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
## 9.040 10.089 10.484 10.630 10.740 10.965 11.234 11.420 11.952 12.816 13.680
q35<-quantile(Jueves, prob=c(0.35)) # Calculando el percentil 35
q35
## 35%
## 10.693
q80=quantile(Jueves, prob=c(0.80)) # Percentil - Decil 80
boxplot(Jueves, horizontal = TRUE)
abline(v=c(q35),col="red", lty=c(2),lwd=c(1)) # Agrega línea del percentil 35
# Resumen estadístico de los datos dia Jueves
summary(Jueves)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 9.04 10.58 10.96 11.16 11.56 13.68
hist (Viernes,main = "Viernes",
xlab = "Demanda",
ylab = "Frecuencia")
var(Viernes) # Varinza de los datos Viernes
## [1] 0.4613982
sd(Viernes) # Desviacion estandar
## [1] 0.679263
promViernes = mean(Viernes); promViernes # Promedio
## [1] 13.11533
cv = sd(Viernes)/promViernes; cv # Coeficiente de variacion
## [1] 0.05179151
q = quantile(Viernes) # Calculando los indicadores de posición
quantile(Viernes, prob=seq(0, 1, length = 11))
## 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
## 11.840 12.347 12.504 12.756 12.922 13.095 13.236 13.383 13.534 14.034 14.900
q35<-quantile(Viernes, prob=c(0.35)) # Calculando el percentil 35
q35
## 35%
## 12.812
q80=quantile(Viernes, prob=c(0.80)) # Percentil - Decil 80
boxplot(Viernes, horizontal = TRUE)
abline(v=c(q35),col="red", lty=c(2),lwd=c(1)) # Agrega línea del percentil 35
# Resumen estadístico de los datos dia Viernes
summary(Viernes)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 11.84 12.64 13.10 13.12 13.40 14.90
hist (Sábado,main = "Sábado",
xlab = "Demanda",
ylab = "Frecuencia")
var(Sábado) # Varinza de los datos Sábado
## [1] 0.7014355
sd(Sábado) # Desviacion estandar
## [1] 0.8375175
promSábado = mean(Sábado); promSábado # Promedio
## [1] 13.103
cv = sd(Sábado)/promSábado; cv # Coeficiente de variacion
## [1] 0.06391799
q = quantile(Sábado) # Calculando los indicadores de posición
quantile(Sábado, prob=seq(0, 1, length = 11))
## 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
## 11.610 11.926 12.378 12.624 12.874 13.075 13.220 13.474 13.916 14.159 14.820
q35<-quantile(Sábado, prob=c(0.35)) # Calculando el percentil 35
q35
## 35%
## 12.726
q80=quantile(Sábado, prob=c(0.80)) # Percentil - Decil 80
boxplot(Sábado, horizontal = TRUE)
abline(v=c(q35),col="red", lty=c(2),lwd=c(1)) # Agrega línea del percentil 35
# Resumen estadístico de los datos dia Sábado
summary(Sábado)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 11.61 12.54 13.07 13.10 13.86 14.82
hist (Domingo,main = "Domingo",
xlab = "Demanda",
ylab = "Frecuencia")
var(Domingo) # Varinza de los datos Domingo
## [1] 2.328203
sd(Domingo) # Desviacion estandar
## [1] 1.525845
promDomingo = mean(Domingo); promDomingo # Promedio
## [1] 6.793667
cv = sd(Domingo)/promDomingo; cv # Coeficiente de variacion
## [1] 0.2245982
q = quantile(Domingo) # Calculando los indicadores de posición
quantile(Domingo, prob=seq(0, 1, length = 11))
## 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
## 3.940 5.236 5.806 5.922 6.084 6.200 6.898 7.885 8.350 8.840 9.740
q35<-quantile(Domingo, prob=c(0.35)) # Calculando el percentil 35
q35
## 35%
## 6.0515
q80=quantile(Domingo, prob=c(0.80)) # Percentil - Decil 80
boxplot(Domingo, horizontal = TRUE)
abline(v=c(q35),col="red", lty=c(2),lwd=c(1)) # Agrega línea del percentil 35
# Resumen estadístico de los datos dia Domingo
summary(Domingo)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.940 5.865 6.200 6.794 7.997 9.740
# Visualizar los primeros registros de los datos
head(b2)
## # A tibble: 6 × 8
## Semana Lunes Martes Miercoles Jueves Viernes Sábado Domingo
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 10.9 10.6 11.8 10.7 12.4 13.0 7.24
## 2 2 8.6 12.0 12.6 10.8 14.9 11.9 8.83
## 3 3 7.91 8.73 9.12 13.2 12.5 13.9 9.48
## 4 4 9.5 9.34 9.79 10.4 14.2 14.0 6.05
## 5 5 9.15 10.9 11.8 11.0 13.0 12.4 8
## 6 6 8.21 7.81 10.2 10.6 13.8 12.6 8.93
# Resumen estadístico de los datos
summary(b2)
## Semana Lunes Martes Miercoles
## Min. : 1.00 Min. : 7.620 Min. : 7.810 Min. : 8.87
## 1st Qu.: 8.25 1st Qu.: 8.738 1st Qu.: 8.910 1st Qu.:10.42
## Median :15.50 Median : 9.665 Median : 9.785 Median :11.22
## Mean :15.50 Mean : 9.612 Mean : 9.924 Mean :11.20
## 3rd Qu.:22.75 3rd Qu.:10.338 3rd Qu.:10.602 3rd Qu.:12.10
## Max. :30.00 Max. :12.590 Max. :12.190 Max. :13.13
## Jueves Viernes Sábado Domingo
## Min. : 9.04 Min. :11.84 Min. :11.61 Min. :3.940
## 1st Qu.:10.58 1st Qu.:12.64 1st Qu.:12.54 1st Qu.:5.865
## Median :10.96 Median :13.10 Median :13.07 Median :6.200
## Mean :11.16 Mean :13.12 Mean :13.10 Mean :6.794
## 3rd Qu.:11.56 3rd Qu.:13.40 3rd Qu.:13.86 3rd Qu.:7.997
## Max. :13.68 Max. :14.90 Max. :14.82 Max. :9.740
stacked_df <- stack(b2)
head(stacked_df)
## values ind
## 1 1 Semana
## 2 2 Semana
## 3 3 Semana
## 4 4 Semana
## 5 5 Semana
## 6 6 Semana
# Boxplot del conjunto de datos 'Lunes,Martes,Miercoles,Jueves,Viernes,Sábado,Domingo'
boxplot(Lunes,Martes,Miercoles,Jueves,Viernes,Sábado,Domingo, col = rainbow(ncol(b2)))
var(b2) # Varinza de los datos
## Semana Lunes Martes Miercoles Jueves
## Semana 77.5000000 1.83224138 1.95137931 0.463275862 -0.680344828
## Lunes 1.8322414 1.41351782 -0.06126552 0.301014368 0.294036782
## Martes 1.9513793 -0.06126552 1.31194207 -0.097987586 0.102937241
## Miercoles 0.4632759 0.30101437 -0.09798759 1.297368851 -0.291013563
## Jueves -0.6803448 0.29403678 0.10293724 -0.291013563 1.222613333
## Viernes -1.4189655 -0.23826782 -0.09731172 0.008897011 0.008874943
## Sábado 0.4160345 0.11303276 -0.22613655 -0.016804483 -0.001294483
## Domingo -3.7774138 -0.63351322 -0.06749103 -0.358507011 0.036710575
## Viernes Sábado Domingo
## Semana -1.418965517 0.416034483 -3.77741379
## Lunes -0.238267816 0.113032759 -0.63351322
## Martes -0.097311724 -0.226136552 -0.06749103
## Miercoles 0.008897011 -0.016804483 -0.35850701
## Jueves 0.008874943 -0.001294483 0.03671057
## Viernes 0.461398161 -0.137209655 0.08069701
## Sábado -0.137209655 0.701435517 -0.43802862
## Domingo 0.080697011 -0.438028621 2.32820333
¿Qué conclusiones se pueden obtener a partir de los datos?
Como podemos observar en el diagrama de cajas, muestra una diferencia en las 2 muestras.
Donde la concentración de oxigeno antes del vertimiento de la industria presenta una media de 8.2 aproximadamente con una varianza de 0.94, mientras que, los datos después del efluente de la industria son menores con un valor de 6.2 de la media y 0.97 de la varianza aproximadamente.
Esto es un claro indicio que la industria esta afectando los niveles de oxigeno en el rio, debido que al comparar sus medias hay una notoria disminución. ¿pero realmente esta afectando la vida submarina?
Como habíamos mencionado, la supervivencia de las especies acuáticas debe contar con un mínimo de oxígeno disuelto, el valor es de 4 OD. En ambos diagramas de caja, la media con su respectiva varianza está por encima del valor mínimo estipulado para la supervivencia, a excepción de un dato atípico que indica que estaría violando ese límite.
¿El registro de la demanda en toneladas del producto es el mismo en los diferentes días de la semana?
No ya que el cada dia tiene una cantidad un poco mayor o menor que el dia anterior , se pudo observar que el dia en el cual se registra un mayor ingreso de producto es el dia viernes con 13,115 toneladas, seguido del dia sabado con 13,103 , miércoles (11,204),martes(9,924), lunes(9,612) y finalmente el dia en el cual se registró una menor cantidad de producto fue el domingo con 6,794 toneladas . Lo cual nos da a conocer que la demanda del producto comienza con un valor considerable el cual va aumentando hasta el dia miercoles que registra la mayor solicitud y al llegar el dia domingo el valor es inferior al dia lunes.
DX Contaminación Una entidad encargada del control de contaminación, sospecha que cierta industria que deposita sus efluentes sobre el curso de un rio lo viene contaminando. Con el objetivo de verificar esta hipótesis ha decidido tomar 30 mediciones consecutivas (diarias) en puntos de muestreo ubicados antes y después del efluente (de forma apareada, según tiempo de retención). El oxígeno disuelto (OD) es la cantidad de oxígeno que esta disuelta en el agua. Es un indicador de cuan contaminada está el agua o de lo bien que puede dar soporte esta agua a la vida vegetal y animal. Generalmente, un nivel más alto de oxígeno disuelto indica agua de mejor calidad. Si los niveles de oxígeno disuelto son demasiado bajos, algunos peces y otros organismos no pueden sobrevivir.
######### ----------- LECTURA DE LA DATA ---------- ############
b3=read_excel("Situación 3.xlsx", sheet = "Hoja1")
attach(b3)
\[ \left\{ \begin{array}{ll} H_0: \mu_{\text{antes}} - \mu_{\text{después}} = 0\\ H_1: \mu_{\text{antes}} - \mu_{\text{después}} \neq 0 \end{array} \right. \]
# Visualizar los primeros registros de los datos
head(b3)
## # A tibble: 6 × 3
## Día Antes Desp
## <dbl> <dbl> <dbl>
## 1 1 7.36 4.89
## 2 2 9.61 6.9
## 3 3 7.69 5.75
## 4 4 8.09 5.81
## 5 5 7.92 5.81
## 6 6 9.38 6.78
# Resumen estadístico de los datos
summary(b3)
## Día Antes Desp
## Min. : 1.00 Min. : 6.420 Min. :3.850
## 1st Qu.: 8.25 1st Qu.: 7.615 1st Qu.:5.763
## Median :15.50 Median : 7.960 Median :6.010
## Mean :15.50 Mean : 8.197 Mean :6.163
## 3rd Qu.:22.75 3rd Qu.: 8.838 3rd Qu.:6.885
## Max. :30.00 Max. :10.600 Max. :8.210
| Nombre variable | Descripcion |
|---|---|
| Dia | # Dias |
| Antes | Cantidad de datos OD |
| Despues | Cantidad de datos OD |
hist (Antes,main = "Antes",
xlab = "OD Despues",
ylab = "OD Antes")
var(Antes) # Varinza de los datos Domingo
## [1] 0.9471168
sd(Antes) # Desviacion estandar
## [1] 0.9731993
promAntes = mean(Antes); promAntes # Promedio
## [1] 8.197333
cv = sd(Antes)/promAntes; cv # Coeficiente de variacion
## [1] 0.1187214
q35<-quantile(Antes, prob=c(0.35)) # Calculando el percentil 35
q35
## 35%
## 7.8
q80=quantile(Antes, prob=c(0.80)) # Percentil - Decil 80
boxplot(Antes, horizontal = TRUE)
abline(v=c(q35),col="red", lty=c(2),lwd=c(1)) # Agrega línea del percentil 35
# Resumen estadístico de los datos dia Domingo
summary(Antes)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 6.420 7.615 7.960 8.197 8.838 10.600
hist (Desp,main = "Desp",
xlab = "OD Despues",
ylab = "OD Antes")
var(Desp) # Varinza de los datos Domingo
## [1] 0.9760907
sd(Desp) # Desviacion estandar
## [1] 0.987973
promDesp = mean(Desp); promDesp # Promedio
## [1] 6.163
cv = sd(Desp)/promDesp; cv # Coeficiente de variacion
## [1] 0.1603072
q35<-quantile(Desp, prob=c(0.35)) # Calculando el percentil 35
q35
## 35%
## 5.8115
q80=quantile(Desp, prob=c(0.80)) # Percentil - Decil 80
boxplot(Desp, horizontal = TRUE)
abline(v=c(q35),col="red", lty=c(2),lwd=c(1)) # Agrega línea del percentil 35
# Resumen estadístico de los datos dia Domingo
summary(Desp)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.850 5.763 6.010 6.163 6.885 8.210
stacked_df <- stack(b3)
head(stacked_df)
## values ind
## 1 1 Día
## 2 2 Día
## 3 3 Día
## 4 4 Día
## 5 5 Día
## 6 6 Día
# Boxplot del conjunto de datos 'Antes,Desp'
boxplot(Antes,Desp, col = rainbow(ncol(b3)))
## Tabla de Estadisticas Descriptivas
mean(Antes) # Media de los datos Antes
## [1] 8.197333
median(Antes) # Mediana de los datos Antes
## [1] 7.96
var(Antes) #Varianza de los datos Antes
## [1] 0.9471168
• La primera fila corresponde al OD Antes.
• La segunda fila correponde al OD Despues.
# Datos
OD_Despues <- c(6.42, 6.79, 6.9, 7.06, 7.31, 7.36, 7.46, 7.61, 7.63, 7.69, 7.8, 7.8, 7.82, 7.82, 7.92, 8, 8.09, 8.18, 8.35, 8.63, 8.75, 8.8, 8.85, 9.13, 9.19, 9.38, 9.38, 9.59, 9.61, 10.6)
OD_Antes <- c(3.85, 4.41, 4.89, 4.92, 5.01, 5.44, 5.51, 5.75, 5.8, 5.81, 5.81, 5.82, 5.89, 5.96, 6, 6.02, 6.09, 6.27, 6.59, 6.78, 6.81, 6.84, 6.9, 6.9, 7.08, 7.21, 7.29, 7.44, 7.59, 8.21)
# Vectores
plot(OD_Despues, OD_Antes, type = "l")
En otra perspectiva, es mediante un diagrama de dispersión y coeficiente de correlación de Pearson que nos muestra una relación directa del 88% entre el oxígeno disuelto antes y después del vertimiento de la industria en el río, lo que nos indica que tan parecida puede ser una muestra de la otra.
Con estos resultados podemos concluir que existe un cambio en la concentración de oxígeno disuelto en el rio antes y después del efluyente de la industria, pero el cambio no es muy considerado debido a que respeta el mínimo limite establecido de 4 OD.