Facultad de Ingenieria – Escuela de Estadística

Programa Académico de Estadística

Asignatura: Procesamiento de Datos

Taller No.4: Visualización de datos en R

  • Andrés Stiven Jaramillo Marín
  • Ana Sofía Perhueza Gómez
  • Sara Isabela Salinas Gómez

Con el fin de verificar la hipótesis que sugiere la contaminación por parte de la industria sobre el curso del río, se utilizaron las siguientes herramientas estadísticas para analizar las mediciones realizadas.

datos <- read.table("Data_Contaminacion.txt", header=TRUE, dec=",")
summary(datos)
##     Instante         OD.A.            OD.D.      
##  Min.   : 1.00   Min.   : 6.420   Min.   :3.850  
##  1st Qu.: 8.25   1st Qu.: 7.615   1st Qu.:5.763  
##  Median :15.50   Median : 7.960   Median :6.010  
##  Mean   :15.50   Mean   : 8.197   Mean   :6.163  
##  3rd Qu.:22.75   3rd Qu.: 8.838   3rd Qu.:6.885  
##  Max.   :30.00   Max.   :10.600   Max.   :8.210

Tabla 1.1 “Resumen estadísticas, Oxígeno Disuelto antes del efluente (OD.A) y después del efluente (OD.D)

Al observar la tabla 1.1 se puede concluir que sí existe una diferencia en el nivel de Oxígeno disuelto antes y después del efluente. Por su parte, la mediana permite afirmar que en el 50% de las mediciones tomadas antes del efluente el nivel de oxígeno disuelto es mayor a 7.960. El valor mínimo registrado antes del efluente es de 6.420, el cual es mayor al 75% de los datos registrado después del efluente (representados en el cuartil 3).

De esto se puede deducir que sí existe un cambio significativo entre los niveles de Oxígeno disuelto en el agua antes y después del efluente de la fábrica. Para Ilustrar dicha diferencia se construyó el siguiente gráfico de cajas comparativo:

par(mfrow=c(1,2))
boxplot(datos$OD.A.,
        ylab="Oxigeno Disuelto",
        col="#A9ECC6",
        main="Antes del efluente",
        ylim=c(4,11)
        
)
boxplot(datos$OD.D.,
        ylab="Oxigeno Disuelto",
        col="#A9ECC6",
        main="Despues del efluente",
        ylim=c(4,11)
)

Gráfico 1.1 “Diagrama de Cajas comparativo Antes y Después del efluente”

El gráfico permite apreciar las marcadas diferencias entre los niveles de oxígeno disuelto registrados antes y después del efluente. Los niveles de oxígeno antes de que la industria deposite sus efluentes sobre le río son en su mayoría son mayores, lo cual indica que el agua es de mejor calidad y, también, se tiene un mejor ambiente para las especies que coexisten en el curso del río como peces y otros organismos. Se puede entonces concluir después de comparar las gráficas del antes y el después que la fábrica sí influye en los niveles de contaminación del río y, por ende, afecta a las especies que coexisten en este y en general al medio ambiente, ya que los niveles de oxígeno disuelto en el río sí disminuyen bastante al reaccionar a la acción de que se depositen los efluentes.

Para analizar a mayor profundidad se realizaron dos histogramas por cada medición (antes y después del efluente) que permita apreciar las distribuciones para cada una y determinar el efecto contaminante de la fábrica:

n.clases=7
puntos=min(datos$OD.A.)+(0:n.clases)*(max(datos$OD.A.)-min(datos$OD.A.))/n.clases

hist(datos$OD.A.,
     xlab="Cantidad de oxigeno disuelto",
     ylab = "Frecuencia absoluta",
     col="#A9ECC6",
     main="Mediciones del muestreo antes del efluente",
     xlim=c(6,11),
     breaks=puntos
)

Gráfico 1.2 “Histograma de los niveles de oxígeno disuelto antes del efluente”

A partir del histograma anterior se puede observar que, los niveles de oxígeno disuelto más altos se encuentran en el intervalo de 7,61 – 8,21 y la mayoría de los datos se encuentran al sumar la frecuencia de los 3 primeros intervalos, es decir, fueron niveles de oxígeno disuelto menores a 8,21. Se puede entonces apreciar que no es tan usual que se tengan niveles muy altos de oxígeno disuelto y no hay ninguno superior a 10,6.

hist(datos$OD.D.,
     xlab="Cantidad de oxigeno disuelto",
     ylab = "Frecuencia absoluta",
     col="#A9ECC6",
     main="Mediciones del muestreo despues del efluente",
     xlim=c(3,9)
)

Gráfico 1.3 “Histograma de los niveles de oxígeno disuelto despues del efluente”

Como se puede observar en el histograma anterior, la cantidad de oxígeno disuelto después del efluente varía en el intervalo (3,9); A diferencia del histograma de oxigeno antes del efluente (gráfico 1.2) que varía entre valores más altos. A simple vista, pareciera que los datos en el histograma se distribuyen de manera normal,pero sería erróneo concluirlo cuando la cantidad de datos es tan poca y, además, no se lleva a cabo un análisis más riguroso de los datos con pruebas de hipótesis.

 
Conclusión

Con la ayuda del análisis de datos y los gráficos elaborados se puede concluir que evidentemente la sospecha de la entidad al decir que los efluentes que deposita la industria al río son un gran factor contaminante es verdadero, ya que se puede ver un gran cambio en los niveles de oxígeno disuelto mediante las muestras que se tomaron antes y después del efluente. Los niveles de oxígeno disuelto empiezan a ser más bajos cuando la industria vierte sus efluentes y esto afecta a los seres vivos debido a que el agua se torna no apta para la vidade estos organismos ni para su consumo.