Estadística Aplicada a la Computación

INFORME MUNDIAL DE PAISES CONTAMINADOS

Resumen

GreenInsight Global Solutions, una organización dedicada al análisis de la contaminación a nivel mundial, tiene como misión liderar la búsqueda de soluciones sostenibles. Su enfoque aborda la problemática de la contaminación atmosférica, del agua y del suelo en países específicos, evaluando impactos en la salud humana, la biodiversidad y el cambio climático. Utilizando métodos estadísticos, la organización recopila, analiza y presenta datos detallados sobre índices de contaminación, variables socioeconómicas, y políticas ambientales. La población de estudio incluye países, comunidades locales, industrias y gobiernos. GreenInsight emplea un muestreo estratificado y aleatorio para asegurar representatividad. Entre las variables clave se encuentran índices de contaminación, indicadores de desarrollo económico, acceso a servicios de tratamiento de residuos y políticas ambientales. La organización utiliza tablas y gráficos estadísticos para visualizar los resultados y aplica medidas estadísticas para interpretar la información recopilada. GreenInsight Global Solutions busca ofrecer soluciones informadas y estrategias efectivas para abordar la creciente problemática de la contaminación a nivel mundial.

Asignacion de directorio

setwd("D:/Estadística Aplicada a la Computación/RStudio")
getwd()
## [1] "D:/Estadística Aplicada a la Computación/RStudio"

Carga de datos CSV

ContaminacionM<- read.csv("Contaminated_Countries.csv")
head(ContaminacionM)
##   pollution_2023 pollution_growth_Rate  country_name ccn3 country_region
## 1     1428627663               0.00808         India  356           Asia
## 2     1425671352              -0.00015         China  156           Asia
## 3      339996563               0.00505 United States  840  North America
## 4      277534122               0.00738     Indonesia  360           Asia
## 5      240485658               0.01976      Pakistan  586           Asia
## 6      223804632               0.02408       Nigeria  566         Africa
##   united_nation_Member country_land_Area_in_Km pollution_density_in_km
## 1                 TRUE                 2973190                480.5033
## 2                 TRUE                 9424703                151.2696
## 3                 TRUE                 9147420                 37.1686
## 4                 TRUE                 1877519                147.8196
## 5                 TRUE                  770880                311.9625
## 6                 TRUE                  910770                245.7312
##   pollution_density_per_Mile
## 1                  1244.5036
## 2                   391.7884
## 3                    96.2666
## 4                   382.8528
## 5                   807.9829
## 6                   636.4439
##                                                               share_borders
## 1                                    AFG, BGD, BTN, MMR, CHN, NPL, PAK, LKA
## 2 AFG, BTN, MMR, HKG, IND, KAZ, PRK, KGZ, LAO, MAC, MNG, PAK, RUS, TJK, VNM
## 3                                                                  CAN, MEX
## 4                                                             TLS, MYS, PNG
## 5                                                        AFG, CHN, IND, IRN
## 6                                                        BEN, CMR, TCD, NER
##   pollution_Rank mostPollutedCountries_particlePollution
## 1              1                                   58.08
## 2              2                                   39.12
## 3              3                                    9.04
## 4              4                                   51.71
## 5              5                                   65.81
## 6              6                                   21.40

I. Aspectos generales

1.1 Nombre de la organización y/o empresa

GreenInsight Global Solutions

1.2 Misión y visión

Misión:

La misión en GreenInsight Global Solutions es liderar el camino hacia un planeta más saludable y sostenible. Nos comprometemos a proporcionar informes globales exhaustivos sobre la contaminación en los países, utilizando datos precisos y análisis detallados. Buscamos inspirar la acción y la conciencia a nivel mundial, promoviendo prácticas ambientales responsables y brindando soluciones innovadoras para abordar los desafíos de la contaminación.

Visión:

La visión es vivir en un mundo donde la información sobre la contaminación sea un catalizador para el cambio positivo. Buscamos ser líderes reconocidos en la generación de informes globales, proporcionando a gobiernos, empresas y comunidades las herramientas necesarias para tomar decisiones informadas y adoptar medidas efectivas. Aspiramos a un futuro en el que la salud del planeta y la calidad de vida de sus habitantes estén protegidas y mejoradas a través de prácticas sostenibles y una gestión responsable de los recursos.

1.3 Descripción del servicio/productos que se va a analizar

Nuestros servicios y productos están diseñados para proporcionar una comprensión integral de la situación ambiental, permitiendo a gobiernos, organizaciones, y empresas tomar decisiones informadas y desarrollar estrategias efectivas de mitigación.

Servicios/Productos:

  1. Informe de Contaminación Nacional:
    • Evaluación detallada de los niveles de contaminación atmosférica, del agua y del suelo en un país específico.
    • Identificación de fuentes principales de contaminación y sus impactos en la salud humana y el medio ambiente.
  2. Análisis de Tendencias Temporales:
    • Seguimiento de la evolución de los índices de contaminación a lo largo del tiempo, permitiendo la identificación de patrones y cambios significativos.
  3. Comparación Internacional:
    • Comparación de datos de contaminación entre diferentes países para contextualizar y clasificar el desempeño ambiental a nivel global.
  4. Recomendaciones de Mitigación:
    • Desarrollo de estrategias y recomendaciones específicas para abordar los problemas de contaminación, promoviendo prácticas sostenibles y soluciones innovadoras.
  5. Plataforma de Información Interactiva:
    • Creación de una plataforma en línea que brinde acceso a los informes, datos y análisis, facilitando la toma de decisiones y la divulgación de información.

1.4 Problemática de estudio

Se centra en la creciente amenaza de la contaminación a nivel mundial y sus impactos negativos en la salud humana, el medio ambiente y la sostenibilidad global. Algunos aspectos específicos que podrían constituir la problemática de estudio incluyen:

  1. Aumento de Niveles de Contaminación:
    • Identificar y analizar el aumento de los niveles de contaminación en diferentes países durante un periodo específico, evidenciando la magnitud del problema a nivel global.
  2. Impactos en la Salud Humana:
    • Investigar y documentar los efectos directos de la contaminación en la salud de la población, incluyendo enfermedades respiratorias, cardiovasculares y otros problemas de salud relacionados.
  3. Pérdida de Biodiversidad y Daños Ecosistémicos:
    • Evaluar cómo la contaminación contribuye a la pérdida de biodiversidad y provoca daños irreversibles en los ecosistemas, afectando la flora y fauna a nivel local y global.
  4. Desigualdades Ambientales:
    • Analizar las disparidades en la exposición a la contaminación, destacando las comunidades y regiones más afectadas, y abordando cuestiones de justicia ambiental.
  5. Contribución a los Cambios Climáticos:
    • Examinar la relación entre la contaminación y la contribución a los cambios climáticos, incluyendo la emisión de gases de efecto invernadero y otros contaminantes atmosféricos.
  6. Eficiencia de Políticas de Mitigación:
    • Evaluar la eficacia de las políticas existentes para mitigar la contaminación y proponer recomendaciones para mejorar las estrategias de gestión ambiental a nivel nacional e internacional.

GreenInsight Global Solutions aborda esta problemática con la intención de proporcionar información precisa y soluciones prácticas que impulsen un cambio positivo hacia un entorno más limpio y sostenible en todo el mundo.

II. Fundamentos básicos de la Estadística

2.1 Objetivo de estudio

El objetivo principal es realizar un análisis exhaustivo de la contaminación a nivel mundial con el propósito de proporcionar información precisa y estratégica que inspire acciones efectivas para mitigar los impactos negativos en la salud humana y el medio ambiente. Los objetivos específicos incluyen:

  1. Evaluar la Magnitud del Problema:
    • Cuantificar y caracterizar la extensión de la contaminación en diferentes países, identificando las fuentes clave y determinando la variación temporal de los niveles de contaminantes.
  2. Comprender los Impactos en la Salud y el Medio Ambiente:
    • Analizar los efectos directos e indirectos de la contaminación en la salud humana y la biodiversidad, así como su contribución a los problemas ambientales a largo plazo.
  3. Identificar Desigualdades y Puntos Críticos:
    • Identificar las áreas y comunidades más afectadas por la contaminación, resaltando las desigualdades ambientales y estableciendo puntos críticos que requieran intervenciones urgentes.
  4. Comparar el Desempeño Ambiental entre Países:
    • Realizar comparaciones detalladas entre países para clasificar su desempeño ambiental, fomentando la competencia saludable y proporcionando incentivos para mejorar las prácticas sostenibles.
  5. Desarrollar Estrategias de Mitigación:
    • Formular recomendaciones específicas y viables para abordar los problemas identificados, promoviendo prácticas sostenibles y estrategias de mitigación efectivas.
  6. Promover la Conciencia y la Acción Global:
    • Difundir los resultados del análisis para aumentar la conciencia pública sobre la contaminación y movilizar la acción a nivel gubernamental, empresarial y comunitario.

2.2 Población de estudio

La población de estudio abarca diversos grupos y entidades involucradas en la problemática de la contaminación a nivel mundial. Esta incluye:

  1. Países a Nivel Mundial:
    • Todos los países forman parte de la población de estudio, ya que el análisis se centra en evaluar y comparar los niveles de contaminación a escala global.
  2. Comunidades y Población Local:
    • Especial atención se brinda a las comunidades y poblaciones locales que experimentan de manera directa los impactos de la contaminación. Se identifican áreas específicas con mayores niveles de contaminantes y se analiza el impacto en la salud y calidad de vida de la población residente.
  3. Gobiernos y Autoridades Ambientales:
    • Los gobiernos y autoridades ambientales de cada país son parte fundamental de la población de estudio. Se busca comprender cómo las políticas y regulaciones impactan la gestión de la contaminación y se ofrecen recomendaciones para mejorar la eficacia de estas medidas.
  4. Industrias y Sectores Relevantes:
    • Sectores industriales clave y otras actividades humanas que contribuyen significativamente a la contaminación son parte de la población de estudio. Se analiza la eficacia de las prácticas actuales y se proponen alternativas sostenibles.
  5. Organizaciones No Gubernamentales (ONG) y Grupos de Activistas:
    • ONG y grupos activistas desempeñan un papel importante en la sensibilización y la presión para el cambio. Se colabora con estas entidades para amplificar el impacto de las investigaciones y fomentar la acción.

2.3 Muestra

La selección de la muestra se llevará a cabo de manera estratégica y representativa, considerando la diversidad de la población de estudio. La muestra incluirá:

  1. Países Representativos:
    • Se seleccionarán países que sean representativos de diversas regiones geográficas, niveles de desarrollo económico y características ambientales. Esto permitirá obtener una imagen global de la contaminación.
  2. Muestras Regionales y Urbanas:
    • Dentro de cada país, se tomarán muestras representativas de áreas urbanas y regiones rurales. Esto facilitará la identificación de patrones específicos de contaminación relacionados con la densidad poblacional y las actividades económicas.
  3. Comunidades Vulnerables:
    • Se prestará especial atención a comunidades que son más vulnerables a los impactos de la contaminación, como aquellas ubicadas cerca de fuentes industriales o zonas con desigualdades ambientales evidentes.
  4. Sectores Industriales Clave:
    • Se seleccionarán sectores industriales clave para evaluar la contaminación generada por sus operaciones. Esto incluirá industrias con altos niveles de emisiones y aquellas que desempeñan un papel central en la economía.
  5. Periodos Temporales Representativos:
    • La muestra abarcará periodos de tiempo significativos para capturar tendencias a lo largo de los años y evaluar la efectividad de las políticas y medidas de mitigación a lo largo del tiempo.

2.4 Unidad de análisis

La unidad de análisis se define de acuerdo con los componentes específicos del estudio sobre contaminación a nivel mundial. La unidad de análisis abarca:

  1. Países:
    • La unidad primaria de análisis son los países individuales. Se recopilan datos sobre la contaminación en cada país, lo que permite una evaluación comparativa y detallada de su desempeño ambiental.
  2. Áreas Geográficas Específicas:
    • Dentro de cada país, se analizan áreas geográficas específicas, como ciudades, regiones urbanas y rurales. Esto facilita una comprensión más detallada de la distribución de la contaminación y sus impactos locales.
  3. Población:
    • La población, especialmente aquella que reside en áreas más afectadas por la contaminación, es una unidad clave de análisis. Se examinan los efectos de la contaminación en la salud y la calidad de vida de las personas.
  4. Sectores Industriales:
    • Se analizan sectores industriales específicos para evaluar su contribución a la contaminación. Esto incluye la identificación de fuentes de emisiones y la evaluación de prácticas sostenibles dentro de estos sectores.
  5. Períodos de Tiempo:
    • El análisis abarca diferentes períodos de tiempo, permitiendo evaluar las tendencias y cambios en los niveles de contaminación a lo largo de los años. Se examina la efectividad de las medidas de mitigación en diferentes momentos.

2.5 Tipo de muestreo a utilizar

El tipo de muestreo a utilizar dependerá de varios factores, incluyendo la naturaleza de la investigación y los recursos disponibles. Para el estudio de GreenInsight Global Solutions sobre contaminación a nivel mundial, podría considerarse un enfoque mixto de muestreo estratificado y aleatorio. Aquí hay una descripción de estos métodos:

  1. Muestreo Estratificado:
    • Se divide la población (países) en estratos o subgrupos con características similares. Por ejemplo, se podrían estratificar los países según su ubicación geográfica, niveles de desarrollo económico o características ambientales. Luego, se seleccionan muestras de cada estrato para garantizar la representatividad de diferentes contextos.
  2. Muestreo Aleatorio:
    • Dentro de cada estrato, se utiliza un muestreo aleatorio para seleccionar países de manera imparcial y sin sesgos. Esto permite obtener una muestra representativa de países en cada categoría y contribuye a la generalización de los resultados a la población total.
  3. Muestreo por Cuotas:
    • Se establecen cuotas para asegurar la representación de ciertos tipos de países, como aquellos con altos niveles de industrialización, aquellos con desafíos ambientales específicos o aquellos ubicados en regiones geográficas particulares. Esto garantiza una diversidad adecuada en la muestra.
  4. Muestreo Temporal:
    • Para capturar la variación temporal, se podría implementar un muestreo sistemático que incluya datos a lo largo de varios años. Esto proporciona una visión más completa de las tendencias y cambios en los niveles de contaminación.

III. Variables y tipo de variables

3.1 Importación al entorno de trabajo

Si estás pensando en cómo importar datos o información relevante al entorno de trabajo de GreenInsight Global Solutions para llevar a cabo el estudio de contaminación a nivel mundial, aquí hay algunos pasos generales que podrías seguir:

  1. Recopilación de Datos:
    • Obtén datos sobre contaminación de fuentes confiables y actualizadas, como informes gubernamentales, bases de datos ambientales internacionales, investigaciones científicas y otras fuentes verificadas.
  2. Organización de la Información:
    • Estructura los datos de manera que sean compatibles con el análisis que planeas realizar. Puedes utilizar hojas de cálculo, bases de datos o formatos específicos según tus necesidades.
  3. Formato de Importación:
    • Determina el formato de importación más adecuado para tu entorno de trabajo. Podría ser un formato de hoja de cálculo (por ejemplo, CSV, Excel) o un formato de base de datos, dependiendo de la herramienta o plataforma que utilices.
  4. Herramientas de Análisis:
    • Selecciona las herramientas de análisis más apropiadas para tu estudio. Puedes utilizar software estadístico, plataformas de análisis de datos o herramientas específicas de visualización, según los requisitos de tu investigación.
  5. Importación a la Plataforma:
    • Utiliza las funciones de importación de datos de tu plataforma de análisis. Esto puede implicar cargar archivos directamente en una interfaz de usuario o usar comandos específicos si estás trabajando con herramientas de línea de comandos.
  6. Limpieza y Preprocesamiento:
    • Realiza tareas de limpieza y preprocesamiento de datos según sea necesario. Esto puede incluir la identificación y manejo de valores atípicos, la normalización de datos y la corrección de posibles errores.
  7. Análisis Exploratorio:
    • Lleva a cabo un análisis exploratorio inicial para comprender la distribución de los datos, identificar patrones y evaluar la calidad de la información importada.
  8. Desarrollo de Modelos y Conclusiones:
    • Implementa modelos o realiza análisis estadísticos para cumplir con los objetivos de tu estudio. Deriva conclusiones significativas a partir de los resultados obtenidos.
  9. Documentación:
    • Documenta todo el proceso, desde la importación hasta las conclusiones finales. Esto facilitará la replicación del estudio y la interpretación de los resultados.

3.2 Variables y descripción de cada variable

Es esencial identificar y describir las variables que se analizarán. A continuación, se presentan algunas variables clave y su descripción:

  1. Índices de Contaminación del Aire:
    • Descripción: Medida de la concentración de contaminantes atmosféricos, como dióxido de azufre (SO2), dióxido de nitrógeno (NO2), partículas en suspensión (PM10, PM2.5), monóxido de carbono (CO) y ozono (O3).
  2. Calidad del Agua:
    • Descripción: Evaluación de la calidad del agua en términos de parámetros como la concentración de contaminantes químicos, metales pesados y la presencia de microorganismos patógenos.
  3. Contaminación del Suelo:
    • Descripción: Medición de la presencia de contaminantes en el suelo, como pesticidas, metales pesados, productos químicos industriales y residuos tóxicos.
  4. Emisiones de Gases de Efecto Invernadero (GEI):
    • Descripción: Cuantificación de las emisiones de gases que contribuyen al cambio climático, como dióxido de carbono (CO2), metano (CH4) y óxidos de nitrógeno (NOx).
  5. Indicadores de Desarrollo Económico:
    • Descripción: Factores económicos como el Producto Interno Bruto (PIB) per cápita, la industrialización y la actividad económica, que pueden estar relacionados con los niveles de contaminación.
  6. Acceso a Servicios de Tratamiento de Residuos:
    • Descripción: Porcentaje de la población con acceso a servicios adecuados de gestión y tratamiento de residuos sólidos y líquidos.
  7. Desarrollo Urbano:
    • Descripción: Indicadores relacionados con el crecimiento urbano, la planificación del uso del suelo y la densidad poblacional, que pueden influir en la contaminación.
  8. Salud Pública:
    • Descripción: Indicadores de salud como tasas de enfermedades respiratorias, cardiovasculares y otras condiciones relacionadas con la contaminación.
  9. Políticas y Regulaciones Ambientales:
    • Descripción: Evaluación de la efectividad de las políticas y regulaciones ambientales en vigor en cada país para abordar la contaminación.
  10. Índices de Desigualdad Ambiental:
    • Descripción: Medición de disparidades en la exposición a la contaminación entre diferentes grupos socioeconómicos y comunidades.

IV. Tablas estadísticas y gráficos adecuados (Considerar todos los estudiados)

library(ggplot2)
library(dplyr)
library(readr)
# Grafico de barras

# Países contaminados de partículas

plot(ContaminacionM$mostPollutedCountries_particlePollution, main="Distribucion de Países más contaminados de partículas", xlab="Contaminacion de particulas",ylab="Frecuencia", col=c(2,4,3,7,8))

# Miembro de la nación unida (False o True)

library(ggplot2)
ggplot(data = ContaminacionM, aes(x=united_nation_Member))+
  geom_bar()+
  theme_classic()

# Grafico Circular simple de Región de los paises

pie(table(ContaminacionM$country_region))

# Histograma de países más contaminados de partículas

ggplot(ContaminacionM, aes(x = mostPollutedCountries_particlePollution)) +
  geom_histogram(fill = "purple",
                 color = "black",
                 binwidth = 1) +
  labs(x = "Contaminados de partículas",
       y = "Cantidad",
       title = "Distribucion de Países más contaminados de partículas") + 
  theme_classic()

# Diagrama de caja

## El rango de contaminación general

ggplot(ContaminacionM, aes(x = 0 , y = pollution_Rank)) + 
  geom_boxplot()+
  geom_jitter()

## Región del país  sobre sobre el rango de contaminación

ggplot(data = ContaminacionM,
       mapping = aes(x =country_region,
                     y = pollution_Rank)) +
  geom_boxplot(outlier.shape = 25) +
  geom_jitter()

# Gráfico de Densidad de países contaminados de partículas

ggplot(ContaminacionM, aes(x = mostPollutedCountries_particlePollution)) + 
  geom_density(fill = "blue") + 
  labs(x = "Contaminación de partículas",
       y = "Densidad",
       title = "Distribucion de Países contaminados de partículas") +
  theme_classic()

V. Medidas estadísticas (Considerar todas las medidas estudiadas)

## Media aritmética de los rangos de contaminación

# Opción 1

media_aritmetrica = sum(ContaminacionM$pollution_Rank)/length(ContaminacionM$pollution_Rank)
media_aritmetrica
## [1] 72.25
# Opción 2

mean(ContaminacionM$pollution_Rank)
## [1] 72.25

Interpretacion: La media aritmética de los rangos de contaminación es 72.25

## Moda de la tasa de crecimiento de contaminación

# Opción 1 (table)

table(ContaminacionM$pollution_growth_Rate)
## 
## -0.07448  -0.0139 -0.01153 -0.01105 -0.01001 -0.00701 -0.00539  -0.0053 
##        1        1        1        1        1        1        1        1 
##  -0.0043 -0.00421 -0.00378 -0.00282 -0.00249 -0.00227 -0.00186   -9e-04 
##        1        1        1        1        1        1        1        2 
## -0.00082 -0.00061 -0.00015  0.00013  0.00037  0.00085  0.00125  0.00132 
##        1        1        1        1        1        1        1        1 
##  0.00145  0.00201  0.00216  0.00243  0.00259  0.00281  0.00309  0.00333 
##        1        1        1        1        1        1        1        1 
##  0.00338  0.00407  0.00454  0.00487  0.00505  0.00515  0.00557  0.00579 
##        1        1        1        1        1        1        1        1 
##  0.00595  0.00605  0.00643  0.00644  0.00649  0.00653  0.00673  0.00685 
##        1        1        1        1        1        1        1        1 
##  0.00691  0.00703  0.00736  0.00737  0.00738  0.00746  0.00802  0.00808 
##        1        1        1        1        1        1        1        1 
##  0.00826   0.0085  0.00869   0.0089  0.00902  0.00966     0.01  0.01033 
##        1        1        1        1        1        1        1        1 
##  0.01053  0.01056  0.01076  0.01091  0.01107  0.01143  0.01188  0.01292 
##        1        1        1        1        1        1        1        1 
##  0.01385  0.01391  0.01436  0.01478  0.01507  0.01539  0.01549  0.01556 
##        1        1        1        1        1        1        1        1 
##  0.01566  0.01579  0.01896   0.0193  0.01976  0.02266  0.02408  0.02551 
##        1        1        1        1        1        1        1        1 
##  0.02689  0.02702  0.02821  0.02933  0.03077  0.03285   0.0498 
##        1        1        1        1        1        1        1
# Opción 2

mode(ContaminacionM$pollution_growth_Rate)
## [1] "numeric"

Interpretacion: La moda de la tasa de crecimiento de contaminación es -9e-04

## Rango de la densidad de la contaminación en km

# Opcion 1

rango = max(ContaminacionM$pollution_density_in_km) - min(ContaminacionM$pollution_density_in_km)
rango
## [1] 21400.49
# Opcion 2

range(ContaminacionM$pollution_density_in_km) 
## [1]     2.2133 21402.7052

Interpretacion: El rango de la densidad de la contaminación en km es 21400.49

## Desviacion estandar de los rangos de contaminación

# Opcion 1

sqrt(var(ContaminacionM$pollution_Rank))
## [1] 51.80916
# Opcion 2

sd(ContaminacionM$pollution_Rank)
## [1] 51.80916

Interpretacion: La desviacion estandar de los rangos de contaminación es 51.80916

## Varianza de los rangos de contaminación

var(ContaminacionM$pollution_Rank)
## [1] 2684.189

Interpretacion: La varianza de los rangos de contaminación es 2684.189