E1U1

River

10/23/2020


Nombre: Torres Urrutia River Damian

Matricula: 216766

23 de octubre del 2020

Preguntas

1.- ¿Qué es la estadística y que aplicaciones tiene en ingeniería (según su ingeniería)?

La estadistica es una ciencia que se encarga de la sistematizacion, ordenacion y presentacion de datos referentes a algun impacto/fenomeno en la sociedad o en cualquier ambito se encarga de deducir las leyes que rigen estos fenomenos y poder obtener previsiones sobre lo mismo y poder obtener buenas conclusiones. La estadistica en Ingeniera en Software tiene mucho impacto positivo ya que se pueden realizar o resolver problemas estadisticos de manera eficiente y mas rapida con menos probabilidad de error.

2.- Enliste y define los tipos de variables usados en estadística, de 2 ejemplos de cada uno. Defina distribución de frecuencia y explique que es la distribución normal.

Tipos de Variables en Estadistica

Cualitativas: No se expresan mediante un número. A su vez las podemos clasificar en:

  • Ordenables: Aquellas que sugieren una ordenación. Por ejemplo: la graduación militar y nivel de estudios.
  • No ordenables: Aquellas que sólo admiten una mera ordenación alfabética, pero no establece orden por su naturaleza. Por ejemplo: el color de pelo, sexo y estado civil.

Cuantitativas: Se expresan mediante un número. De estas hay dos tipos:

  • Discretas: Solo puede tomar valores aislados. Por ejemplo: nº de hermanos, cantidad de personas en un aula.
  • Continuas: Pueden tomar todos los valores de un intervalo. Por ejemplo, la estatura de los alumnos de algun grupo, la distancia que haces en un intervalo de tiempo.

Introduccion

Se realizara un comparacion de los niveles de o3 y pm10 en abril de 2019 y abril de 2020, buscando si hubo alguna diferencia en estos debido a la pandemia global que se esta viviendo actualmente.

Antecedentes

Como conocimiento general, la mayoria de personas estamos conscientes que hay mucha contaminacion ambiental debido al uso de automoviles y la produccion en fabricas, todo esto es causado diario debido a que la mayoria de estas actividades contaminantes se realizan 24/7, asi que suponemos que con esto de la pandemia global estos niveles de contaminacion hayan bajado para bien.

Importacion de Datos

library(pacman)
p_load("readr", "DT", "prettydoc", "fdth", "modeest")
setwd("~/Probabilidad y Estadistica")
abril19 <- read_csv("2019-04-ERNO_hora_L1_caire.csv")
## Parsed with column specification:
## cols(
##   Time = col_character(),
##   O3 = col_double(),
##   O3_flag = col_character(),
##   SO2 = col_double(),
##   SO2_flag = col_character(),
##   NO2 = col_character(),
##   NO2_flag = col_character(),
##   NO = col_character(),
##   NO_flag = col_character(),
##   CO = col_double(),
##   CO_flag = col_character(),
##   PM10 = col_double(),
##   PM10_flag = col_character(),
##   PM2.5 = col_double(),
##   PM2.5_flag = col_character()
## )
abril20 <- read_csv("2020-04-ERNO_hora_L1_caire.csv")
## Parsed with column specification:
## cols(
##   Time = col_character(),
##   O3 = col_double(),
##   O3_flag = col_character(),
##   SO2 = col_double(),
##   SO2_flag = col_character(),
##   NO2 = col_character(),
##   NO2_flag = col_character(),
##   NO = col_character(),
##   NO_flag = col_character(),
##   CO = col_character(),
##   CO_flag = col_character(),
##   PM10 = col_double(),
##   PM10_flag = col_character(),
##   PM2.5 = col_character(),
##   PM2.5_flag = col_character()
## )
datatable(abril19)
datatable(abril20)

Transformar Datos

OA19 <- abril19$O3
PA19 <- abril19$PM10
OA20 <- abril20$O3
PA20 <- abril20$PM10

distOA19 <- fdt(OA19, breaks = "Sturges")
distPA19 <- fdt(PA19, breaks = "Sturges")
distOA20 <- fdt(OA20, breaks = "Sturges")
distPA20 <- fdt(PA20, breaks = "Sturges")

Visualizar

# Distribucion de Frecuencia de O3 en Abril 2019
distOA19 
##       Class limits   f   rf rf(%)  cf  cf(%)
##   [0.4851,9.89827)  31 0.04  4.31  31   4.31
##  [9.89827,19.3114)  73 0.10 10.14 104  14.44
##  [19.3114,28.7246) 124 0.17 17.22 228  31.67
##  [28.7246,38.1378) 161 0.22 22.36 389  54.03
##   [38.1378,47.551) 134 0.19 18.61 523  72.64
##   [47.551,56.9641) 140 0.19 19.44 663  92.08
##  [56.9641,66.3773)  43 0.06  5.97 706  98.06
##  [66.3773,75.7905)  12 0.02  1.67 718  99.72
##  [75.7905,85.2037)   1 0.00  0.14 719  99.86
##  [85.2037,94.6168)   0 0.00  0.00 719  99.86
##   [94.6168,104.03)   1 0.00  0.14 720 100.00
# Distribucion de Frecuencia de PM10 en Abril 2019
distPA19
##        Class limits   f   rf rf(%)  cf  cf(%)
##  [-13.4633,3.78658)   5 0.01  0.69   5   0.69
##   [3.78658,21.0365) 164 0.23 22.78 169  23.47
##   [21.0365,38.2863) 353 0.49 49.03 522  72.50
##   [38.2863,55.5362) 140 0.19 19.44 662  91.94
##   [55.5362,72.7861)  43 0.06  5.97 705  97.92
##    [72.7861,90.036)  11 0.02  1.53 716  99.44
##    [90.036,107.286)   2 0.00  0.28 718  99.72
##   [107.286,124.536)   0 0.00  0.00 718  99.72
##   [124.536,141.786)   1 0.00  0.14 719  99.86
##   [141.786,159.036)   0 0.00  0.00 719  99.86
##   [159.036,176.285)   1 0.00  0.14 720 100.00
# Distribucion de Frecuencia de O3 en Abril 2020
distOA20
##     Class limits   f   rf rf(%)  cf  cf(%)
##  [2.2077,7.9146)   6 0.01  0.83   6   0.83
##  [7.9146,13.621)  28 0.04  3.89  34   4.72
##  [13.621,19.328)  84 0.12 11.67 118  16.39
##  [19.328,25.035)  83 0.12 11.53 201  27.92
##  [25.035,30.742) 109 0.15 15.14 310  43.06
##  [30.742,36.449) 105 0.15 14.58 415  57.64
##  [36.449,42.156) 107 0.15 14.86 522  72.50
##  [42.156,47.863) 111 0.15 15.42 633  87.92
##   [47.863,53.57)  58 0.08  8.06 691  95.97
##   [53.57,59.277)  24 0.03  3.33 715  99.31
##  [59.277,64.983)   5 0.01  0.69 720 100.00
# Distribucion de Frecuencia de PM10 en Abril 2020
distPA20
##         Class limits   f   rf rf(%)  cf  cf(%)
##   [-85.749,-58.3789)   1 0.00  0.14   1   0.14
##  [-58.3789,-31.0088)   1 0.00  0.14   2   0.28
##  [-31.0088,-3.63875)  21 0.03  2.92  23   3.19
##   [-3.63875,23.7313) 293 0.41 40.69 316  43.89
##    [23.7313,51.1014) 344 0.48 47.78 660  91.67
##    [51.1014,78.4715)  52 0.07  7.22 712  98.89
##    [78.4715,105.842)   5 0.01  0.69 717  99.58
##    [105.842,133.212)   0 0.00  0.00 717  99.58
##    [133.212,160.582)   1 0.00  0.14 718  99.72
##    [160.582,187.952)   1 0.00  0.14 719  99.86
##    [187.952,215.322)   1 0.00  0.14 720 100.00

Histogramas y Poligonos de Distribucion de Frecuencia de O3 y PM10 en Abril 2019

#O3 en Abril 2019
plot(distOA19, type = "fh")

plot(distOA19, type = "rfh")

plot(distOA19, type = "cfh")

plot(distOA19, type = "fp")

plot(distOA19, type = "rfp")

plot(distOA19, type = "cfp")

#PM10 en Abril 2019
plot(distPA19, type = "fh")

plot(distPA19, type = "rfh")

plot(distPA19, type = "cfh")

plot(distPA19, type = "fp")

plot(distPA19, type = "rfp")

plot(distPA19, type = "cfp")

Histogramas y Poligonos de Distribucion de Frecuencia de O3 y PM10 en Abril 2020

# Histograma y Poligonos de Distribucion de Frecuencia del O3 en Abril 2020
plot(distOA20, type = "fh")

plot(distOA20, type = "rfh")

plot(distOA20, type = "cfh")

plot(distOA20, type = "fp")

plot(distOA20, type = "rfp")

plot(distOA20, type = "cfp")

# Histograma y Poligonos de Distribucion de Frecuencia del PM10 en Abril 2020
plot(distPA20, type = "fh")

plot(distPA20, type = "rfh")

plot(distPA20, type = "cfh")

plot(distPA20, type = "fp")

plot(distPA20, type = "rfp")

plot(distPA20, type = "cfp")

Boxplot

boxplot(OA19)

boxplot(PA19)

boxplot(OA20)

boxplot(PA20)

Analizar

Medidas de Dispersion de O3 y PM10 en Abril 2019

O3 en Abril 2019

sd(OA19)
## [1] 15.59987
var(OA19)
## [1] 243.3558
plot(OA19)

PM10 en Abril 2019

sd(PA19)
## [1] 16.34137
var(PA19)
## [1] 267.0405
plot(PA19)

Medidas de Dispersion de O3 y PM10 en Abril 2020

O3 en Abril 2020

sd(OA20)
## [1] 12.38337
var(OA20)
## [1] 153.3479
plot(OA20)

PM10 en Abril 2020

sd(PA20)
## [1] 20.20556
var(PA20)
## [1] 408.2646
plot(PA20)

Modelar

Medidas de Tendencia de O3 y PM10 en Abril 2019

O3 en Abril 2019

mean(OA19)
## [1] 36.63769
median(OA19)
## [1] 36.715
mfv(OA19)
##  [1] 10.76 15.90 18.46 21.30 22.67 23.65 24.20 25.88 25.91 29.28 31.31 32.18
## [13] 32.47 33.24 33.48 34.77 35.01 36.03 36.67 36.76 36.78 37.29 37.45 38.55
## [25] 41.22 41.26 41.53 41.54 42.16 42.18 43.46 43.87 48.03 49.26 49.70 50.86
## [37] 51.13 52.44 52.91 55.64 63.51
summary(OA19)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.49   25.38   36.72   36.64   48.84  103.00

PM10 en Abril 2019

mean(PA19)
## [1] 31.81057
median(PA19)
## [1] 28.31
mfv(PA19)
## [1] 22.29 23.33 24.75 25.50
summary(PA19)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  -13.33   21.61   28.31   31.81   39.55  174.54

Medidas de Tendencia de O3 y PM10 en Abril 2020

O3 en Abril 2020

mean(OA20)
## [1] 33.30324
median(OA20)
## [1] 33.825
mfv(OA20)
##  [1] 11.37 14.62 14.88 16.77 17.66 18.79 19.13 19.33 20.46 20.80 21.28 21.48
## [13] 23.24 23.41 25.02 25.31 26.15 26.91 27.16 27.57 28.15 28.68 29.87 31.53
## [25] 32.74 33.17 34.95 35.54 35.60 36.52 37.72 38.06 38.47 38.72 40.16 40.40
## [37] 40.64 40.66 40.72 41.07 42.09 42.29 42.51 43.13 43.36 43.48 44.64 44.90
## [49] 45.66 45.88 46.23 46.89 53.56
summary(OA20)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.23   23.24   33.83   33.30   43.35   64.34

PM10 en Abril 2020

mean(PA20)
## [1] 27.29667
median(PA20)
## [1] 26.075
mfv(PA20)
## [1]  9.20 19.98 23.10
summary(PA20)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  -84.90   16.02   26.07   27.30   36.71  213.19

Concluir

¿Este año tiene menor cantidad de contaminantes atmosféricos que el año pasado?

Por lo que podemos observar en las columnas de O3 y PM10 se puede decir que si, hay menor cantidad de contaminantes.

¿Cuál es la influencia de la pandemia sobre la calidad del aire?

La pandemia influyo mucho a esta disminucion de contaminacion ya que debido a esta misma la gente se mantuvo encerrada en casa y solo salir cuando algo fuera indispensable, reduciendo el uso de automoviles y hubo cierres temporales en fabricas innecesarias por lo cual la pandemia tuvo impacto positivo en medio ambiente.

¿Que periodos de este año están más contaminados que el año pasado?

El año 2019 se encuentra con niveles mas altos de O3 y PM10 debido a que no habia cuarentena en ese año, por lo cual el año 2019 estuvo mas contaminado de lo que estara nuestro año 2020.

¿Por qué un año está más contaminado que otro en ciertos periodos?

Debido a la pandemia global que se esta viviendo actualmente, las personas podian salir a su gusto sin preocupaciones y el uso de automoviles era mayor y debido a esto habia mas contaminacion.

Conclusión:

Queda por analizar y concluír que gracias a los métodos establecidos con anterioridad, se puede observar un cambio en los datos recaudados del año pasado y este año, en las fechas que iba iniciando la cuarentena. También podemos notar que en este año existe menos contaminación que el año pasado, gracias a que las personas no salen de sus casas y por lo tanto no hay tanta contaminación en el aire que puede ser causada por automóviles, trabajos en tierras, industrias, contaminación en general. Debido a los analisis que hicimos anteriormente, podemos observar que si hubo un gran cambio el año 2019 al 2020, podemos decir que esto es un impacto positivo obviamente para el medio ambiente, pero afecta negativamente a la vida de ciertas personas, y se puede especular que si el mundo sigue en cuarentena puede haber mas cambios positivos en la disminucion de estos contaminantes.