U1A1

HéctorZapata

26/10/2020

¿Cómo es la problemática de la basura en México?

A continuacion haremos un analisis en el cual podremos observar los datos reales y como evolucionan con el tiempom esto con la finalidad de ver y comprender el grabe problema que se vive en mexico.

Importemos los datos

Estos datos representan las millones de toneladas de basura que a generado mexico desde el año de 1992 hasta el 2012

 library(readr)
library(DT)
library(tidyverse)
## -- Attaching packages ---------------------------------------------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.2     v dplyr   1.0.2
## v tibble  3.0.3     v stringr 1.4.0
## v tidyr   1.1.1     v forcats 0.5.0
## v purrr   0.3.4
## -- Conflicts ------------------------------------------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(ggplot2)
library(car)
## Loading required package: carData
## 
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
## 
##     recode
## The following object is masked from 'package:purrr':
## 
##     some
basuramx <- read_csv("~/Probabilidad y Estadistica/basuramx.csv")
## Parsed with column specification:
## cols(
##   anio = col_double(),
##   basura = col_double()
## )
datatable(basuramx)
names(basuramx)
## [1] "anio"   "basura"

Analisis de correlación

  • Matriz de diagramas de dispercion Al ser estos valores los unicos con los que se esta trabajando, el la matriz adopta esta forma y vemos que hay una relacion entre el anio en cuanto al crecimiento de la basura.
pairs(basuramx)

## Analisis de correlacion lineal A continuacion se hara una cuantificacion del grado de relacion lineal, por medio de la matriz de coeficientes de correlacion, esto con el fin de ver la relacion entre las 2 entidades que estamos evaluando

cor(basuramx)
##             anio    basura
## anio   1.0000000 0.9503863
## basura 0.9503863 1.0000000

Diagrama de dispercion

En este diagrama podemos observar como se comportan los datos, en este caso tenemos la facilidad de observar como crecen las millones de toneladas de basura en mexico en funcion a al año. Podemos observar que tiende a crecer al pasar los años.

ggplot(data = basuramx, aes(x = basuramx$anio, y = basuramx$basura)) + 
  geom_point(colour = "magenta") +
  ggtitle("Diagrama de dispersión") +
  theme_bw() +
  theme(plot.title = element_text(hjust = 0.5))

## Recta de minimos cuadrados Esta recta nos serve para predecir un valor determinado en nuestra grafica, su funcion es acercarse lo mas posible a cada unos de los datos recopilados.

regresion <- lm(basuramx$basura ~basuramx$anio, data = basuramx)
summary(regresion)
## 
## Call:
## lm(formula = basuramx$basura ~ basuramx$anio, data = basuramx)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4015.9  -439.2  -287.5   911.8  2993.4 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   -1.459e+06  1.121e+05  -13.02 6.46e-11 ***
## basuramx$anio  7.456e+02  5.599e+01   13.32 4.38e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1554 on 19 degrees of freedom
## Multiple R-squared:  0.9032, Adjusted R-squared:  0.8981 
## F-statistic: 177.4 on 1 and 19 DF,  p-value: 4.376e-11

Podemos decir que la ecuacion de la recta de minimos cuadrados es

\[y =(-1.459e06) + (7.456e+02)x \]

Graficando la recata de minimos cuadrados

En esta grafica tenemos visualizada la recta que mas cerca se encueantra de los datos, por lo que podemos predecir cuntos millones de toneladas de basura genera mexico en X tiempo.

plot(basuramx$anio,basuramx$basura, xlab = "Año", ylab="Toneladas de basura")
abline(regresion)

Calculo de confianza

Aqui calcularemos el grado de confianza de nuestro modelo de regresion linea simple.

confint(regresion)
##                       2.5 %        97.5 %
## (Intercept)   -1693960.6387 -1224728.5864
## basuramx$anio      628.4563      862.8369

Obteniendo los residuos

residuos <-rstandard(regresion)

Obteniendo los valores ajustados

ajustados <- fitted(regresion)

Graficamos los residuos vs los valores ajsutados

plot(ajustados,residuos )

Grafica de noramlidad

qqnorm(residuos)
qqline(residuos)

Primero para resolver un problema se deben efectuar los siguientes pasos:

1. Plantear una pregunta: ¿Cómo es el problema de la basura en México?

Este problema se ve afectado a la insuficiencia con la que tratamos la basura, como es que el gobierno mexicano no es capaz de generar soluciones a dicho problema, en Suecia se recicla el 99% de la basura convirtiéndolo en el país con mayor índice de reciclaje en el mundo, este dato no viene de la nada fue extraido de esta pagina(https://www.cnnchile.com/lodijeronencnn/estos-son-los-paises-lideres-en-reciclaje_20180814/#:~:text=Suecia%20es%20el%20único%20país,1%2F4%20de%20la%20población.) ahora que ya sabemos que tan grabe es el problema en México, como se puede solucionar? _________________________________________________________________________________________________ ### 2. Plantear hipótesis h0: El problema no solamente es grave, va en aumento. Este problema va en aumento y cada año va peor, la hipótesis fue desarrollada gracias a este análisis que hicimos posterior mente el cual nos arroja una relación entre el año y con ayuda de la recta de mínimos cuadrados miramos que tiene una tendencia a aumentar en millones de toneladas, esto es un fenómeno de esperarse, pero… ¿por qué? lo que pasa es que en México el gobierno no da incentivos a los ciudadanos que reciclen o ordenen su basura, por lo que no se está desarrollando una cultura en el reciclaje y por ende cada año que pasa aumenta más y más el nivel de basura. ________________________________________________________________________________________________________ ### 3. Recabar datos: ¿qué datos necesitamos? los datos que necesitamos son 2 datos muy sencillos, año y basura en toneladas, aparte de esos datos se tiene la relación de N año y X cantidad de basura de ese año por lo que los datos serán una tabla con los años y la cantidad de basura recaudada en ese año y así podremos modelar y analizar los datos como lo hicimos en el análisis anterior


Como podemos predecir el peso de un año (N)?

gracias a la formula de la recta de minimos cuadrados podemos observar el crecimiento de las millones de toneladas de basura que se acumula en Mexico, por lo que con esa recta se puede predecir el crecimiento de la cantidad de toneladas de basura en un año y esa recta tiene como ecuación:

\[y =(-1.459e06) + (7.456e+02)x \]