#CORRECCION DEL EXAMEN
#NOMBRE: CHICAIZA MAYRA
#TITULO: Impacto Ambiental
#PLANTEAMIENTO DEL PROBLEMA
#Un ambiente puro es vital para el desarrollo de los seres vivos por ello atravez de el analisis estadístico podemos obtener informacion util, extraer conclusiones y tomar desiciones hacerca del tema del problema. Como caso de estudio consideramos el cantón Rumiñahui, provincia de Pichincha.
#OBJETIVOS
#GENERAL
#Aplicar la estadística para el tratamiento de datos de la producción diaria de basura dentro del cantón Rumiñahui, provincia de Pichincha.
#ESPECIFICOS
#1.-Analizar la situación actual y comportamiento deL medio ambiente ya que esta relacionado con la producción de basura en el cantón Rumiñahui, provincia de Pichincha a través de sus características importantes y medidas estadísticas.
#2.-Establecer relaciones entre variables de los datos de la producción diaria de basura en el cantón Rumiñahui, provincia de Pichincha con el fin de realizar estimaciones.
#3.-Emplear un modelo de probabilidad para establecer conclusiones acerca de la cantidad de basura por vivienda a partir de los resultados de la muestra.
#MAPA DE UBICACION
library(magick)
## Linking to ImageMagick 6.9.9.14
## Enabled features: cairo, freetype, fftw, ghostscript, lcms, pango, rsvg, webp
## Disabled features: fontconfig, x11
setwd("~/CORRECCION_EXAMEN")
image_read("Mapa.png")

#METODOLOGIA
#POBLACION: Todas las viviendas del cantón Rumiñahui
#U={x/x es vivienda^ubicacion(x)=cantón Rumiñahui^provincia(x)=Pichincha}"
#INDIVIDUO: Cada una de las viviendas
#Xi; i= 1.......N
#MUESTRA: M={c1, c2, c3.......c37}
#TABLA DE VARIABLES
#Archivo csv
TABLA_DE_VARIABLES<-read.csv("TABLA_DE_VARIABLES.csv", header = TRUE, sep = ";", dec = ".")
VARIABLE<-data.frame(
Variable=c("N de vivienda","Habitantes por vivienda","Basura por vivienda"),
Descripcion=c("Simbolo que representa una secuencia ordenada de viviendas","Número de personas que conviven en una misma residencia domiciliaria ","Cantidad de desechos sólidos presentes en cada una de las residencias"),
Tipo=c("Cuantitativa","Cuantitativa","Cuantitativa"),
SubTipo=c("Continua","Discreta","Continua"),
Dominio=c("N={x/x ? R+ u {0}}","N={x/x ? Z+ u {0}}","N={x/x ? R+ u {0}}"),
Rango=c("36","11","12"),
Instrumento_Medicion=c("Observación","Observación","Balanza"),
Sistema_unidades=c("-","personas","kg/dia"),
Escala_Medicion=c("intervalo","razón","razón"))
#TABLA DE VARIABLES
VARIABLE
## Variable
## 1 N de vivienda
## 2 Habitantes por vivienda
## 3 Basura por vivienda
## Descripcion
## 1 Simbolo que representa una secuencia ordenada de viviendas
## 2 Número de personas que conviven en una misma residencia domiciliaria
## 3 Cantidad de desechos sólidos presentes en cada una de las residencias
## Tipo SubTipo Dominio Rango Instrumento_Medicion
## 1 Cuantitativa Continua N={x/x ? R+ u {0}} 36 Observación
## 2 Cuantitativa Discreta N={x/x ? Z+ u {0}} 11 Observación
## 3 Cuantitativa Continua N={x/x ? R+ u {0}} 12 Balanza
## Sistema_unidades Escala_Medicion
## 1 - intervalo
## 2 personas razón
## 3 kg/dia razón
setwd("~/CORRECCION_EXAMEN")
Datos<-read.csv("PRODUCCION_DE_BASURA_E.csv", header = TRUE, sep = ";", dec = ".")
Habitantes<-Datos$Habitantes_por_vivienda
Habitantes
## [1] 2 5 7 1 4 5 11 6 11 3 3 5 6 9 4 7 10 10 6 6 8 7 9
## [24] 6 4 9 8 12 5 4 4 3 7 8 2 5 5
#Tabla de distribucion de frecuencia de la cantidad de habitantes por vivienda
TDFDiscreta<-table(Habitantes)
TDFDiscreta
## Habitantes
## 1 2 3 4 5 6 7 8 9 10 11 12
## 1 2 3 5 6 5 4 3 3 2 2 1
barplot(TDFDiscreta, main = "GRAFICO N°1\n Distribución de la cantidad de habitantes\n por vivienda", xlab = "Habitantes", ylab = "Cantidad", col ="blue",ylim = c(0,37))

#Tabla de distribucion de frecuencia del porcentaje de habitantes por vivienda
hi<-(TDFDiscreta/37)*100
hi
## Habitantes
## 1 2 3 4 5 6 7
## 2.702703 5.405405 8.108108 13.513514 16.216216 13.513514 10.810811
## 8 9 10 11 12
## 8.108108 8.108108 5.405405 5.405405 2.702703
barplot(TDFDiscreta,main = "GRAFICO N°2\n Distribución del porcentaje de los habitantes\n por vivienda",xlab = "habitantes", ylab = "Porcentaje", col = "red", ylim = c(0,100))

#Diagranma de caja y bigotes
boxplot(x=Datos$Habitantes_por_vivienda, horizontal = TRUE, ylim=c(1,12),col = "blue", main="GRAFICO N°3\n Diagrama de caja y bigotes para la variable habitantes\n por vivienda")

#OJIVA ASC
ni<-(hi*37)/100
ni
## Habitantes
## 1 2 3 4 5 6 7 8 9 10 11 12
## 1 2 3 5 6 5 4 3 3 2 2 1
Ni_anterior <-0
Ni<-0
for(i in 1:12){
Ni[i]<-ni[i]+Ni_anterior
Ni_anterior<-Ni[i]
}
Ni
## [1] 1 3 6 11 17 22 26 29 32 34 36 37
#grafico
plot(c(1:12), Ni, col= "blue", main ="GRAFICO N°4\n Ojiva ascendente de la cantidad de habitantes\n por vivienda", xlab = "Habitantes por vivienda", ylab = "cantidad")

#OJIVA DSC
ni<-(hi*37)/100
ni
## Habitantes
## 1 2 3 4 5 6 7 8 9 10 11 12
## 1 2 3 5 6 5 4 3 3 2 2 1
Ni_anterior_dsc<-0
Ni_dsc<-0
for(j in 12:1){
Ni_dsc[j]<-ni[j]+Ni_anterior_dsc
Ni_anterior_dsc<-Ni_dsc[j]
}
Ni_dsc
## [1] 37 36 34 31 26 20 15 11 8 5 3 1
#grafico
plot(c(1:12), Ni_dsc, col= "red",main = "GRAFICO N°5\n Ojiva descendente de la cantidad de habitantes\n por vivienda",xlab = "Habitantes por vivienda", ylab = "cantidad" )

#OJIVA ASC Y DSC
xi<-c(1:12)
plot(xi,Ni,type ="p", main="GRAFICO N°6\n Ojiva descendente de la cantidad de habitantes\n por vivienda", col="blue", xlab = "Habitantes por vivienda", ylab = "cantidad")
lines(Ni_dsc, type ="p", col= "red")

#TENDENCIA CENTRAL
Media<-mean(Habitantes)
Media
## [1] 6.135135
Mediana<-median(Habitantes)
Mediana
## [1] 6
Moda<- 5
Moda
## [1] 5
#INDICADORES DE DISPERCION
Varianza<-sd(Habitantes)^2
Varianza
## [1] 7.509009
Desviacion_Estandar<- sd(Habitantes)
Desviacion_Estandar
## [1] 2.740257
Coeficiente_Variancion<-(Desviacion_Estandar/Media)*100
Coeficiente_Variancion
## [1] 44.66498
#INDICADORES DE FORMA
library(e1071)
Sesgo<-skewness(Habitantes)
Sesgo
## [1] 0.2801892
Curtosis<-kurtosis(Habitantes)
Curtosis
## [1] -0.7595902
#"CONCLUSIONES"
#"1.-Los valores de los habitantes por vivienda fluctuan entre 1 y 12 y su promedio esta alrededor de 6 siendo un conjunto de datos heterogeneo. Los valores se acumulan moderadamente en los valores mediosbajos de la variable por lo tanto el comportamiento de la variable es algo perjudicial para el Impacto ambiental relacionado conla produccion de basura de los habitantes del cantón Rumiñahui "
#VARIABLE CONTUNUA
basurah<-Datos$Basura_por_vivienda_.Kg.día.
basurah
## [1] 1.71 4.50 5.15 0.96 1.65 2.50 9.42 3.76 10.56 2.72 0.98
## [12] 1.80 2.26 6.40 3.25 3.71 7.84 6.66 4.44 3.90 4.08 4.30
## [23] 5.57 2.58 2.77 6.75 5.84 12.96 3.72 2.16 1.96 2.08 5.00
## [34] 5.44 1.14 3.21 4.14
min(basurah)
## [1] 0.96
max(basurah)
## [1] 12.96
R<-max(basurah)-min(basurah)
R
## [1] 12
k<-sqrt(37)
k
## [1] 6.082763
A<-k/R
A
## [1] 0.5068969
#Histograma de la cantidad de basura por vivienda
Histograma<-hist(basurah,freq=TRUE, breaks=c(0.96, 2.96, 4.96,6.96,8.96, 10.96, 12.98), main="GRAFICO N°7\n Histograma de producción de basura por vivienda ", xlab="Producción de basura (kg/dia)", ylab = "cantidad", col = "blue")
## Warning in plot.histogram(r, freq = freq1, col = col, border = border,
## angle = angle, : the AREAS in the plot are wrong -- rather use 'freq =
## FALSE'
#poligono de frecuencia
lines(c(min(basurah),Histograma$mids,max(basurah)),c(0,Histograma$counts,0), col="red")
library(lattice)

histogram(main= "GRAFICO N°8\n Histograma del porcentaje\n de producción de basura por vivienda",ylab="Porcentaje", xlab="Producción de basura por vivienda", basurah, type=c("percent"), breaks=c(0.96, 2.96, 4.96,6.96,8.96, 10.96, 12.98))
## Warning in histogram.formula(x = ~x, xlab = "Producción de basura por
## vivienda", : type='percent' can be misleading in this context

#Diagrama de caja y bigotes
caja<-boxplot(basurah, main= "GRAFICO N°9\n Diagrama de caja y bigotes\n de la variable producción Basura por vivienda", horizontal = TRUE)

caja$out
## [1] 10.56 12.96
#ojivas
ni<-Histograma$counts
ni
## [1] 14 11 8 1 2 1
Ni_anterior <-0
Ni<-0
for(i in 1:6){
Ni[i]<-ni[i]+Ni_anterior
Ni_anterior<-Ni[i]
}
Ni
## [1] 14 25 33 34 36 37
Ni_anterior_dsc<-0
Ni_dsc<-0
for(j in 6:1){
Ni_dsc[j]<-ni[j]+Ni_anterior_dsc
Ni_anterior_dsc<-Ni_dsc[j]
}
Ni_dsc
## [1] 37 23 12 4 3 1
#ojiva descencendente
plot(c(2.96, 4.96, 6.96, 8.96, 10.96,12.96),Ni, type = "b", xlim=c(0,13),ylim = c(0,37), col="red",xlab = " Producción de basura por vivienda", ylab = "Cantidad", main = "GRAFICO N°10\n Ojiva ascendente y descendente\n de la cantidad de producción de basura por vivienda")
lines(c(2.96, 4.96, 6.96, 8.96, 10.96,12.96),Ni_dsc, add=T, type="b")
## Warning in plot.xy(xy.coords(x, y), type = type, ...): "add" is not a
## graphical parameter

plot(c(2.96, 4.96, 6.96, 8.96, 10.96,12.96),Ni, type = "b", xlim=c(0,13),ylim = c(0,100), col="red",xlab = "Producción de basura por vivienda", ylab = "Porcentaje", main = "GRAFICO N°11\n Ojiva ascendente y descendente\n del porcentaje de producción de basura por vivienda")
lines(c(2.96, 4.96, 6.96, 8.96, 10.96,12.96),Ni_dsc, add=T, type="b")
## Warning in plot.xy(xy.coords(x, y), type = type, ...): "add" is not a
## graphical parameter

#TENDENCIA CENTRAL
Media<-mean(basurah)
Media
## [1] 4.266757
Mediana<-median(basurah)
Mediana
## [1] 3.76
c<-"Moda\n [2,96:4,96] "
c
## [1] "Moda\n [2,96:4,96] "
#INDICADORES DE DISPERCION
Varianza<-sd(basurah)^2
Varianza
## [1] 7.257011
Desviacion_Estandar<- sd(basurah)
Desviacion_Estandar
## [1] 2.693884
Coeficiente_Variancion<-(Desviacion_Estandar/Media)*100
Coeficiente_Variancion
## [1] 63.13657
#INDICADORES DE FORMA
library(e1071)
Sesgo<-skewness(basurah)
Sesgo
## [1] 1.277525
Curtosis<-kurtosis(basurah)
Curtosis
## [1] 1.530537
#CONCLUSIONES
#1.-Los valores de la cantidad de basura por vivienda fluctuan entre 0,96 y 12,96 y su promedio esta alrededor de 4,26 siendo un conjunto de datos heterogeneo. Los valores se acumulan moderadamente en los valores bajos de la variable por lo tanto el comportamiento de la variable es algo beneficioso para el Impacto ambiental relacionado con la produccion de basura de los habitantes del cantón Rumiñahui
library(PASWR)
## Loading required package: MASS
v<-"BASURA POR VIVIENDA"
cat(v)
## BASURA POR VIVIENDA
EDA(basurah)
## [1] "basurah"

## Size (n) Missing Minimum 1st Qu Mean Median TrMean 3rd Qu
## 37.000 0.000 0.960 2.210 4.267 3.760 4.113 5.505
## Max. Stdev. Var. SE Mean I.Q.R. Range Kurtosis Skewness
## 12.960 2.694 7.257 0.443 3.295 12.000 1.531 1.278
## SW p-val
## 0.002
v<-"HABITANTES POR VIVIENDA"
cat(v)
## HABITANTES POR VIVIENDA
EDA(Habitantes)
## [1] "Habitantes"

## Size (n) Missing Minimum 1st Qu Mean Median TrMean 3rd Qu
## 37.000 0.000 1.000 4.000 6.135 6.000 6.114 8.000
## Max. Stdev. Var. SE Mean I.Q.R. Range Kurtosis Skewness
## 12.000 2.740 7.509 0.450 4.000 11.000 -0.760 0.280
## SW p-val
## 0.480