Estadisticas para las ciencias analiticas

Problema 4:

Durante los ultimos 25 dias, en el distrito de Pueblo libre se registro los indicadores de impacto ambiental.

Determinar la distribucion de frecuencias y un histograma.

Paso 1: Creamos la Base de Datos "contaminante"

contaminante <-c(0.3667,3.067,0.767,4.133,2.000,1.900,1.467,
3.567,4.200,4.900,0.800,4.633,4.233,4.567,3.333,1.933,2.667,
3.333,0.600,4.000,1.133,3.200,2.767,3.033,1.633)

contaminante
##  [1] 0.3667 3.0670 0.7670 4.1330 2.0000 1.9000 1.4670 3.5670 4.2000 4.9000
## [11] 0.8000 4.6330 4.2330 4.5670 3.3330 1.9330 2.6670 3.3330 0.6000 4.0000
## [21] 1.1330 3.2000 2.7670 3.0330 1.6330
summary(contaminante)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.3667  1.6330  3.0330  2.7293  4.0000  4.9000

Paso 2: Colocamos los datos en una tabla, y calculamos las frecuencias absolutas, relativas y los porcentajes

Para ello utilizaremos el paquete "fdth", y como regla empirica para los intervalos utilizaremos la raiz cuadrada de n.

library(fdth)
## Warning: package 'fdth' was built under R version 4.0.5
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
d <-length(contaminante)
d
## [1] 25
intervalos <-trunc(d^0.5+.999)
intervalos
## [1] 5
R <-diff(range(contaminante))
R
## [1] 4.5333
A<- R/intervalos
A
## [1] 0.90666
bb<-min(contaminante)+(0:intervalos)*A
bb
## [1] 0.36670 1.27336 2.18002 3.08668 3.99334 4.90000

Fianlmente tenemos la tablas de frecuencias absolutas, frecuencias relativas y porcentajes.

dist<-fdt(contaminante,start=min(contaminante),end=max(contaminante), h=0.9066)
dist
##  Class limits f   rf rf(%) cf cf(%)
##  [0.367,1.27) 5 0.20    20  5    20
##   [1.27,2.18) 5 0.20    20 10    40
##   [2.18,3.09) 4 0.16    16 14    56
##   [3.09,3.99) 4 0.16    16 18    72
##    [3.99,4.9) 6 0.24    24 24    96

Paso 3: Realizamos el histograma

hist(contaminante,main="Histograma del Contaminante", xlab= "Rango",ylab = "Frecuencia del rango",  col=3)

Histograma de acuerdo a los rangos establecidos.

h<-hist(contaminante,breaks=bb, main="Histograma del Contaminante", xlab="Rango modificado", ylab="Frecuencia del rango", col=10)