PRIMER EJERCICIO DE PROBABILIDAD Y ESTADISTICA: TABLAS, HISTOGRAMAS Y POLIGONOS DE DISTRIBUCIONES DE FRECUENCIA.

*Este ejercicio usa datos de las normales climatologicas del periodo de 1951 a 2010 de Mazamitla, Jalisco

Estos datos pueden ser encontrados en el siguiente enlace: https://smn.conagua.gob.mx/es/informacion-climatologica-por-estado?estado=jal

ob <- c(13.3,     14.2,     16.1,     18.0,     19.0,     18.0,    16.4,     16.5,     16.3,     15.8,     14.9,     13.9)

Ordenar datos

  • De menor a mayor
sort(ob,decreasing=FALSE)
##  [1] 13.3 13.9 14.2 14.9 15.8 16.1 16.3 16.4 16.5 18.0 18.0 19.0
  • De mayor a menor
sort(ob,decreasing=TRUE)
##  [1] 19.0 18.0 18.0 16.5 16.4 16.3 16.1 15.8 14.9 14.2 13.9 13.3

Histogramas, poligonos y tablas de distribuciones de frecuencia

Usando tabla de distribución de frecuencia segun Sturges

  • Aqui se ordenan los datos para poder analizar de manera ordenada los datos. También desde aqui se puede observar que el rango de temperaturas con mas datos es el 15.58 - 16.78
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
tabla<- fdt(ob)
tabla
##     Class limits f   rf rf(%) cf  cf(%)
##  [13.167,14.372) 3 0.25 25.00  3  25.00
##  [14.372,15.576) 1 0.08  8.33  4  33.33
##  [15.576,16.781) 5 0.42 41.67  9  75.00
##  [16.781,17.985) 0 0.00  0.00  9  75.00
##   [17.985,19.19) 3 0.25 25.00 12 100.00

Histogramas y poligonos

Absolutos

  • Histograma de frecuencia absoluta
  • Aqui se muestran los datos de la temperatura, donde se puede observar que las temperaturas 15.58 - 16.78 son las que mayor se presentan durante el año en Mazamitla.
plot(tabla, type = "fh")

  • Poligonos de frencuencia absoluta **Este representa que las temperaturas medias son las que más se repiten por lo tanto las medidas de tendencia central si resumen las temperaturas de dicho poblado.
plot(tabla, type = "fp")

Relativos

  • Histograma
plot(tabla, type = "rfh")

  • Poligono
plot(tabla, type = "rfp")

Acumulados

  • Histograma
  • En este se muestra que dos barras de temperaturas tienen la misma frecuencia, esto se interpreta como que el segundo rango de temperaturas no tiene datos dentro, por lo tanto no se suma en las frecuencias acumuladas.
plot(tabla, type = "cfh")

*Poligono

plot(tabla, type = "cfp")

Medidas de tendencia central

Media

  • Se calcula la media sumando todos las temperaturas y dividiendo entre 12, por lo que se concluye que el valor predominante en estas es de 16.03 como se muestra.
mean(ob)
## [1] 16.03333

Mediana

  • Al obtener la mediana, se observa que los datos centrales de las temperaturas si están cercanas al promedio, por lo tanto éstas están distribuidas de buena manera.
median(ob)
## [1] 16.2

Moda

  • Las temperaturas suelen ser muy cambiantes, pero dentro de estas, dos se repiten por lo tanto es la moda.
library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
mlv(ob,method = "mfv")
## [1] 18

##Cuatiles * Los cuarties nos sirven para evaluar con rapidez la tendencia central de los datos.

summary(ob)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   13.30   14.72   16.20   16.03   16.88   19.00

Grafico de cajas y bigotes

  • Después del analisis de este gráfico, me pude dar cuenta de que la media está un poco más acercada al tercer cuartil
boxplot(ob)