PRIMER EJERCICIO DE PROBABILIDAD Y ESTADISTICA: TABLAS, HISTOGRAMAS Y POLIGONOS DE DISTRIBUCIONES DE FRECUENCIA

Importar datos

  • Este ejercicio usa datos de las normales climatologicas del periodo de 1951 a 2010 de hermosillo Sonora, estacion HERMOSILLO II DGE.

Estos datos pueden ser encontrados en el siguiente enlace: https://smn.conagua.gob.mx/tools/RESOURCES/Normales5110/NORMAL26139.TXT

he <- c(16.8,   18.3,   20.4,   23.6,   27.3,   31.7,   32.3,   31.8,   30.8,   26.7,   21.1,   17.0)

Ordenar datos

Al ordenar los datos se pueden analizar de manera mas eficiente y mas facil.

De menor a mayor

En esta parte se estan ordenando los datos usando el metodo sort, en el cual se pone FALSE para que sea de menor a mayor.

sort(he, decreasing = FALSE)
##  [1] 16.8 17.0 18.3 20.4 21.1 23.6 26.7 27.3 30.8 31.7 31.8 32.3

De mayor a menor

En esta parte se estan ordenando los datos usando el metodo sort, en el cual se pone TRUE para que sea de mayor a menor.

sort(he, decreasing = TRUE)
##  [1] 32.3 31.8 31.7 30.8 27.3 26.7 23.6 21.1 20.4 18.3 17.0 16.8

Histogramas, poligonos y tablas de distribuciones de frecuencia

TABLA de distribucion de frecuencia segun Sturges

La tabla de distribución de frecuencias es una tabla que muestra la distribución de los datos mediante sus frecuencias. Se utiliza para variables cuantitativas o cualitativas ordinales.

Recuperado de: https://www.universoformulas.com/estadistica/descriptiva/tabla-frecuencias/

Para poder hacer la tabla primero debemos importar el metodo fdth, el cual usaremos para hacer la tabla de frecuencia.

library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
tabla <- fdt(he)
tabla
##     Class limits f   rf rf(%) cf  cf(%)
##   [16.632,19.83) 3 0.25 25.00  3  25.00
##   [19.83,23.028) 2 0.17 16.67  5  41.67
##  [23.028,26.227) 1 0.08  8.33  6  50.00
##  [26.227,29.425) 2 0.17 16.67  8  66.67
##  [29.425,32.623) 4 0.33 33.33 12 100.00

Histogramas y poligonos

Un histograma es la representación gráfica en forma de barras, que simboliza la distribución de un conjunto de datos.

Mientras que, un polígono de frecuencias se forma uniendo los extremos de las barras de un diagrama de barras mediante segmentos. También se puede realizar trazando los puntos que representan las frecuencias y uniéndolos mediante segmentos.

Recuperado de: https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/histograma.html#tema_que-es-un-histograma https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/poligonos-de-frecuencia.html

Absolutos

  • Histograma de frecuencia absoluta

Representa la frecuencia absoluta mediante la altura de las barras.

Para esto se necesita el metodo plot, en el cual usaremos el tipo “fh”.

plot(tabla, type="fh")

  • Poligonos de frecuencia absoluta

Estos se consiguen uniendo los puntos mas altos de cada barra del histograma de frecuencia absoluta.

Para esto se necesita el metodo plot, en el cual usaremos el tipo “fp”.

plot(tabla, type="fp")

Relativos

  • Histograma de frecuencia relativa

Representa la frecuencia relativa mediante la altura de las barras.

Para esto se necesita el metodo plot, en el cual usaremos el tipo “rfh”.

plot(tabla, type="rfh")

  • Poligono de frecuencia relativa

Estos se consiguen uniendo los puntos mas altos de cada barra del histograma de frecuencia relativa

Para esto se necesita el metodo plot, en el cual usaremos el tipo “rfp”.

plot(tabla, type="rfp")

Acumulados

  • Histograma de frecuencia acumulada

Es un gráfico acumulativo que representa la frecuencia relativa acumulada hasta cada valor de la variable.

Para esto se necesita el metodo plot, en el cual usaremos el tipo “cfh”.

plot(tabla, type="cfh")

  • Poligono de frecuencias acumuladas

Estos se consiguen uniendo los puntos mas altos de cada barra del histograma de frecuencia acumulada.

Para esto se necesita el metodo plot, en el cual usaremos el tipo “cfp”.

plot(tabla, type="cfp")

Medidas de tendencia central

La medida de tendencia central, parámetro de tendencia central o medida de centralización es un número ubicado hacia el centro de la distribución de los valores de una serie de observaciones (medidas), en la que se encuentra ubicado el conjunto de los datos.

Recuperado de: https://es.wikipedia.org/wiki/Medidas_de_tendencia_central

Media

La media, también conocida como promedio, es el valor que se obtiene al dividir la suma de un conglomerado de números entre la cantidad de ellos.

Recuperado de: https://www.questionpro.com/blog/es/la-media-la-mediana-y-la-moda/

Para conseguir la media se usa el metodo mean.

mean(he)
## [1] 24.81667

Mediana

En el ámbito de la estadística, la mediana representa el valor de la variable de posición central en un conjunto de datos ordenados. Se le denota mediana.

Recuperado de: https://es.wikipedia.org/wiki/Mediana_(estad%C3%ADstica)

Para conseguir la mediana se usa el metodo median.

median(he)
## [1] 25.15

Moda

En la estadística, la moda es el valor que aparece con mayor frecuencia en un conjunto de datos.

Recuperado de: https://es.wikipedia.org/wiki/Moda_(estad%C3%ADstica)

Para conseguir la moda, primero debemos importar la libreria modeest y usar el metodo mlv y entre parentesis el nombre del conjunto ademas de la palabra method = “mfv”.

library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
mlv(he, method = "mfv")
##  [1] 16.8 17.0 18.3 20.4 21.1 23.6 26.7 27.3 30.8 31.7 31.8 32.3

Cuantiles

Los cuantiles son puntos tomados a intervalos regulares de la función de distribución de una variable aleatoria.

Recuperado de: https://es.wikipedia.org/wiki/Cuantil

Para conseguir los cuantiles debemos usar el metodo summary.

summary(he)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   16.80   19.88   25.15   24.82   31.02   32.30

Grafico de caja y bigotes

Los diagramas de Caja-Bigotes son una presentación visual que describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría. Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o verticalmente.

Recuperado de: https://www.estadisticaparatodos.es/taller/graficas/cajas.html

Para hacer el grafico de caja y bigotes se usa el metodo boxplot.

boxplot(he)