EJERCICIO DE PROBABILIDAD Y ESTADÍSTICA: TABLAS, HISTOGRAMAS Y POLIGONOS DE DISTRIBUCIONES DE FRECUENCIA.

Importar datos

  • En este ejercicio se mostrarán los datos de las nomales climatológicas del periodo 1951 a 20010 de Batacosa, Sonora.
ob <- c(16.0, 17.3, 19.2, 22.1, 25.4, 29.6, 30.2, 29.2, 28.5, 25.2, 20.1, 16.4)

Ordenar datos

  • La función sort devuelve ordenado, en orden ascendente por defecto, el vector que pases como entrada.

Ordenar datos de menor a mayor

  • Aquí utilizamos el la función sort para ordenar los datos de menor a mayor. Declaramos decreasing como false.
sort(ob, decreasing = FALSE)
##  [1] 16.0 16.4 17.3 19.2 20.1 22.1 25.2 25.4 28.5 29.2 29.6 30.2

Ordenar datos de mayor a menor

  • Aquí utilizamos el la función sort para ordenar los datos de mayor a menor. Declaramos decreasing como true.
sort(ob, decreasing = TRUE)
##  [1] 30.2 29.6 29.2 28.5 25.4 25.2 22.1 20.1 19.2 17.3 16.4 16.0

Hostogramas, poligonos y tablas de distribucion de frecuencia

Histograma de frecuencia absoluta

  • Aquí utilizamos la función hist para imprimir el histograma de frecuencia de acuerdo a los datos anteriores.
hist(ob)

Tabla de distribucion de frecuencia

  • Aquí utilizamos la función library para imprimir la tabla de distribución de frecuencia con todos los datos requeridos, utilizando los datos anteriores.
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
tabla <- fdt(ob)
tabla
##   Class limits f   rf rf(%) cf  cf(%)
##  [15.84,18.77) 3 0.25 25.00  3  25.00
##   [18.77,21.7) 2 0.17 16.67  5  41.67
##   [21.7,24.64) 1 0.08  8.33  6  50.00
##  [24.64,27.57) 2 0.17 16.67  8  66.67
##   [27.57,30.5) 4 0.33 33.33 12 100.00

Histogramas y poligonos

  • Un histograma es una representación gráfica de una variable en forma de barras. La superficie de cada barra es proporcional a la frecuencia de los valores representados. Por otro lado, el polígono de frecuencias se forma uniendo los extremos de las barras del histograma mediante segmentos.

  • https://www.saberprogramas.com/histograma-poligono-frecuencias-excel/

Absolutos

Se muestra el histograma y poligono de frecuencia absoluta, las cuales implica ciertas funciones con codigo especifico para imprimir los datos deseados.

  • Histograma de frecuencia absoluta

Como podemos observar, se creó un histograma de freceuncia absoluta, el cual muestra en el lado izquierdo la frecuencia que se usa, mientras que la parte de abajo representa los limites en los que esta estructurada la información.

plot(tabla, type="fh")

  • Poligono de frecuencia absoluta

Acontinuación, se muestra un poligono de frecuencia absoluta, las cuales se conforman de dos partes. Los valores de la parte izquierda, se refiere a las frecuencia, caso similar al del histograma anterior. Por otro lado, los parametros de la parte de abajo, no muestran los limites de los datos recabados anteriormente. Basicamente se ponen puntos en medio de cada parametro, y se unen mediante rectas para ver su comportamiento.

plot(tabla, type="fp")

Relativos

Se muestra el histograma y poligono de frecuencia relativa, las cuales implica ciertas funciones con codigo especifico para imprimir los datos deseados.

  • Histograma de frecuencia relativa

Como podemos observar, se creó un histograma de freceuncia relativa, el cual muestra en el lado izquierdo la frecuencia que se usa, mientras que la parte de abajo representa los limites en los que esta estructurada la información.

plot(tabla, type="rfh")

  • Poligono de frecuencia relativa

Acontinuación, se muestra un poligono de frecuencia relativa, las cuales se conforman de dos partes. Los valores de la parte izquierda, se refiere a las frecuencia, caso similar al del histograma anterior. Por otro lado, los parametros de la parte de abajo, no muestran los limites de los datos recabados anteriormente. Basicamente se ponen puntos en medio de cada parametro, y se unen mediante rectas para ver su comportamiento.

plot(tabla, type="rfp")

Acomulados

Se muestra el histograma y poligono de frecuencia acomulada, las cuales implica ciertas funciones con codigo especifico para imprimir los datos deseados.

  • Histograma de frecuencia acomulada

Como podemos observar, se creó un histograma de freceuncia acomulada, el cual muestra en el lado izquierdo la frecuencia que se usa, mientras que la parte de abajo representa los limites en los que esta estructurada la información.

plot(tabla, type="cfh")

  • Poligono de frecuencia acomulada

Acontinuación, se muestra un poligono de frecuencia acomulada, las cuales se conforman de dos partes. Los valores de la parte izquierda, se refiere a las frecuencia, caso similar al del histograma anterior. Por otro lado, los parametros de la parte de abajo, no muestran los limites de los datos recabados anteriormente. Basicamente se ponen puntos en medio de cada parametro, y se unen mediante rectas para ver su comportamiento.

plot(tabla, type="cfp")

Medidas de tendencia central

  • La medida de tendencia central (moda,media y mediana), parámetro de tendencia central o medida de centralización es un número ubicado hacia el centro de la distribución de los valores de una serie de observaciones (medidas), en la que se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda.

https://es.wikipedia.org/wiki/Medidas_de_tendencia_central

Media

La media se refiere al promedio de todos los datos recolectados. Este se obtiene sumando todos los valores obtenidos dividos entre el numero de datos sumados.

mean(ob)
## [1] 23.26667

Mediana

La mediana la conocemos como le numero que se encuentra en el medio de todos los datos. Este se obtiene acomodando todos los datos de menor a mayor y buscar el numero que este exactamente en el medio de esta fila. En caso de haber dos numeros en el centro, tenemos que sumarlos y dividirlos entre 2.

median(ob)
## [1] 23.65

Moda

La moda es simplemente el numero que mas se repite en la serie de datos recolectados. Solo debemos de separa los datos obtenidos y ver cual es el que mas veces se repite. En caso de que ninguno se repita, la moda seran todos los datos que tenemos.

library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
mlv(ob, method = "mfv")
##  [1] 16.0 16.4 17.3 19.2 20.1 22.1 25.2 25.4 28.5 29.2 29.6 30.2

Cuantiles

  • Los cuantiles son puntos tomados a intervalos regulares de la función de distribución de una variable aleatoria.
summary(ob)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   16.00   18.73   23.65   23.27   28.68   30.20

Grafico de caja y bigotes

  • Un diagrama de caja es un método estandarizado para representar gráficamente una serie de datos numéricos a través de sus cuartiles.
boxplot(ob)