PRIMER EJERCICIO DE PROBABILIDAD Y ESTADISTICA: Tablas, Histogramas Y Poligonos de distribucion de frecuencia

Estos datos pueden ser encontrados en el siguiente enlace: https://smn.conagua.gob.mx/tools/RESOURCES/Normales5110/NORMAL26109.TXT

yec <- c(6.3, 6.7, 8.9, 11.9, 14.7, 19.4, 20.2, 19.7, 18.0, 13.0, 8.2, 6.4)

Ordenar datos

De menor a mayor

  • Muestra los datos agrupados en un orden de menor a mayor.
sort(yec, decreasing = FALSE)
##  [1]  6.3  6.4  6.7  8.2  8.9 11.9 13.0 14.7 18.0 19.4 19.7 20.2

De mayor a menor

  • Muestra los datos agrupados en un orden de mayor a menor.
sort(yec, decreasing = TRUE)
##  [1] 20.2 19.7 19.4 18.0 14.7 13.0 11.9  8.9  8.2  6.7  6.4  6.3

Histogramas, poligonos y tablas de distribuciones de frecuencia

TABLA de distribucion de frecuencia segun Sturges:

  • Criterio utilizado para determinar el número de clases o intervalos que son necesarios para representar gráficamente un conjunto de datos estadísticos.

** Referencia bibliografica: Torres, V. J. D. (2021, 14 abril). Regla de Sturges. Lifeder. https://www.lifeder.com/regla-sturges/

library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
tabla <- fdt(yec)
tabla
##   Class limits f   rf rf(%) cf  cf(%)
##   [6.237,9.07) 5 0.42 41.67  5  41.67
##    [9.07,11.9) 1 0.08  8.33  6  50.00
##   [11.9,14.74) 2 0.17 16.67  8  66.67
##  [14.74,17.57) 0 0.00  0.00  8  66.67
##   [17.57,20.4) 4 0.33 33.33 12 100.00

** Interpretacion: Muestra la tabla de frecuancia de los datos agrupados.

Histogramas y poligonos

Absolutos

plot(tabla, type="fh")

  • Poligonos de frecuencia absoluta: Es aquel que se puede establecer a partir de la unión de diferentes puntos medios de las columnas que forman la configuración de lo que conocemos como histograma de frecuencia. El polígono se caracteriza por usar todo el tiempo las columnas de tipo vertical y por nunca dejar espacio entre una columna y otra.

  • Referencia bibliografica: Pacheco, J. (2021, 10 mayo). “Polígono de Frecuencia” Definición, Objetivos y Características. Web y Empresas. Recuperado a partir de: https://www.webyempresas.com/poligono-de-frecuencia/

plot(tabla, type="fp")

Relativos

plot(tabla, type="rfh")

** Interpretacion: Muestra la frecuencia de los datos en la escala de valores mediante barras.

plot(tabla, type="rfp")

** Interpretacion: Muestra la frecuencia de los datos en la escala de valores mediante rectas y puntos de inflexion especificos.

Acumulados:

plot(tabla, type="cfh")

** Interpretacion: Muestra en orden creciente los valores de la tabla de datos agrupados, esto con el uso de barras y escalas.

plot(tabla, type="cfp")

** Interpretacion: Muestra igualmente en orden creciente los valores de la tabla de datos agrupados, pero en este caso con rectas y puntos de infelxion especificos en la escala de datos.

Medidas de tendencia central:

Media:

  • Es la suma de todos los datos dividida entre el numero total de datos.
mean(yec)
## [1] 12.78333

Mediana:

  • Es el valor de posicion central que parte la distribución de los valores en dos y ordenados de mayor a menor.
median(yec)
## [1] 12.45

Moda:

  • Es el dato que más veces se repite, es decir, aquel que tiene mayor frecuencia absoluta.
library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
mlv(yec, method = "mfv")
##  [1]  6.3  6.4  6.7  8.2  8.9 11.9 13.0 14.7 18.0 19.4 19.7 20.2

Cuantiles:

  • Son medidas de localización, su función es informar del valor de la variable que ocupará la posición que nos interese respecto de todo el conjunto de variables. Podemos decir que los Cuantiles son unas medidas de posición que dividen a la distribución en un cierto número de partes de manera que en cada una de ellas hay el mismo de valores de la variable.

  • Refrencia bibliografica: La Suma del Todo & Comunidad de Madrid. (s. f.). Estadistica Basica. Analisis de Riesgo. Recuperado 3 de septiembre de 2021, de http://www.madrid.org/cs/StaticFiles/Emprendedores/Analisis_Riesgos/pages/pdf/estadisticas_es.pdf

summary(yec)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   6.300   7.825  12.450  12.783  18.350  20.200

** Interpretacion: Se muestra el resumen de todos los valores generados, consecuencia de las formulas y modelos de los datos agrupados.

Grafico de caja y bigotes:

  • Son una presentación visual que describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría. Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o verticalmente.

  • Referencia bibliografica: Donoso Espejo, L. M. (s. f.). Diagrama de Caja y Bigotes. Guias Liceo. Recuperado 3 de septiembre de 2021, de http://inst-mat.utalca.cl/tem/sitiolmde/primero/guias-liceo/recuperacion/Diagrama_de_Caja_y_Bigotes-2.pdf

boxplot(yec)

  • Interpretacion: Se visualiza los extremos, superior e inferior, que se situan en 20.2 y 6.3 respectivamente, tambien se los cuartiles son señalados, siendo 7.825 el inferior y 18.35 el superior, y finalmente la median ahace presencia en el 12.450; todo esto con la escala en relacion a los valores de la tabla de frecuencia.