Primer Ejercicio de Probabilidad y Estadistica: Tablas Histogramas y poligonos de distribucion de frecuencia

  • Se Obtuvieron datos de las normales climatologicas del periodo de 1951 a 2010 de Ciudad Altamirano, Estacion 00012019 CIUDAD ALTAMIRANO en: NORMALES CLIMATOLÓGICAS Archivo txt: NORMAL12019.TXT

Cada elemento representa la temperatura de los meses desde Enero a Diciembre.

alttemp <- c(25.4, 27.1, 29.5, 31.7, 32.5, 30.2, 27.9, 27.5, 27.4, 27.6, 26.8, 25.4)

Ordenar datos

Los datos obtenidos se procesan para organizarce de menor a mayor, usando la función sort.

  • En este caso puede dejarse solo nuestro vector o indicar mediante el parámetro decreasing que sea igual a FALSE
sort(alttemp,decreasing = FALSE)
##  [1] 25.4 25.4 26.8 27.1 27.4 27.5 27.6 27.9 29.5 30.2 31.7 32.5

Al contrario del caso anterior los elementos se organizan de mayor a menor

  • En la función sort se indica el parámetro decreasing igual a TRUE
sort(alttemp, decreasing = TRUE)
##  [1] 32.5 31.7 30.2 29.5 27.9 27.6 27.5 27.4 27.1 26.8 25.4 25.4

Tabla de distribucion de Frecuencia

Permite distribuir y ordenar una serie de datos a manera de columnas del numero de veces que se repiten, en otras palabras representan su frecuencia.

Murray R. Spiegel. Teoría y Práctica de Estadística

Se obtiene una tabla de distribucion de frecuencias utilizando nuestro vector alttemp definido anteriormente, con la funcion fdt de la biblioteca fdth

 library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
tb <- fdt(alttemp)
tb
##     Class limits f   rf rf(%) cf  cf(%)
##  [25.146,26.682) 2 0.17 16.67  2  16.67
##  [26.682,28.218) 6 0.50 50.00  8  66.67
##  [28.218,29.753) 1 0.08  8.33  9  75.00
##  [29.753,31.289) 1 0.08  8.33 10  83.33
##  [31.289,32.825) 2 0.17 16.67 12 100.00

Histogramas y poligonos

Es la representación grafica de las distribuciones de frecuencia.

  • Histograma Gráfico que representa la distribucion de frecuencia en forma de barras utilizando el eje X como el rango en los que se encuntran los datos y el eje Y representando la frecuencia.

  • Poligono Gráfico que representa la distribucion de frecuencia en forma de puntos que pueden ser obtenidos del histograma utilizando los puntos medios de la parte superir de cada bloque.

Murray R. Spiegel. Teoría y Práctica de Estadística

Absolutos

  • Histograma de Frecuencia Absoluta

  • Frecuencia absoluta Representa la información acerca de la cantidad de veces que se repite un suceso en este caso la Temperatura

El histograma se realizo utilizando la tabla obtenida tb con los datos del vector ya definido. la funcion plot nos premite crear el histograma, indicando en el parametro type el tipo de histograma.

plot(tb, type="fh")

  • Poligono de Frecuencia Absoluta

El poligono se realiza de la misma manera solo cambiando el valor del parametro type, en este caso indicamos con la siguiente notacón fp.

plot(tb, type="fp")

Relativos

  • Histograma de Frecuencia Relativa

  • Frecuencia relativa Representa la frecuencia absoluta dividida entre el numero de elementos.

plot(tb, type="rfh")

* ### Poligono de Frecuencia Relativa

plot(tb, type="rfp")

Acumulados

  • Histograma de Frecuencia Acumulada

  • Frecuencia acumulada Representa la suma en secuencia de la frecuencia absoluta.

plot(tb, type="cfh")

  • Poligono de Frecuencia Acumulada

plot(tb, type="cfp")

Medidas de Tendencia Central

Son medidas que resumen tratan de resumir un conjunto de elementos a uno solo. Representan el punto medio entre el conjunto de elementos.

Media

  • Representea el valor promedio de un conjunto de valores, calculandose al obtener la suma de todos los elementos y dividirla entre la cantidad de elementos

mean(alttemp)
## [1] 28.25

Mediana

  • Es la parte central que parte el conjunto de elementos en 2, dejando la misma cantidad de valores en cada lado.

median(alttemp)
## [1] 27.55

Moda

  • Es el valor que aparece mayor cantidad de veces en un conjunto de valores.

library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
mlv(alttemp, method="mfv")
## [1] 25.4

Cuantiles

  • Son valores o medidas que dividen el conjunto de valores en partes iguales, descartando la parte central para la separacion de datos.

summary(alttemp)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   25.40   27.02   27.55   28.25   29.68   32.50

Grafico de Caja y bigote

  • Es una representacion grafica para mostrar un conjunto de datos numericos, atráves de sus cuantiles. donde la primer linea representa el extremo inferior(minimo), el primer cuantil va desde inferior al 25%, la linea central representa la mediana y el 3er cuantil desde el inicio al 75% y la ultima linea representa el extremo superior(maximo).

boxplot(alttemp)