PRIMER TAREA DE PROBABILIDAD Y ESTADISTICA: TABLAS, HISTOGRAMAS Y POLIGONOS DE DISTRIBUCIONES DE FRECUENCIA.

ob <- c(18.2,     19.2,     20.9,     23.9,     27.3,     31.0,     31.9,     31.4,     30.7,     27.8,     22.8,     18.9)

ORDENAR DATOS

DE MENOR A MAYOR

  • En esta parte organizamos nuestros datos de menor a mayor
  • La función “sort” lo que hace es organizar los datos segun como lo indiques usando el “decreasing” acpañado del “FALSE” si quieres que sea de menor a mayor, o acompañado de “TRUE” Que este nos indica que es de mayor a menor como se muestra en los siguientes dos ejemplos:
sort(ob, decreasing = FALSE)
##  [1] 18.2 18.9 19.2 20.9 22.8 23.9 27.3 27.8 30.7 31.0 31.4 31.9

DE MAYOR A MENOR

sort(ob, decreasing = TRUE)
##  [1] 31.9 31.4 31.0 30.7 27.8 27.3 23.9 22.8 20.9 19.2 18.9 18.2

HISTOGRAMA DE FRECUENCIA ABSOLUTA

  • Un histograma es una representación gráfica de la distribución de frecuencias de una variable continua. este nos permite observar la distribución de los datos numericos, usando barras como se muestra en la imagen siguiente.
  • Para realizar un histograma de frecuencia abosuluta llamaremos el comando “hist” y entre los parentesis se pone el nombre que asignamos a los valores.
hist(ob)

TABLA DE DESTRIBUCIÓN DE FRECUENCIA SEGÚN STURGES 2.

  • Las tablas de distribución de frecuencia organizan los datos discretos, y estos se organizan en tablas como la siguiente:
  • La primera columna representa la frecuencia absoluta “f”, despues esta la frecuencia relativa “rf”, esta la frecuencia relativa porcentual “rf%”. tenemos tambien la frecuencia absoluta acumulada que es representada por el “cf”, y por ultimo esta la frecuencia relativa porcentual acumulada que es la “cf%”
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
tabla <- fdt(ob)
tabla
##     Class limits f   rf rf(%) cf  cf(%)
##  [18.018,20.858) 3 0.25 25.00  3  25.00
##  [20.858,23.698) 2 0.17 16.67  5  41.67
##  [23.698,26.539) 1 0.08  8.33  6  50.00
##  [26.539,29.379) 2 0.17 16.67  8  66.67
##  [29.379,32.219) 4 0.33 33.33 12 100.00

HISTOGRAMAS Y POLIGONOS

Histograma de frecuencia absoluta

  • El histograma se utiliza principalmente cuando se está trabajando con variables continuas (datos que tienen decimales), ya que representa cierta continuidad para representar todos los valores posibles que hay en el intervalo. Para demostrar esta continuidad, las barras deben ir juntas. El ancho de la barra debe ser proporcional al tamaño del intervalo.
plot(tabla, type = "fh")

Poligono de frecuencia absoluta

  • El poligono de frecuencia absoluta es un grafico que nos permite de manera rapida la visualización de las frecuencias.
plot(tabla, type = "fp")

Histograma Relativos

  • En el histograma relativo, en lugar de usar un eje vertical para el recuento de valores de datos que caen en un contenedor determinado, usamos este eje para representar la proporción general de valores de datos que caen en este contenedor.
plot(tabla, type = "rfh")

###Poligono de frecuencia relativa

  • A diferencia de el de frecuencia absoluta este nos sindica en términos de porcentaje los puntos medios de cada subconjunto de datos o barras.
plot(tabla, type = "rfp")

Histogramas de frecuencias acumuladas

  • Es obtenido a partir de una distribución de frecuencias, tomando en el eje horizontal las clases de la variable, y en el eje vertical las frecuencias acumuladas correspondientes a cada intervalo.
plot(tabla, type = "cfh")

## Poligono de frecuencia acumulada

  • Este poligono nos muestra lo mismo que el histograma de arriba, solo que este nos muestra este diagrama con puntos en el centro de cada barra, para asi dar lugar al siguiente poligono.
plot(tabla, type = "cfp")

MEDIDA DE TENDENCIA CENTRAL

Media

mean(ob)
## [1] 25.33333

Mediana

median(ob)
## [1] 25.6

Moda

library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
mlv(ob, method =  "mfv")
##  [1] 18.2 18.9 19.2 20.9 22.8 23.9 27.3 27.8 30.7 31.0 31.4 31.9

CUANTILES

summary(ob)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   18.20   20.48   25.60   25.33   30.77   31.90

GRAFICO DE CAJA Y BIGOTES

boxplot(ob)