PRIMER TAREA DE PROBABILIDAD Y ESTADISTICA: TABLAS, HISTOGRAMAS Y POLIGONOS DE DISTRIBUCIONES DE FRECUENCIA.
ob <- c(18.2, 19.2, 20.9, 23.9, 27.3, 31.0, 31.9, 31.4, 30.7, 27.8, 22.8, 18.9)
ORDENAR DATOS
DE MENOR A MAYOR
- En esta parte organizamos nuestros datos de menor a mayor
- La función “sort” lo que hace es organizar los datos segun como lo indiques usando el “decreasing” acpañado del “FALSE” si quieres que sea de menor a mayor, o acompañado de “TRUE” Que este nos indica que es de mayor a menor como se muestra en los siguientes dos ejemplos:
sort(ob, decreasing = FALSE)
## [1] 18.2 18.9 19.2 20.9 22.8 23.9 27.3 27.8 30.7 31.0 31.4 31.9
DE MAYOR A MENOR
sort(ob, decreasing = TRUE)
## [1] 31.9 31.4 31.0 30.7 27.8 27.3 23.9 22.8 20.9 19.2 18.9 18.2
HISTOGRAMA DE FRECUENCIA ABSOLUTA
- Un histograma es una representación gráfica de la distribución de frecuencias de una variable continua. este nos permite observar la distribución de los datos numericos, usando barras como se muestra en la imagen siguiente.
- Para realizar un histograma de frecuencia abosuluta llamaremos el comando “hist” y entre los parentesis se pone el nombre que asignamos a los valores.
hist(ob)

TABLA DE DESTRIBUCIÓN DE FRECUENCIA SEGÚN STURGES 2.
- Las tablas de distribución de frecuencia organizan los datos discretos, y estos se organizan en tablas como la siguiente:
- La primera columna representa la frecuencia absoluta “f”, despues esta la frecuencia relativa “rf”, esta la frecuencia relativa porcentual “rf%”. tenemos tambien la frecuencia absoluta acumulada que es representada por el “cf”, y por ultimo esta la frecuencia relativa porcentual acumulada que es la “cf%”
library(fdth)
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
tabla <- fdt(ob)
tabla
## Class limits f rf rf(%) cf cf(%)
## [18.018,20.858) 3 0.25 25.00 3 25.00
## [20.858,23.698) 2 0.17 16.67 5 41.67
## [23.698,26.539) 1 0.08 8.33 6 50.00
## [26.539,29.379) 2 0.17 16.67 8 66.67
## [29.379,32.219) 4 0.33 33.33 12 100.00
HISTOGRAMAS Y POLIGONOS
Histograma de frecuencia absoluta
- El histograma se utiliza principalmente cuando se está trabajando con variables continuas (datos que tienen decimales), ya que representa cierta continuidad para representar todos los valores posibles que hay en el intervalo. Para demostrar esta continuidad, las barras deben ir juntas. El ancho de la barra debe ser proporcional al tamaño del intervalo.
plot(tabla, type = "fh")

Poligono de frecuencia absoluta
- El poligono de frecuencia absoluta es un grafico que nos permite de manera rapida la visualización de las frecuencias.
plot(tabla, type = "fp")

Histograma Relativos
- En el histograma relativo, en lugar de usar un eje vertical para el recuento de valores de datos que caen en un contenedor determinado, usamos este eje para representar la proporción general de valores de datos que caen en este contenedor.
plot(tabla, type = "rfh")
###Poligono de frecuencia relativa
- A diferencia de el de frecuencia absoluta este nos sindica en términos de porcentaje los puntos medios de cada subconjunto de datos o barras.
plot(tabla, type = "rfp")

Histogramas de frecuencias acumuladas
- Es obtenido a partir de una distribución de frecuencias, tomando en el eje horizontal las clases de la variable, y en el eje vertical las frecuencias acumuladas correspondientes a cada intervalo.
plot(tabla, type = "cfh")
## Poligono de frecuencia acumulada
- Este poligono nos muestra lo mismo que el histograma de arriba, solo que este nos muestra este diagrama con puntos en el centro de cada barra, para asi dar lugar al siguiente poligono.
plot(tabla, type = "cfp")

MEDIDA DE TENDENCIA CENTRAL
Moda
- mlv es una función genérica que permite calcular una estimación de la moda de una distribución univariante. Se proporcionan muchas estimaciones (o métodos) diferentes:
- mfv, que devuelve los valores más frecuentes en un vector numérico dado
- En el sistema R, no hay una función para esto. Se debe descargar el paquete modeest y la función mfv
library(modeest)
##
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
##
## mfv
mlv(ob, method = "mfv")
## [1] 18.2 18.9 19.2 20.9 22.8 23.9 27.3 27.8 30.7 31.0 31.4 31.9
CUANTILES
- Cuantiles nos indican hasta donde abarca el primer 25% de los datos. Despues la Mediana que indica donde recae el 50% de los datos. Y por ultimo el tercero nos indica donde recae el 75% de los datos.
summary(ob)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 18.20 20.48 25.60 25.33 30.77 31.90
GRAFICO DE CAJA Y BIGOTES
Un diagrama de cajas y bigotes es una manera conveniente de mostrar visualmente grupos de datos numéricos a través de sus cuartiles.
La primera rayita muestra el valor minimo.
La segunda linea punteada vertical indica el bigote.
La tercera linea horizontal nos muestra el cuartil inferior.
La cuarta nos muestra la mediana.
La quinta representa el cuartil superior.
Y la sexta que es la ultima linea horizontal, no muestra el extremo superior máximo.
Para dibujar el diagrama se usa el comando boxplot(Nombre que le asignaste a tus datos)
boxplot(ob)
