PRIMER TAREA DE PROBABILIDAD Y ESTADISTICA: TABLAS, HISTOGRAMAS Y POLIGONOS DE DISTRIBUCIONES DE FRECUENCIA CON OTRO CLIMA :D

Importar datos

  • Este ejercicio usa datos de las normales climatologicas del periodo de 1951 a 2010 de banamichi Sonora, estacion BANAMICHI DGE.

Estos datos pueden ser encontrados en el siguiente enlace: https://smn.conagua.gob.mx/es/informacion-climatologica-por-estado?estado=son

ba <- c(86.7,    109.9,    170.7,    228.9,    287.6,    315.1,    244.5,    203.0,    188.5,    168.1,    109.7,     82.4,  2195.1)

Ordenar datos

De menor a mayor

  • Aquí basicamente estamos ordenando de menor a mayor para tener una mejor visualizaion y más ordenada
sort(ba, decreasing = FALSE)
##  [1]   82.4   86.7  109.7  109.9  168.1  170.7  188.5  203.0  228.9  244.5
## [11]  287.6  315.1 2195.1

De mayor a menor

*Aquí estamos ordenando al revés por si la quieres de mayor a menor

sort(ba, decreasing = TRUE)
##  [1] 2195.1  315.1  287.6  244.5  228.9  203.0  188.5  170.7  168.1  109.9
## [11]  109.7   86.7   82.4

Histogramas, poligonos y tablas de distribuciones de frecuencia

TABLA de distribucion de frecuencia segun Sturge

  • La tabla de distribucion de frecuencia son tablas en que se dispone las modalidades de la variable por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que contienen los datos. fuente: https://www.uv.es/webgid/Descriptiva/3_distribucin_de_frecuencias.html
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
tabla <- fdt(ba)
tabla
##         Class limits  f   rf rf(%) cf  cf(%)
##     [81.576,508.671) 12 0.92 92.31 12  92.31
##    [508.671,935.766)  0 0.00  0.00 12  92.31
##   [935.766,1362.861)  0 0.00  0.00 12  92.31
##  [1362.861,1789.956)  0 0.00  0.00 12  92.31
##  [1789.956,2217.051)  1 0.08  7.69 13 100.00

Histogramas y poligonos

Absolutos

  • histograma de frecuencia absoluta, se utiliza principalmente cuando se está trabajando con variables continuas (datos que tienen decimales), ya que representa cierta continuidad para representar todos los valores posibles que hay en el intervalo. Para demostrar esta continuidad, las barras deben ir juntas. basicamente se utiliza cuando hay valores con cierta continuidad. Fuente: http://matepedia-estadistica.blogspot.com/2016/05/histograma-con-frecuencia-absoluta.html
plot(tabla, type="fh")

plot(tabla, type="fp")

Relativos

*Histograma, Un histograma es la representación gráfica en forma de barras, que simboliza la distribución de un conjunto de datos. Sirven para obtener una “primera vista” general, o panorama, de la distribución de la población, o de la muestra, respecto a una característica, cuantitativa y continua. fuente: https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/histograma.html

plot(tabla, type="rfh")

plot(tabla, type="rfp")

Acumulados

plot(tabla, type="cfh")

plot(tabla, type="cfp")

Medidas de tendencia central

Media

  • La media sirve para saber la mitad de alguna cosa por ejemplo si tenemos 10 rebanas de pizza y somos 5 personas nos tocaría de 2 pedazos a cada persona y esa seria la media, las 2 rebanadas porque a cada uno le toco 2 rebanadas formando así las 10 rebanadas iniciales.
mean(ba)
## [1] 337.7077

Mediana

median(ba)
## [1] 188.5

Moda

library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
mlv(ba, method = "mfv")
##  [1]   82.4   86.7  109.7  109.9  168.1  170.7  188.5  203.0  228.9  244.5
## [11]  287.6  315.1 2195.1

Cuantiles

  • Un cuantil es aquel punto que divide la función de distribución de una variable aleatoria en intervalos regulares. es decir solo es una tecnica de distribucion pero siempre debe cumplirse que los grupos sean iguales. fuente: https://economipedia.com/definiciones/cuantil.html
summary(ba)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    82.4   109.9   188.5   337.7   244.5  2195.1

Grafico de caja y bigotes

  • Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría. es decir, esta caja y bigotes te permite representar y saber varios datos en una sola grafica, es por eso que es tan usada. fuente: https://www.estadisticaparatodos.es/taller/graficas/cajas.html
boxplot(ba)