Estos datos pueden ser encontrados en el siguiente enlace: https://smn.conagua.gob.mx/tools/RESOURCES/Normales5110/NORMAL26139.TXT
her <- c(16.8, 18.3, 20.4, 23.6, 27.3, 31.7, 32.3, 31.8, 30.8, 26.7, 21.1, 17.0)
El primer paso a realizar es organizar los datos de la normales climatologicas obtenidos de mayor a menor y viceversa con el metodo Sort ya sea Falso cuando es de menor a mayor y Verdadero cuando sea de mayor a menor.
sort(her, decreasing = FALSE)
## [1] 16.8 17.0 18.3 20.4 21.1 23.6 26.7 27.3 30.8 31.7 31.8 32.3
sort(her, decreasing = TRUE)
## [1] 32.3 31.8 31.7 30.8 27.3 26.7 23.6 21.1 20.4 18.3 17.0 16.8
Estos elementos son la representación gráfica en forma de barras y poligonos que simbolizan la distribución de un conjunto de datos.
Un histograma es la representación gráfica en forma de barras, que simboliza la distribución de un conjunto de datos. Sirven para obtener una “primera vista” general, o panorama, de la distribución de la población, o de la muestra, respecto a una característica, cuantitativa y continua.
Un polígono de frecuencias da la misma información de un histograma, para esto graficamos un punto por cada clase del conjunto de datos en donde en la entrada de las abscisas se toma el valor del punto medio de la clase y en la entrada las ordenadas tendrán en mismo valor que la altura del rectángulo. Al final, unimos cada punto con su sucesor y su antecesor.
Markelin, M. (2019, 30 octubre). ¿Que es una histograma? | Superprof. Material Didáctico - Superprof. https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/histograma.html
La regla de Sturges es un criterio utilizado para determinar el número de clases o intervalos que son necesarios para representar gráficamente un conjunto de datos estadísticos. Esta regla fue enunciada en 1926 por el matemático alemán Herbert Sturges y lo aplicaremos en este caso observando la normal climatologica en este aspecto.
Realizaremos esta tabla con añadiendo la libreria fdth que nos ayudará con toda la organización de información en este trabajo usandolo en otros metodos futuros para realizar la representación de esta información.
library(fdth)
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
tabla <- fdt(her)
tabla
## Class limits f rf rf(%) cf cf(%)
## [16.632,19.83) 3 0.25 25.00 3 25.00
## [19.83,23.028) 2 0.17 16.67 5 41.67
## [23.028,26.227) 1 0.08 8.33 6 50.00
## [26.227,29.425) 2 0.17 16.67 8 66.67
## [29.425,32.623) 4 0.33 33.33 12 100.00
Nieves Hurtado, A., & DOMÍNGUEZ SÁNCHEZ, F. C. (2009). Probabilidad y estadística para ingeniería un enfoque moderno (No. 519 N5.). México: McGraw Hill.
Se representaran los diferentes tipos de frecuencias de la información con histogramas y poligonos, estas gráficas se realizarán con la ayuda del método plot, que nos será muy util para la realización del material.
La frecuencia absoluta es el número de veces que aparece un valor, se representa con cada uno de los valores. La suma de las frecuencias absolutas es igual al número total de datos y en este caso podremos observar este caso aplicado al clima en hermosillo
plot(tabla, type="fh")
plot(tabla, type="fp")
La frecuencia relativa nace de el resultado de dividir la frecuencia absoluta de un determinado valor entre el número total de datos, asimilando así la información obtenida para verificar de una forma más especifica los datos que se nos esta brindando
plot(tabla, type="rfh")
plot(tabla, type="rfp")
En cambio la frecuencia acumulada es la suma de frecuencias absolutas de todos los valores iguales o inferiores al valor considerado, viendo el crecimiento en la ciudad de hermosillo se podría clarificar el aumento drástico en la normal climatologica
plot(tabla, type="cfh")
plot(tabla, type="cfp")
Maths, S. Frecuencia absoluta, relativa, acumulada y tablas estadísticas (en línea). 2015. Recuperado de: https://www.sangakoo.com/es/temas/frecuencia-absoluta-relativa-acumulada-y-tablas-estadisticas
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda.
La media aritmética, también llamada promedio o media, es un conjunto infinito de números, es el valor característico de una serie de datos cuantitativos, objeto de estudio que parte del principio de la esperanza matemática o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el número total de sumandos. Cuando el conjunto es una muestra aleatoria, recibe el nombre de media, siendo uno de los principales estadístico muestrales.En este caso se puede observar claramente el promedio obtenido de los datos oficiales utilizando el motodo mean
mean(her)
## [1] 24.81667
Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o superiores a la mediana. En este caso se puede observar claramente la mediana obtenida con los datos oficiales utilizando el metodo median
median(her)
## [1] 25.15
La moda de una distribución se define como el valor de la variable que más se repite. En un polígono de frecuencia la moda corresponde al valor de la variable que está bajo el punto más alto del gráfico. Una muestra puede tener más de una moda. En este caso no habría una moda, ya que no hay datos en la normal climatologica que se repitan, para realizar este procedimiento tendremos que agregar una libreria nueva que nos ayudará con este trabajo, esta libreria se llama modeest, y con el metodo mlv podremos observar la moda, en el caso de que hubiera una.
library(modeest)
##
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
##
## mfv
mlv(her, method = "mfv")
## [1] 16.8 17.0 18.3 20.4 21.1 23.6 26.7 27.3 30.8 31.7 31.8 32.3
Lages Elon, y otros La matemática de la Enseñanza media [2000]; ISBN 99972-753-48-4; pág. 129.
Quevedo, F. (2011, 2 marzo). Medidas de tendencia central y dispersión - Medwave. MedWave. https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/4934
Un cuantil es aquel punto que divide la función de distribución de una variable aleatoria en intervalos regulares. Por tanto, no es más que una técnica estadística para separar los datos de una distribución. Eso sí, debe cumplirse que los grupos sean iguales. Por eso, existen diversos tipos de cuantil, como veremos más adelante, en función del número de particiones que hacen, observando así en el caso de hermosillo esta distribución con la ayuda del metodo summary.
summary(her)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 16.80 19.88 25.15 24.82 31.02 32.30
Arias, E. R. (2021, 14 enero). Cuantil. Economipedia. https://economipedia.com/definiciones/cuantil.html
El resumen de cinco números se puede usar para crear una gráfica sencilla llamada gráfica de caja y bigotes a fin de describir visualmente la distribución de datos. De la gráfica de caja, rápidamente se puede detectar cualquier sesgo en la forma de la distribución y ver si hay algunos resultados atípicos en el conjunto de datos. El método boxplot nos será muy util para observar este gráfico de una forma facil de analizar.
Validando con la información de la normal climatologica en hermosillo podemos deducir que los resultados tienen una varianza atípica considerable segun los datos estadisticos presentados por la página oficial de la SMN
boxplot(her)
Mendenhall, B, Libro “Introducción a la probabilidad Y estadística” Pag. 80.