stadÃstica inferencial: Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas sÃ/no (prueba de hipótesis), estimaciones de unas caracterÃsticas numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen análisis de varianza, series de tiempo y minerÃa de datos. Su objetivo es obtener conclusiones útiles para lograr hacer deducciones acerca de la totalidad de todas las observaciones hechas, basándose en la información numérica.
library(pacman)
p_load("readr","DT","prettydoc","fdth","modeest")
datosob <- read_csv("datosob.csv")
##
## -- Column specification ------------------------------------------------------------
## cols(
## mes = col_character(),
## temp = col_double(),
## prec = col_double()
## )
datatable(datosob)
es la rama de las matemáticas que estudia la variabilidad, asà como el proceso aleatorio que la genera siguiendo las leyes de la probabilidad.2. Como parte de la matemática, la estadÃstica es una ciencia formal deductiva, con un conocimiento propio, dinámico y en continuo desarrollo obtenido a través del método cientÃfico formal. En ocasiones, las ciencias fácticas necesitan utilizar técnicas estadÃsticas durante su proceso de investigación factual, con el fin de obtener nuevos conocimientos basados en la experimentación y en la observación. En estos casos, la aplicación de la estadÃstica permite el análisis de datos provenientes de una muestra representativa, que busca explicar las correlaciones y dependencias de un fenómeno fÃsico o natural, de ocurrencia en forma aleatoria o condicional.
La estadÃstica se divide en dos grandes áreas:
EstadÃstica descriptiva: Se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Su objetivo es organizar y describir las caracterÃsticas sobre un conjunto de datos con el propósito de facilitar su aplicación, generalmente con el apoyo de gráficas, tablas o medidas numéricas. Ejemplos básicos de parámetros estadÃsticos son: la media y la desviación estándar. Ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre otros.
EstadÃstica inferencial: Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas sÃ/no (prueba de hipótesis), estimaciones de unas caracterÃsticas numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen análisis de varianza, series de tiempo y minerÃa de datos. Su objetivo es obtener conclusiones útiles para lograr hacer deducciones acerca de la totalidad de todas las observaciones hechas, basándose en la información numérica.
dist <- fdt(datosob, breaks="Sturges")
dist
## temp
## Class limits f rf rf(%) cf cf(%)
## [17.226,20.225) 3 0.25 25.00 3 25.00
## [20.225,23.223) 2 0.17 16.67 5 41.67
## [23.223,26.222) 1 0.08 8.33 6 50.00
## [26.222,29.22) 2 0.17 16.67 8 66.67
## [29.22,32.219) 4 0.33 33.33 12 100.00
##
## prec
## Class limits f rf rf(%) cf cf(%)
## [0.396,19.365) 6 0.50 50 6 50
## [19.365,38.335) 3 0.25 25 9 75
## [38.335,57.304) 0 0.00 0 9 75
## [57.304,76.274) 0 0.00 0 9 75
## [76.274,95.243) 3 0.25 25 12 100
dist
## temp
## Class limits f rf rf(%) cf cf(%)
## [17.226,20.225) 3 0.25 25.00 3 25.00
## [20.225,23.223) 2 0.17 16.67 5 41.67
## [23.223,26.222) 1 0.08 8.33 6 50.00
## [26.222,29.22) 2 0.17 16.67 8 66.67
## [29.22,32.219) 4 0.33 33.33 12 100.00
##
## prec
## Class limits f rf rf(%) cf cf(%)
## [0.396,19.365) 6 0.50 50 6 50
## [19.365,38.335) 3 0.25 25 9 75
## [38.335,57.304) 0 0.00 0 9 75
## [57.304,76.274) 0 0.00 0 9 75
## [76.274,95.243) 3 0.25 25 12 100
#nos brinda una tabla con los calculos de la distribución de frecuencias.
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual
plot(dist, type="fh") # histograma de frecuencia absoluta
plot(dist, type="cfh") # histograma de frecuencia acumulada
plot(dist, type="fp") # Poligono de frecuencia absoluta
plot(dist, type="cfp") # Poligono de frecuencia acumulada
plot(dist, type="rfp") # Poligono de frecuencia relativa
mean(datosob$temp)
## [1] 24.94167
mean(datosob$prec)
## [1] 31.40833
median(datosob$temp)
## [1] 25.2
median(datosob$prec)
## [1] 17.5
mfv(datosob$prec)
## [1] 0.4 2.2 4.6 6.4 11.4 14.2 20.8 25.0 28.7 83.6 85.3 94.3
mfv(datosob$temp)
## [1] 17.4 17.9 18.6 20.3 22.1 23.5 26.9 27.5 30.6 31.0 31.6 31.9