stadística inferencial: Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas sí/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen análisis de varianza, series de tiempo y minería de datos. Su objetivo es obtener conclusiones útiles para lograr hacer deducciones acerca de la totalidad de todas las observaciones hechas, basándose en la información numérica.

library(pacman)
p_load("readr","DT","prettydoc","fdth","modeest")
datosob <- read_csv("datosob.csv")
## 
## -- Column specification ------------------------------------------------------------
## cols(
##   mes = col_character(),
##   temp = col_double(),
##   prec = col_double()
## )
datatable(datosob)

primer repaso de la unidad 1 de la materia de estadistica aplicada

definicion de estadistica

es la rama de las matemáticas que estudia la variabilidad, así como el proceso aleatorio que la genera siguiendo las leyes de la probabilidad.2. Como parte de la matemática, la estadística es una ciencia formal deductiva, con un conocimiento propio, dinámico y en continuo desarrollo obtenido a través del método científico formal. En ocasiones, las ciencias fácticas necesitan utilizar técnicas estadísticas durante su proceso de investigación factual, con el fin de obtener nuevos conocimientos basados en la experimentación y en la observación. En estos casos, la aplicación de la estadística permite el análisis de datos provenientes de una muestra representativa, que busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.

La estadística se divide en dos grandes áreas:

Estadística descriptiva: Se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Su objetivo es organizar y describir las características sobre un conjunto de datos con el propósito de facilitar su aplicación, generalmente con el apoyo de gráficas, tablas o medidas numéricas. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre otros.

Estadística inferencial: Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas sí/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen análisis de varianza, series de tiempo y minería de datos. Su objetivo es obtener conclusiones útiles para lograr hacer deducciones acerca de la totalidad de todas las observaciones hechas, basándose en la información numérica.

distribuciones de frecuencia

tabla de distribucion de frecuencia

dist <- fdt(datosob, breaks="Sturges")
dist
## temp 
##     Class limits f   rf rf(%) cf  cf(%)
##  [17.226,20.225) 3 0.25 25.00  3  25.00
##  [20.225,23.223) 2 0.17 16.67  5  41.67
##  [23.223,26.222) 1 0.08  8.33  6  50.00
##   [26.222,29.22) 2 0.17 16.67  8  66.67
##   [29.22,32.219) 4 0.33 33.33 12 100.00
## 
## prec 
##     Class limits f   rf rf(%) cf cf(%)
##   [0.396,19.365) 6 0.50    50  6    50
##  [19.365,38.335) 3 0.25    25  9    75
##  [38.335,57.304) 0 0.00     0  9    75
##  [57.304,76.274) 0 0.00     0  9    75
##  [76.274,95.243) 3 0.25    25 12   100
dist
## temp 
##     Class limits f   rf rf(%) cf  cf(%)
##  [17.226,20.225) 3 0.25 25.00  3  25.00
##  [20.225,23.223) 2 0.17 16.67  5  41.67
##  [23.223,26.222) 1 0.08  8.33  6  50.00
##   [26.222,29.22) 2 0.17 16.67  8  66.67
##   [29.22,32.219) 4 0.33 33.33 12 100.00
## 
## prec 
##     Class limits f   rf rf(%) cf cf(%)
##   [0.396,19.365) 6 0.50    50  6    50
##  [19.365,38.335) 3 0.25    25  9    75
##  [38.335,57.304) 0 0.00     0  9    75
##  [57.304,76.274) 0 0.00     0  9    75
##  [76.274,95.243) 3 0.25    25 12   100
#nos brinda una tabla con los calculos de la distribución de frecuencias.
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual

histograma de distribucion de frecuencia

plot(dist, type="fh") # histograma de frecuencia absoluta

plot(dist, type="cfh") # histograma de frecuencia acumulada

poligono de distribucion de frecuencia

plot(dist, type="fp") # Poligono de frecuencia absoluta

plot(dist, type="cfp") # Poligono de frecuencia acumulada

plot(dist, type="rfp") # Poligono de frecuencia relativa

medidas de tendencias central

media

mean(datosob$temp)
## [1] 24.94167
mean(datosob$prec)
## [1] 31.40833

mediana

median(datosob$temp)
## [1] 25.2
median(datosob$prec)
## [1] 17.5

moda

mfv(datosob$prec)
##  [1]  0.4  2.2  4.6  6.4 11.4 14.2 20.8 25.0 28.7 83.6 85.3 94.3
mfv(datosob$temp)
##  [1] 17.4 17.9 18.6 20.3 22.1 23.5 26.9 27.5 30.6 31.0 31.6 31.9

cuantiles

valores maximos y minimos

grafico (diagrama) de caja y bigote

medidas de dispersion

amplitud (rango, alcance)

varianza

desviacion estandar

introduccion a la probabilidad

probabilidad clasica

probabilidad distribuida

distribuciones de frecuencia

distribucion normal

distribucion binomial

distribucion exponencial

analisis de correlacion

correlacion de pearson

diagramas de dispersion

regresion lineal simple

recta de minimos cuadrados

ecuacion de la recta

ajuste de la recta

prediccion

intervalos de confianza

analisis de residuales

pruebas de normalidad

Shapiro-wilk