prueba hipotesis

Prueba de media población

##########################################
# 1. Cargar paquetes necesarios
##########################################
library(readr)
library(dplyr)
library(ggplot2)
library(stringr)
library(tidyr)
library(tigerstats)
library(BSDA)
library(estadistica)

R Markdown es una herramienta de código abierto que permite combinar texto formateado (en estilo Markdown) con código ejecutable (especialmente de R, aunque soporta otros lenguajes) para generar documentos dinámicos y reproducibles. En un solo archivo .Rmd puedes escribir explicación narrativa, incluir fragmentos de código R y mostrar directamente los resultados de ese código (tablas, gráficos, etc.). Esto facilita la creación de informes de análisis de datos reproducibles, donde los resultados siempre corresponden al código mostrado, evitando copias y pegados manuales. Por ejemplo, con R Markdown es posible elaborar informes, presentaciones, dashboards, aplicaciones interactivas, libros, sitios web y artículos académicos, todo a partir de la combinación de Markdown y R . En el contexto de la ciencia de datos, R Markdown se ha vuelto popular para documentar análisis estadísticos, generar reportes para tomadores de decisiones, y compartir visualizaciones de datos de forma transparente.

Prueba hipótesis de la media muestral

Las pruebas de hipótesis son procedimientos estadísticos utilizados para tomar decisiones o sacar conclusiones sobre una población a partir de una muestra de datos. Su propósito principal es evaluar afirmaciones o suposiciones formuladas respecto a un parámetro poblacional, como la media, la proporción o la varianza.

\[ \begin{matrix} H_{o} &:\mu = 30 \\ H_{a} &:\mu \neq 30 \\ \end{matrix} \] Datos de la muestra

data=c(20, 30, 39, 30, 40, 20, 25, 39, 40, 30, 30, 32, 35, 38, 39, 39, 40 ,20, 25, 38)

Aplicación de la prueba

z.test(x =data, 
       sigma.x = sd(data), 
       mu = 30, 
       alternative = "two.sided", 
       conf.level = 0.95)
## 
##  One-sample z-Test
## 
## data:  data
## z = 1.5021, p-value = 0.1331
## alternative hypothesis: true mean is not equal to 30
## 95 percent confidence interval:
##  29.25316 35.64684
## sample estimates:
## mean of x 
##     32.45

Con una Z estadística de 1.50, la probabilidad de P valor es del 0.1331. Por lo cual, con un nivel de significancia del 0.05, se evidencia que la media población es del 30.

Visualizar resultados desde Rstudio

20, 30, 39, 30, 40, 20, 25, 39, 40, 30, 30, 32, 35, 38, 39, 39, 40, 20, 25, 38

insurance <- read_csv("insurance.csv")
insurance<-as.data.frame(unclass(insurance),
                         stringsAsFactors = TRUE)
ggplot(insurance, aes(x=age))+
  geom_boxplot(color="chartreuse3")+
  labs(title="Boxplot de la edad")