Paso num. 1: crear conjunto de datos
set.seed(123) # Función para asegurar reproducibilidad
niveles_glucosa <- rnorm(50, mean = 100, sd = 15) # La media es = 100, la desviasion estandar es = 15
niveles_glucosa
[1] 91.59287 96.54734 123.38062 101.05763 101.93932 125.72597 106.91374 81.02408 89.69721 93.31507 118.36123
[12] 105.39721 106.01157 101.66024 91.66238 126.80370 107.46776 70.50074 110.52034 92.90813 83.98264 96.73038
[23] 84.60993 89.06663 90.62441 74.69960 112.56681 102.30060 82.92795 118.80722 106.39696 95.57393 113.42688
[34] 113.17200 112.32372 110.32960 108.30876 99.07132 95.41056 94.29293 89.57940 96.88124 81.01905 132.53434
[45] 118.11943 83.15337 93.95673 93.00017 111.69948 98.74946
plot(cars)

str(niveles_glucosa)
num [1:50] 91.6 96.5 123.4 101.1 101.9 ...
Paso num. 2: calculo de la media y el error estandar
media <- mean(niveles_glucosa) # Media de los datos
sd <- sd(niveles_glucosa) # Desviacion estandar
n <- length(niveles_glucosa) # Tamaño de la muestra
se <- sd / sqrt(n) # Error estandar de la media
media
[1] 100.5161
sd
[1] 13.88805
n
[1] 50
se
[1] 1.964067
Paso num. 3: Calcular elintervalo de confianza del 95%
df <- n-1
alpha <- 0.05 # Nivel de significancia (1 - 95%)
t_critico <- qt(1 - alpha / 2, df = n - 1) # valos critico t para el 95%
margen_error <- t_critico * se #Margen de error
margen_error
[1] 3.94694
ic_inf <- media - margen_error
ic_inf
[1] 96.56911
ic_sup <- media + margen_error
ic_sup
[1] 104.463
# resultado
cat("Media:", round(media,2), "\n")
Media: 100.52
cat("Intervalo de Confianza del 95%: [", round(ic_inf, 2), ",", round(ic_sup, 2), "]\n")
Intervalo de Confianza del 95%: [ 96.57 , 104.46 ]
Elaboracion de ejemplo práctico
# Media muestral (x)= 100
# Desviación estándar (S)= 15
# Tamaño de muestra (n)= 30
#Establecimiento de paramentros
alpha <- 0.05
n <- 15
S <- 30
media <- 100
# Error estándar
se <- S / sqrt(n)
# Valor crítico t
t_critico <- qt(1 - alpha / 2, df = n - 1)
# Margen de error
margen_error <- t_critico * se
# Intervalo de confianza
ic_inf <- media - margen_error
ic_sup <- media + margen_error
cat("intervalo de confianza del 95%:", round(ic_inf, 2), "-", round(ic_sup, 2), "\n")
intervalo de confianza del 95%: 83.39 - 116.61
Elaboración de grafico
# Creacion de data frame
df <- data.frame(media = media, ic_inf = ic_inf, ic_sup = ic_sup)
# Grafico
ggplot(df, aes(x = 1, y = media)) + geom_point(size = 3, color = "red") + ylim(0,200) + geom_errorbar(aes_q(ymin = ic_inf, ymax = ic_sup), width = 0.2, color = "blue") + labs(title = "Intervalo de Confianza del 95% para la Media", x = "Muestra", y = "Media") + theme_minimal()

Valor critico
t_critico <- qt(1 - alpha / 2, df = n - 1)
Calculo de R
# Datos simulados
set.seed(123)
datos <- rnorm(30, mean = 100, sd = 15)
# Calcular estadísticas
media <- mean(datos) # Media muestral
sd <- sd(datos) # Desviacion estandar muestral
n <- length(datos) # Tamaño de la muestra
se <- sd / sqrt(n) # Error estandar
# Nivel de significancia
alpha <- 0.05
# Valor critico t
t_critico <- qt(1 - alpha / 2, df = n - 1)
# Margen de error
margen_error <- t_critico * se
# Intervalo de confianza
ic_inf <- media - margen_error
ic_sup <- media + margen_error
cat("media:", round(media, 2), "\n")
media: 99.29
cat("Intervalo de Confianza del 95%: [", round(ic_inf, 2), ",", round(ic_sup, 2), "]\n")
Intervalo de Confianza del 95%: [ 93.8 , 104.79 ]
Calculo en R para la comparacion entre el IC y el valor de P
# Paso 1: datos del ejemplo anterior, sumando los datos de los niveles de glucosa
set.seed(123)
niveles_glucosa <- rnorm(200, mean = 100, sd = 15) # Media = 100, sd = 15
# Paso 2: calculo del Ic 95%
media <- mean(niveles_glucosa) # Media muestral
sd <- sd(niveles_glucosa) # Desviación estándar muestral
n <- length(niveles_glucosa) # Tamaño de la muestra
se <- sd / sqrt(n) # Error estándar
# IC 95%
alpha <- 0.05
t_critico <- qt(1 - alpha / 2, df = n - 1) # Valor crítico de t
margen_error <- t_critico * se # Margen de error
ic_inf <- media - margen_error
ic_sup <- media + margen_error
cat("Intervalo de Confianza del 95%: [", round(ic_inf, 2), ",", round(ic_sup, 2), "]\n")
Intervalo de Confianza del 95%: [ 97.9 , 101.84 ]
# Paso 3: calculo de valor de P
# Prueba t para media poblacional de 95
t_test <- t.test(niveles_glucosa, mu = 95) # Hipótesis nula: media = 95
# Resultado del valor p
cat("Valor p:", t_test$p.value, "\n")
Valor p: 2.2747e-06
Elaboracion del grafico de IC vs Valor de P
# Crear un data frame para el gráfico
df <- data.frame(
media = media,
ic_inf = ic_inf,
ic_sup = ic_sup
)
# Graficar
ggplot(df, aes(x = 1)) +
geom_errorbar(aes(ymin = ic_inf, ymax = ic_sup), width = 0.2, color = "blue") + ylim(0,200)+
geom_point(aes(y = media), size = 4, color = "red") +
geom_hline(yintercept = 95, linetype = "dashed", color = "black", size = 1.2) +
labs(
title = "Comparación entre Intervalos de Confianza e Hipótesis Nula",
x = "Muestra (niveles de glucosa)",
y = "Niveles de Glucosa (mg/dL)"
) +
theme_minimal()

Comparación de dos grupos Paso num. 1: Cálculo del Intervalo de
Confianza para la Diferencia de Medias
set.seed(123) # Reproducibilidad
#Simulador de datos
grupo_control <- rnorm(30, mean = 100, sd = 15 ) # media = 100, sd = 15
grupo_experimental <- rnorm(30, mean = 110, sd = 15) # media = 110, sd = 15
# codigo para el calculo de intervalos de confianza
media_control <- mean(grupo_control)
media_experimental <- mean(grupo_experimental)
sd_control <- sd(grupo_control)
sd_experimental <- sd(grupo_experimental)
n_control <- length(grupo_control)
n_expertimental <- length(grupo_experimental)
#calculo para diferencias de medias
diferencia <- media_experimental - media_control
#Calculo para error estandar combinado
se <- sqrt((sd_control^2 / n_control) + (sd_experimental^2 / n_expertimental))
#Calculo para el valor critico t para IC del 95%
alpha <- 0.05
t_critico <- qt(1 - alpha / 2, df = n_control + n_expertimental - 2)
#Calculo de margen de error
margen_error <- t_critico * se
# Calculo de límites del IC
ic_inf <- diferencia - margen_error
ic_sup <- diferencia + margen_error
cat("Diferencia de medias:", round(diferencia, 2), "\n")
Diferencia de medias: 13.38
cat("Intervalo de Confianza del 95%: [", round(ic_inf, 2), ",", round(ic_sup, 2), "]\n")
Intervalo de Confianza del 95%: [ 6.32 , 20.44 ]
Paso num. 2: Pueba de hipotesis y valor de p
# Prueba t para dos muestras independientes
t_test <- t.test(grupo_control, grupo_experimental, var.equal = TRUE)
# Resultados
cat("Valor p:", t_test$p.value, "\n")
Valor p: 0.0003576581
cat("Diferencia estimada (t-test):", t_test$estimate, "\n")
Diferencia estimada (t-test): 99.29344 112.6751
Paso num. 3: Visualizacion de los resultado por medio de ggplot2
library(ggplot2)
# Crear un data frame con los datos
df <- data.frame(
grupo = rep(c("Control", "Experimental"), each = 30),
niveles_glucosa = c(grupo_control, grupo_experimental)
)
# Graficar los datos
ggplot(df, aes(x = grupo, y = niveles_glucosa, fill = grupo)) +
geom_boxplot(alpha = 0.7, outlier.colour = "red") +
geom_point(position = position_jitter(width = 0.1), alpha = 0.5) +
labs(
title = "Comparación de Niveles de Glucosa entre Grupos",
x = "Grupo",
y = "Niveles de Glucosa (mg/dL)"
) +
theme_minimal() +
scale_fill_manual(values = c("#00BFC4", "#F8766D"))

Elaboracion de la grafica pero agregando la significancia
library(ggplot2)
library(ggpubr)
# Crear un data frame con los datos
df <- data.frame(
grupo = rep(c("Control", "Experimental"), each = 30),
niveles_glucosa = c(grupo_control, grupo_experimental)
)
# Graficar los datos con significancia
ggplot(df, aes(x = grupo, y = niveles_glucosa, fill = grupo)) +
geom_boxplot(alpha = 0.7, outlier.colour = "red") +
geom_point(position = position_jitter(width = 0.1), alpha = 0.5) +
labs(
title = "Comparación de Niveles de Glucosa entre Grupos",
x = "Grupo",
y = "Niveles de Glucosa (mg/dL)"
) +
theme_minimal() +
scale_fill_manual(values = c("#00BFC4", "#F8766D")) +
stat_compare_means(
method = "t.test", # Realizar prueba t
label = "p.format", # Mostrar el valor p en formato estándar o lo puedes cambiar por "p.signif" para asteriscos
label.y = max(df$niveles_glucosa) + 5 # Ajustar la posición de la etiqueta
,label.x=1.5)

---
title: "R Notebook 9 EnriqueVerdugo Intervalos de confianza y Teorema de limite central"
output: html_notebook
---
Paso num. 1: crear conjunto de datos
```{r}
set.seed(123) # Función para asegurar reproducibilidad
niveles_glucosa <- rnorm(50, mean = 100, sd = 15) # La media es = 100, la desviasion estandar es = 15
niveles_glucosa
plot(cars)
```

```{r}
str(niveles_glucosa)
```
Paso num. 2: calculo de la media y el error estandar 
```{r}
media <- mean(niveles_glucosa) # Media de los datos
sd <- sd(niveles_glucosa)      # Desviacion estandar 
n <- length(niveles_glucosa)   # Tamaño de la muestra 
se <- sd / sqrt(n)             # Error estandar de la media 

media
```
```{r}
sd
n
se
```
Paso num. 3: Calcular elintervalo de confianza del 95%
```{r}
df <- n-1 
alpha <- 0.05 # Nivel de significancia (1 - 95%)
t_critico <- qt(1 - alpha / 2, df = n - 1) # valos critico t para el 95%
margen_error <- t_critico * se #Margen de error
margen_error

```
```{r}
ic_inf <- media - margen_error
ic_inf
ic_sup <- media + margen_error
ic_sup
# resultado
cat("Media:", round(media,2), "\n")
cat("Intervalo de Confianza del 95%: [", round(ic_inf, 2), ",", round(ic_sup, 2), "]\n")
```
Elaboracion de ejemplo práctico
```{r}
# Media muestral (x)= 100
# Desviación estándar (S)= 15
# Tamaño de muestra (n)= 30
#Establecimiento de paramentros
alpha <- 0.05
n <- 15
S <- 30
media <- 100
 # Error estándar 
se <- S / sqrt(n)
 
# Valor crítico t
t_critico <- qt(1 - alpha / 2, df = n - 1)

# Margen de error 
margen_error <- t_critico * se

# Intervalo de confianza
ic_inf <- media - margen_error
ic_sup <- media + margen_error

cat("intervalo de confianza del 95%:", round(ic_inf, 2), "-", round(ic_sup, 2), "\n")
```
Elaboración de grafico 
```{r}
# Creacion de data frame
df <- data.frame(media = media, ic_inf = ic_inf, ic_sup = ic_sup)

# Grafico 
ggplot(df, aes(x = 1, y = media)) + geom_point(size = 3, color = "red") + ylim(0,200) + geom_errorbar(aes_q(ymin = ic_inf, ymax = ic_sup), width = 0.2, color = "blue") + labs(title = "Intervalo de Confianza del 95% para la Media", x = "Muestra", y = "Media") + theme_minimal()
```

Valor critico 
```{r}
t_critico <- qt(1 - alpha / 2, df = n - 1)
```

Calculo de R 
```{r}
# Datos simulados
set.seed(123)
datos <- rnorm(30, mean = 100, sd = 15)

# Calcular estadísticas 
media <- mean(datos) # Media muestral 
sd <- sd(datos)      # Desviacion estandar muestral
n <- length(datos)   # Tamaño de la muestra 
se <- sd / sqrt(n)   # Error estandar 

# Nivel de significancia 
alpha <- 0.05

# Valor critico t
t_critico <- qt(1 - alpha / 2, df = n - 1)

# Margen de error
margen_error <- t_critico * se 

# Intervalo de confianza 
ic_inf <- media - margen_error
ic_sup <- media + margen_error

cat("media:", round(media, 2), "\n")
cat("Intervalo de Confianza del 95%: [", round(ic_inf, 2), ",", round(ic_sup, 2), "]\n")
```
Calculo en R para la comparacion entre el IC y el valor de P 
```{r}
# Paso 1: datos del ejemplo anterior, sumando los datos de los niveles de glucosa 
set.seed(123)
niveles_glucosa <- rnorm(200, mean = 100, sd = 15) # Media = 100, sd = 15
# Paso 2: calculo del Ic 95%
media <- mean(niveles_glucosa)  # Media muestral
sd <- sd(niveles_glucosa)       # Desviación estándar muestral
n <- length(niveles_glucosa)    # Tamaño de la muestra
se <- sd / sqrt(n)              # Error estándar

# IC 95%
alpha <- 0.05
t_critico <- qt(1 - alpha / 2, df = n - 1)  # Valor crítico de t
margen_error <- t_critico * se              # Margen de error
ic_inf <- media - margen_error
ic_sup <- media + margen_error

cat("Intervalo de Confianza del 95%: [", round(ic_inf, 2), ",", round(ic_sup, 2), "]\n")

# Paso 3: calculo de valor de P 

# Prueba t para media poblacional de 95
t_test <- t.test(niveles_glucosa, mu = 95)  # Hipótesis nula: media = 95

# Resultado del valor p
cat("Valor p:", t_test$p.value, "\n")
```
Elaboracion del grafico de IC vs Valor de P
```{r}
# Crear un data frame para el gráfico
df <- data.frame(
  media = media,
  ic_inf = ic_inf,
  ic_sup = ic_sup
)

# Graficar
ggplot(df, aes(x = 1)) +
  geom_errorbar(aes(ymin = ic_inf, ymax = ic_sup), width = 0.2, color = "blue") + ylim(0,200)+
  geom_point(aes(y = media), size = 4, color = "red") +
  geom_hline(yintercept = 95, linetype = "dashed", color = "black", size = 1.2) +
  labs(
    title = "Comparación entre Intervalos de Confianza e Hipótesis Nula",
    x = "Muestra (niveles de glucosa)",
    y = "Niveles de Glucosa (mg/dL)"
  ) +
  theme_minimal()
```
Comparación de dos grupos
Paso num. 1: Cálculo del Intervalo de Confianza para la Diferencia de Medias
```{r}
set.seed(123) # Reproducibilidad 
 #Simulador de datos
grupo_control <- rnorm(30, mean = 100, sd = 15 ) # media = 100, sd = 15
grupo_experimental <- rnorm(30, mean = 110, sd = 15) # media = 110, sd = 15

# codigo para el calculo de intervalos de confianza 
media_control <- mean(grupo_control)
media_experimental <- mean(grupo_experimental)
sd_control <- sd(grupo_control)
sd_experimental <- sd(grupo_experimental)
n_control <- length(grupo_control)
n_expertimental <- length(grupo_experimental)

#calculo para diferencias de medias
diferencia <- media_experimental - media_control

#Calculo para error estandar combinado
se <- sqrt((sd_control^2 / n_control) + (sd_experimental^2 / n_expertimental))

#Calculo para el valor critico t para IC del 95%
alpha <- 0.05
t_critico <- qt(1 - alpha / 2, df = n_control + n_expertimental - 2)

#Calculo de margen de error
margen_error <- t_critico * se

#  Calculo de límites del IC
ic_inf <- diferencia - margen_error
ic_sup <- diferencia + margen_error

cat("Diferencia de medias:", round(diferencia, 2), "\n")

cat("Intervalo de Confianza del 95%: [", round(ic_inf, 2), ",", round(ic_sup, 2), "]\n")
```
Paso num. 2: Pueba de hipotesis y valor de p 
```{r}
# Prueba t para dos muestras independientes
t_test <- t.test(grupo_control, grupo_experimental, var.equal = TRUE)

# Resultados
cat("Valor p:", t_test$p.value, "\n")

cat("Diferencia estimada (t-test):", t_test$estimate, "\n")
```
Paso num. 3: Visualizacion de los resultado por medio de ggplot2
```{r}
library(ggplot2)

# Crear un data frame con los datos
df <- data.frame(
  grupo = rep(c("Control", "Experimental"), each = 30),
  niveles_glucosa = c(grupo_control, grupo_experimental)
)

# Graficar los datos
ggplot(df, aes(x = grupo, y = niveles_glucosa, fill = grupo)) +
  geom_boxplot(alpha = 0.7, outlier.colour = "red") +
  geom_point(position = position_jitter(width = 0.1), alpha = 0.5) +
  labs(
    title = "Comparación de Niveles de Glucosa entre Grupos",
    x = "Grupo",
    y = "Niveles de Glucosa (mg/dL)"
  ) +
  theme_minimal() +
  scale_fill_manual(values = c("#00BFC4", "#F8766D"))
```
Elaboracion de la grafica pero agregando la significancia 
```{r}
library(ggplot2)
library(ggpubr)

# Crear un data frame con los datos
df <- data.frame(
  grupo = rep(c("Control", "Experimental"), each = 30),
  niveles_glucosa = c(grupo_control, grupo_experimental)
)

# Graficar los datos con significancia
ggplot(df, aes(x = grupo, y = niveles_glucosa, fill = grupo)) +
  geom_boxplot(alpha = 0.7, outlier.colour = "red") +
  geom_point(position = position_jitter(width = 0.1), alpha = 0.5) +
  labs(
    title = "Comparación de Niveles de Glucosa entre Grupos",
    x = "Grupo",
    y = "Niveles de Glucosa (mg/dL)"
  ) +
  theme_minimal() +
  scale_fill_manual(values = c("#00BFC4", "#F8766D")) +
  stat_compare_means(
    method = "t.test", # Realizar prueba t
    label = "p.format", # Mostrar el valor p en formato estándar o lo puedes cambiar por "p.signif" para asteriscos
    label.y = max(df$niveles_glucosa) + 5 # Ajustar la posición de la etiqueta
  ,label.x=1.5)
```

