Estadística Avanzada

FORMULARIO

Autor/a

Blás Antonio Benítez Cristaldo

1 Distribución de probabilidades

1.1 Distribución binomial

1.1.1 Referencias

n # Número total de ensayos
p # Probabilidad de éxito en cada ensayo
k # Número de éxitos deseado

1.1.2 Probabilidad de obtener exactamente \(k\) éxitos \(p(x=k)\)

prob_exacta <- dbinom(k, n, p)
print(prob_exacta)

1.1.3 Probabilidad de obtener hasta \(k\) éxitos \(P(x\leq k)\)

prob_acumulada <- pbinom(k, n, p)
print(prob_acumulada)

1.1.4 Probabilidad de obtener más de \(k\) éxitos \(P(x\geq k)\)

prob_mas_de_k <- 1 - pbinom(k, n, p)
print(prob_mas_de_k)

1.2 Distribución de Poisson

1.2.1 Referencias:

media # Tasa promedio de ocurrencia
k # Número exacto de eventos

1.2.2 Probabilidad de exactamente 𝑘 eventos \(p(x=k)\) (dpois)

prob_exacta <- dpois(k, media)
print(prob_exacta)

1.2.3 Probabilidad de obtener hasta 𝑘 eventos 𝑃(𝑋 ≤ 𝑘) (ppois)

prob_acumulada <- ppois(k, media)
print(prob_acumulada)

1.2.4 Probabilidad de obtener más de 𝑘 eventos 𝑃(𝑋 > 𝑘)

prob_mas_de_k <- 1 - ppois(k, media)
print(prob_mas_de_k)

1.3 Distribución Normal

1.3.1 Referencias

mu # Media
sigma # Desviación estándar
x # Valor específico

1.3.2 Probabilidad de que 𝑋 tome un valor exacto \(p(x=k)\) (dnorm)

densidad <- dnorm(x, mean = mu, sd = sigma)
print(densidad)

1.3.3 Probabilidad de que 𝑋 sea menor o igual a un valor (pnorm)

prob_acumulada <- pnorm(x, mean = mu, sd = sigma)
print(prob_acumulada)

1.3.4 Probabilidad de que 𝑋 sea mayor a un valor

prob_mas_x <- 1 - pnorm(x, mean = mu, sd = sigma)
print(prob_mas_x)

1.3.5 Probabilidad de que 𝑋 esté entre dos valores 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏)

prob_intervalo <- pnorm(b, mu, sigma) - pnorm(a, mu, sigma)
print(prob_intervalo)

2 Teoría de la inferencia estadística

2.1 Prueba de hipótesis para una muestra

2.1.1 Generar muestras

# Ejemplo: generación de datos para una prueba de hipótesis
set.seed(cumple) # Ejemplo: 3283
data <- rnorm(Cantidad, mean = media, sd = desvio)

2.1.2 Plantea las hipótesis:

  • \(H_o\):
  • \(H_a\):

2.2 Realiza la prueba:

# Prueba t para una muestra
t.test(data, mu = media)

2.2.1 Elabora la conclusión

3 Teoría de Correlación

3.1 Correlación de Pearson

3.1.1 Cargar los datos

x <- c(vector1)
y <- c(vector2)

3.1.2 Gráfico de dispersión

plot(x,y,
     main = "Un título para el gráfico",
     xlab = "etiqueta del eje x",
     ylab = "etiqueta del eje y")

3.1.3 Aplicar la función cor()

cor(x,y)

3.1.4 Interpretación

Valor de R Interpretación
0 No hay correlación
0.01 a 0.10 Correlación muy débil
0.11 a 0.30 Correlación débil
0.31 a 0.50 Correlación moderada
0.51 a 0.70 Correlación fuerte
0.71 a 0.90 Correlación muy fuerte
0.91 a 1.00 Correlación casi perfecta o perfecta
Valores negativos (-) Igual grado de correlación, pero en sentido inverso (negativo)

3.2 Análisis de regresión

3.2.1 Cargar los datos

Var1 <- c(vector1)
VAr2 <- c(vector2)

3.2.2 Construir una matriz

datos <- data.frame(Var1,Var2)

3.2.3 Crear el modelo

modelo <- lm(Var2~Var1)

3.2.4 Resumen del modelo

summary(modelo)

3.2.5 Escribir el modelo \(y=\beta_0+\beta_1x\)

3.2.6 Graficar el modelo

library(ggplot2)
datos <- data.frame(Var1,Var2)
ggplot(datos,aes(x=Var1,y=Var2))+
  geom_point()+
  geom_smooth(method="lm")+
  labs(
    title = "Un título al gráfico",
    x = "Etiqueta del eje x",
    y = "Etiqueta del eje y",
    caption = "Fuente"
  )

4 Método de mínimos cuadrados

4.1 Cargar los datos

Var1 <- c(vector1)
Var2 <- c(vector2)

4.2 Crear el modelo

modelo <- lm(Var2~Var1)

4.3 Obtener el resumen del modelo

summary(modelo)

4.4 Escribir el modelo

Var2 = beta0+beta1 Var1

4.5 Graficar el modelo

library(ggplot2)
datos <- data.frame(Var1,Var2)
ggplot(datos,aes(x=Var1,y=Var2))+
  geom_point()+
  geom_smooth(method="lm")+
  labs(
    title = "Un título al gráfico",
    x = "Etiqueta del eje x",
    y = "Etiqueta del eje y",
    caption = "Fuente"
  )

4.6 Realiza las prediccciones

# Predicción para los próximos seis meses (meses 7, 8, 9, 10, 11, 12)
nuevos_meses <- c(7,8,9,10,11,12)
predicciones <- predict(modelo_lineal, newdata=data.frame(meses=nuevos_meses))

# Mostrar las predicciones
data.frame(Meses = nuevos_meses, Predicciones = predicciones)