Distribuciones
Maestría en Gobierno y Políticas Públicas
Diego Solís Delgadillo
Distribución normal
Important
\[ Z= \frac{x-\mu}{\sigma} \]
Puntuaciones Z
Ejemplo
Estatura
Tenemos un individuo que mide 1.80 cm
En la muestra la media es de 1.68
La desviación estándar es de 7 cm
¿Cuántas personas hay por encima de 1.80?
\[ Z= \frac{x-\bar{x}}{se} \]
\[ Z= \frac{1.80-1.68}{7}=1.71 \]
Tip
Important
Ejemplo
Ejemplo
Juan (Derecho)
\[ Z= \frac{81-95}{7}=-2 \]
María (Estadística)
\[ Z= \frac{75-60}{6}=2.5 \]
Important
Ejemplo
Ejemplo
La media y desviación estándar del TOEFL es 75 y la desviación estándar es de 15
La media y la desviación estándar para el IELTS son 6 y 1
TOEF
\[ Z= \frac{92-75}{15}=1.13 \]
IELTS
\[ Z= \frac{7.7-6}{1}=1.7 \]
Distribuciones muestrales
Maestría en Gobierno y Políticas Públicas
Diego Solís Delgadillo
¿Cómo saber cuántas esferas rojas y blancas hay en el recipiente?
Important
# A tibble: 6 × 4
group replicate red_balls prop_red
<chr> <int> <int> <dbl>
1 Ilyas, Yohan 1 21 0.42
2 Morgan, Terrance 2 17 0.34
3 Martin, Thomas 3 21 0.42
4 Clark, Frank 4 21 0.42
5 Riddhi, Karina 5 18 0.36
6 Andrew, Tyler 6 19 0.38
# A tibble: 2,400 × 2
ball_ID color
<int> <chr>
1 1 white
2 2 white
3 3 white
4 4 red
5 5 white
6 6 white
7 7 red
8 8 white
9 9 red
10 10 white
# ℹ 2,390 more rows
# A tibble: 50 × 3
# Groups: replicate [1]
replicate ball_ID color
<int> <int> <chr>
1 1 942 white
2 1 1049 red
3 1 819 red
4 1 1888 red
5 1 1063 red
6 1 1974 red
7 1 559 white
8 1 154 white
9 1 1640 white
10 1 1406 white
# ℹ 40 more rows
# A tibble: 50 × 4
# Groups: replicate [1]
replicate ball_ID color rojas
<int> <int> <chr> <lgl>
1 1 942 white FALSE
2 1 1049 red TRUE
3 1 819 red TRUE
4 1 1888 red TRUE
5 1 1063 red TRUE
6 1 1974 red TRUE
7 1 559 white FALSE
8 1 154 white FALSE
9 1 1640 white FALSE
10 1 1406 white FALSE
# ℹ 40 more rows
muestra %>%
mutate(rojas = color == "red") %>%
summarize(num_roj = sum(rojas)) %>%
mutate(prop_roj = num_red / 50)
# A tibble: 1 × 3
replicate num_roj prop_roj
<int> <int> <dbl>
1 1 21 0.42
# A tibble: 1,650 × 3
# Groups: replicate [33]
replicate ball_ID color
<int> <int> <chr>
1 1 2167 red
2 1 2133 white
3 1 342 white
4 1 642 white
5 1 1415 red
6 1 1374 red
7 1 1056 white
8 1 27 red
9 1 2277 white
10 1 1979 white
# ℹ 1,640 more rows
prop_rojas <- muestras %>%
group_by(replicate) %>%
summarize(rojas = sum(color == "red")) %>%
mutate(prop_roj = rojas / 50)
# A tibble: 33 × 3
replicate rojas prop_roj
<int> <int> <dbl>
1 1 20 0.4
2 2 24 0.48
3 3 25 0.5
4 4 16 0.32
5 5 24 0.48
6 6 20 0.4
7 7 17 0.34
8 8 18 0.36
9 9 16 0.32
10 10 27 0.54
# ℹ 23 more rows
ggplot(virtual_prop_red, aes(x = prop_red)) +
geom_histogram(binwidth = 0.05, boundary = 0.4, color = "white") +
labs(x = "Proporción de esferas rojas",
title = "Distribución de 33 muestras")+theme_minimal()
# A tibble: 50,000 × 3
# Groups: replicate [1,000]
replicate ball_ID color
<int> <int> <chr>
1 1 1106 white
2 1 1315 red
3 1 825 white
4 1 1885 red
5 1 974 white
6 1 1957 red
7 1 816 red
8 1 618 white
9 1 1776 red
10 1 1364 white
# ℹ 49,990 more rows
prop_rojas_1000 <- muestras_1000 %>%
group_by(replicate) %>%
summarize(rojo = sum(color == "red")) %>%
mutate(prop_rojo= rojo / 50)
prop_rojas_1000
# A tibble: 1,000 × 3
replicate rojo prop_rojo
<int> <int> <dbl>
1 1 22 0.44
2 2 24 0.48
3 3 22 0.44
4 4 22 0.44
5 5 21 0.42
6 6 21 0.42
7 7 21 0.42
8 8 16 0.32
9 9 16 0.32
10 10 19 0.38
# ℹ 990 more rows
ggplot(prop_rojas_1000, aes(x = prop_rojo)) +
geom_histogram(binwidth = 0.05, boundary = 0.4, color = "white") +
labs(x = "Proporción de esferas rojas",
title = "Distribución para mil muestras")+
theme_minimal()
Important
# A tibble: 1 × 1
sd
<dbl>
1 0.0985
# A tibble: 1 × 1
sd
<dbl>
1 0.0645
# A tibble: 1 × 1
sd
<dbl>
1 0.0485
Población
Parámetro poblacional
Censo
Muestra
Estimador
Muestra representativa
Generalización
Muestra sesgada
Muestra aleatoria
Distribución muestral
Important
Parte de una hipotética repetición infinita de muestras
La distribución de esas medias tendrá unadistribución normal
Important
Tip
Important
Tip