data <- data.frame(
Sexo = c("Femenino","Masculino"),
No_fuma = c(21,24),
Si_fuma = c(28,27)
)
data$Total <- data$No_fuma + data$Si_fuma
data
Enunciado: Diga qué tipo de variables son “Sexo” y “Fuma”. Sexo: cualitativa nominal. Fuma: cualitativa nominal dicotómica.
\[ \text{Sexo} \in \{\text{F}, \text{M}\}, \qquad \text{Fuma} \in \{\text{Sí}, \text{No}\} \]
Enunciado: Determine la proporción y el porcentaje de mujeres y de hombres entre los fumadores.
total_fuma <- sum(data$Si_fuma)
mujeres_fuman <- data$Si_fuma[data$Sexo=="Femenino"]
hombres_fuman <- data$Si_fuma[data$Sexo=="Masculino"]
prop_mujeres <- mujeres_fuman / total_fuma
prop_hombres <- hombres_fuman / total_fuma
tabla_b <- data.frame(
Grupo = c("Mujeres fumadoras","Hombres fumadores"),
Conteo = c(mujeres_fuman, hombres_fuman),
Proporcion = c(prop_mujeres, prop_hombres),
Porcentaje = c(prop_mujeres, prop_hombres)*100
)
tabla_b
\[ P(\text{Mujer} \mid \text{Fuma}) = \frac{28}{55} \approx 0.5091 \quad (50.91\%) \]
\[ P(\text{Hombre} \mid \text{Fuma}) = \frac{27}{55} \approx 0.4909 \quad (49.09\%) \]
choose_fun <- function(n,k) ifelse(k>n,0,choose(n,k))
N <- total_fuma
W <- mujeres_fuman
M <- hombres_fuman
p_d <- choose_fun(W,2)*choose_fun(M,2)/choose_fun(N,4)
p_d
\[ P = \frac{\binom{28}{2}\binom{27}{2}}{\binom{55}{4}} \approx 0.3890 \]
p_e <- (W/N) * ((W-1)/(N-1)) * (M/(N-2)) * ((M-1)/(N-3))
p_e
\[ P = \frac{28}{55} \cdot \frac{27}{54} \cdot \frac{27}{53} \cdot \frac{26}{52} \approx 0.0648 \]
p_f <- choose_fun(W,4)/choose_fun(N,4)
p_f
\[ P = \frac{\binom{28}{4}}{\binom{55}{4}} \approx 0.0600 \]
p_g <- choose_fun(W,3)*choose_fun(M,1)/choose_fun(N,4)
p_g
\[ P = \frac{\binom{28}{3}\binom{27}{1}}{\binom{55}{4}} \approx 0.2593 \]
El enunciado menciona “cuatro mujeres y tres hombres” en una muestra de 4 personas. Esto es imposible:
\[ P = 0 \]
p_3hombres <- choose_fun(M,3)*choose_fun(W,1)/choose_fun(N,4)
p_i <- p_f + p_3hombres
p_i
\[ P = \frac{\binom{28}{4}}{\binom{55}{4}} + \frac{\binom{27}{3}\binom{28}{1}}{\binom{55}{4}} \approx 0.3002 \]
Es el mismo caso que seleccionar 4 mujeres.
p_j <- p_f
p_j
\[ P = \frac{\binom{28}{4}}{\binom{55}{4}} \approx 0.0600 \]