Jugando con los datos de Alex en el exam de ingreso a la UNAM

Primero registro sus datos manualmente

alex <- data.frame(Tema = c("Física", "Literatura", "Química", "Geografia", 
    "Matemáticas", "Español", "Biologia", "Historia Universal", "Historia de México"), 
    Aciertos = c(11, 5, 12, 7, 17, 14, 11, 10, 9), Preguntas = c(12, 10, 13, 
        10, 24, 18, 13, 10, 10))

Luego calculo el porcentaje de respuestas correctas por tema. También calculo el número de aciertos esperados tomando en cuenta que en total Alex respondió 80% de las preguntas correctamente.

alex$Porcentaje <- alex$Aciertos/alex$Preguntas * 100
alex$Esperado <- sum(alex$Aciertos)/sum(alex$Preguntas) * alex$Preguntas

Ahora podemos explorar los datos.

alex
##                 Tema Aciertos Preguntas Porcentaje Esperado
## 1             Física       11        12      91.67      9.6
## 2         Literatura        5        10      50.00      8.0
## 3            Química       12        13      92.31     10.4
## 4          Geografia        7        10      70.00      8.0
## 5        Matemáticas       17        24      70.83     19.2
## 6            Español       14        18      77.78     14.4
## 7           Biologia       11        13      84.62     10.4
## 8 Historia Universal       10        10     100.00      8.0
## 9 Historia de México        9        10      90.00      8.0

Con estos datos puedo hacer una prueba llamada Goodness of fit.

ts <- sum((alex$Aciertos - alex$Esperado)^2/alex$Esperado)
pval <- pchisq(ts, df = nrow(alex) - 1, lower = FALSE)
paste("Chi-squared:", round(ts, 4), "pvalue:", round(pval, 4))
## [1] "Chi-squared: 2.6231 pvalue: 0.9557"

También puedo hacer esta prueba usando funciones de R directamente.

chi <- chisq.test(alex$Aciertos, p = alex$Esperado, rescale.p = TRUE)
chi
## 
##  Chi-squared test for given probabilities
## 
## data:  alex$Aciertos 
## X-squared = 2.623, df = 8, p-value = 0.9557

En ambos casos, los valores esperados son los mismos.

chi$expected
## [1]  9.6  8.0 10.4  8.0 19.2 14.4 10.4  8.0  8.0
alex$Esperado
## [1]  9.6  8.0 10.4  8.0 19.2 14.4 10.4  8.0  8.0

En fin, con este resultado podemos concluir que no hay una diferencia significativa entre los aciertos que Alex obtuvo por tema comparado con los que esperariamos, tomando en cuenta que el total de 96 de las 120 preguntas (80%) correctamente.

Otros análisis requieren de más datos. Por ejemplo, con los datos de otros aspirantes que fueron aceptados a la carrera de Alex podemos y el de otras carreras podemos ver si hay algún perfil entre los alumnos de la carrera de Alex.