mydata <- read.csv("https://stats.idre.ucla.edu/stat/data/binary.csv")
## view the first few rows of the data
attach(mydata)
head(mydata)
m1=glm(admit ~gre + gpa + rank, family = binomial(link="logit"), data = mydata)
summary(m1)
de la regresion obtuvimos los siguientes resultados:
De los cuales podemos deducir que:
*la variable admit tiene como simbolo un negativo, por lo tanto afecta negativamente a la probabilidad
*la variable gre tiene como simbolo un positivo, por lo tanto afecta positivamente a la probabilidad
*la variable gpa tiene como simbolo un positivo, por lo tanto afecta positivamente a la probabilidad
*la variable rank tiene como simbolo un negativo, por lo tanto afecta negativamente a la probabilidad
beta0=(1/exp(-3.449548))
beta1=exp(0.002294)
beta2=exp(0.777014)
beta3=(1/exp(-0.560031))
De los cuales obtuvimos como resultados:
beta0=31.48
beta1=1.002
beta2=2.17
beta3=1.75
Donde se pudo deducir que,
En beta0, se pudo deducir que cada vez que haya un aumento en unidad de la variable admit, la magnitud de fracaso aumenta en 31.8 veces , por lo tanto es más probable el fracaso que el exito.
En beta1, se pudo deducir que cada vez que haya un aumento en unidad de la variable gre, la magnitud de éxito aumenta en 1.002 veces , por lo tanto es más probable el exito que el fracaso.
En beta2, se pudo deducir que cada vez que haya un aumento en unidad de la variable gpa, la magnitud de éxito aumenta en 2.17 veces , por lo tanto es más probable el exito que el fracaso.
En beta3, se pudo deducir que cada vez que haya un aumento en unidad de la variable rank, la magnitud de fracaso aumenta en 1.75 veces , por lo tanto es más probable el fracaso que el éxito.
prediccion=predict.glm(m1, type="response")
Debido a que la base de datos cuenta con una gran cantidad de datos, para representar estos valores de una manera mas sencilla se creo un histograma.
Por lo tanto como conclusión final podemos decir que, la mayoría de personas que se presentaron a las universidades no lograron acceder a la universidad.