” Introducción

En este ejercicio ajustaremos modelos de regregión logística que nos permitan determinar el sexo de un inviduo a través de los huesos del húmero, considerando la LMHD y la ABMHD

### El objetivo es aplicar regresión logística para determinación del sexo

## Defino mi directorio de trabajo
setwd("C:/Users/linda/OneDrive/Escritorio/ESTADISTICA")
##Abriendo paquete pacman
library(pacman)

El archivo esta en formato SPSS, lo abrimos mediante la libreria haven

p_load(haven,dplyr,ggplot2,MASS,tinytex) Hombro <- read_sav(“Datos hombro.sav”) table (Hombro\(sexoN) ## Frecuencias de sexo ## Cambiamos las categorías para predecir p(Hombre) Hombro\)sexoN <- factor(Hombro\(sexoN, levels = c(2, 1), labels = c("Mujer", "Hombre")) table (Hombro\)sexoN) ## Frecuencias de sexo ## Omitir datos perdidos Hombro_sinNA <- na.omit(Hombro[, c(“sexoN”, “LMHD”,“ABHD”)]) # Ajustar modelo logístico binario modelo1 <- glm(sexoN ~ LMHD + ABHD, data = Hombro_sinNA, family = binomial(link = “logit”)) summary(modelo1)

Probabilidades de ser “Hombre”

Hombro_sinNA$prob_Hombre <- predict(modelo1, type = “response”)

Clasificación usando 0.5 como punto de corte

Hombro_sinNA\(predicho <- ifelse(Hombro_sinNA\)prob_Hombre >= 0.5, “Hombre”, “Mujer”)

Matriz de confusión

table(Real = Hombro_sinNA\(sexoN, Predicho = Hombro_sinNA\)predicho)

Porcentaje de acierto

mean(Hombro_sinNA\(sexoN == Hombro_sinNA\)predicho) * 100

Gráfica de probabilidades predichas

ggplot(Hombro_sinNA, aes(x = prob_Hombre, fill = sexoN)) + geom_density(alpha = 0.4) + geom_vline(xintercept = 0.5, linetype = “dashed”) + theme_minimal() + labs(title = “Probabilidades predichas de ser Hombre”, x = “P(Hombre)”, y = “Densidad”) coef(modelo1) cat(“Ecuación logística:(p) =”, round(coef(modelo1)[1], 4), ” + “, round(coef(modelo1)[2], 4),”LMHD + “, round(coef(modelo1)[3], 4),”ABHD“)

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.