Plantas del género Iris – Regresión logística
Carga y gestión de los datos
iris_aae <- read.csv("iris_aae.csv", header = TRUE) # Carga de datos
iris_set_ver <- iris_aae[iris_aae$variety == "Setosa" |
iris_aae$variety == "Versicolor",
c(3:5)] # Selección de casos y de variables
iris_set_ver$especie[iris_set_ver$variety == "Setosa"] <- 0
iris_set_ver$especie[iris_set_ver$variety == "Versicolor"] <- 1 # Creación de variable binaria
head(iris_set_ver)
## petal_length petal_width variety especie
## 1 1.4 0.2 Setosa 0
## 2 1.4 0.2 Setosa 0
## 3 1.3 0.2 Setosa 0
## 4 1.5 0.2 Setosa 0
## 5 1.4 0.2 Setosa 0
## 6 1.7 0.4 Setosa 0
Ajuste del modelo
modelo_log_set_ver <- glm(especie ~ petal_length + petal_width,
data = iris_set_ver,
family = binomial) # Ajustar modelo de regresión logística
## Warning: glm.fit: algorithm did not converge
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
Resumen del modelo
summary.glm(modelo_log_set_ver) # Resumen del modelo
##
## Call:
## glm(formula = especie ~ petal_length + petal_width, family = binomial,
## data = iris_set_ver)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -72.73 70289.28 -0.001 0.999
## petal_length 18.37 74002.45 0.000 1.000
## petal_width 35.76 199094.68 0.000 1.000
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1.3863e+02 on 99 degrees of freedom
## Residual deviance: 1.8210e-09 on 97 degrees of freedom
## AIC: 6
##
## Number of Fisher Scoring iterations: 25
### *** MI EDITOR DE RMARCKDOWN YA NO ME PERMITIÓ ESCRIBIR TEXTO EN MI INFORME DE ACTIVIDAD ***
#### Comentario: Seleccionamos la especie notoriamente más pequeña en las estructuras florares (I. setosa) y la comparamos con la que más se aproxima en las dimensiones de los pétalos (I. versicolor). En caso de que esta discriminación de las especies a partir de las diferencias en sus dimensiones del pétalo fuera significativa, la diferencia con la tercera (I. Virginica) también lo sería.
### INTERPRETACION: los coeficientes de la regresión logística fueron altamente significativos, por lo que se concluye que, con base en las dos dimensiones básicas de los pétalos, se puede saber de ahora en adelante de qué especie proviene un ejemplar: de I. setosa o de I. versicolor.