Plantas del género Iris – Regresión logística

Carga y gestión de los datos

iris_aae <- read.csv("iris_aae.csv", header = TRUE) # Carga de datos
iris_set_ver <- iris_aae[iris_aae$variety == "Setosa" |
                           iris_aae$variety == "Versicolor",
                         c(3:5)] # Selección de casos y de variables







iris_set_ver$especie[iris_set_ver$variety == "Setosa"] <- 0
iris_set_ver$especie[iris_set_ver$variety == "Versicolor"] <- 1 # Creación de variable binaria
head(iris_set_ver)
##   petal_length petal_width variety especie
## 1          1.4         0.2  Setosa       0
## 2          1.4         0.2  Setosa       0
## 3          1.3         0.2  Setosa       0
## 4          1.5         0.2  Setosa       0
## 5          1.4         0.2  Setosa       0
## 6          1.7         0.4  Setosa       0

Ajuste del modelo

modelo_log_set_ver <- glm(especie ~ petal_length + petal_width,
                  data = iris_set_ver,
                  family = binomial) # Ajustar modelo de regresión logística
## Warning: glm.fit: algorithm did not converge
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred

Resumen del modelo

summary.glm(modelo_log_set_ver) # Resumen del modelo 
## 
## Call:
## glm(formula = especie ~ petal_length + petal_width, family = binomial, 
##     data = iris_set_ver)
## 
## Coefficients:
##               Estimate Std. Error z value Pr(>|z|)
## (Intercept)     -72.73   70289.28  -0.001    0.999
## petal_length     18.37   74002.45   0.000    1.000
## petal_width      35.76  199094.68   0.000    1.000
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1.3863e+02  on 99  degrees of freedom
## Residual deviance: 1.8210e-09  on 97  degrees of freedom
## AIC: 6
## 
## Number of Fisher Scoring iterations: 25
### *** MI EDITOR DE RMARCKDOWN YA NO ME PERMITIÓ ESCRIBIR TEXTO EN MI INFORME DE ACTIVIDAD ***

#### Comentario: Seleccionamos la especie notoriamente más pequeña en las estructuras florares (I. setosa) y la comparamos con la que más se aproxima en las dimensiones de los pétalos (I. versicolor). En caso de que esta discriminación de las especies a partir de las diferencias en sus dimensiones del pétalo fuera significativa, la diferencia con la tercera (I. Virginica) también lo sería.

### INTERPRETACION: los coeficientes de la regresión logística fueron altamente significativos, por lo que se concluye que, con base en las dos dimensiones básicas de los pétalos, se puede saber de ahora en adelante  de qué especie proviene un ejemplar: de I. setosa o de I. versicolor.