La siguiente información fue obtenida de wkipedia el 10 de noviembre de 2025 en la siguiente liga: https://es.wikipedia.org/wiki/Conjunto_de_datos_flor_iris
“El conjunto de datos flor Iris o conjunto de datos iris de Fisher es un conjunto de datos multivariante introducido por Ronald Fisher en su artículo de 1936, The use of multiple measurements in taxonomic problems (El uso de medidas múltiples en problemas taxonómicos) como un ejemplo de análisis discriminante lineal. A veces, se llama Iris conjunto de datos de Anderson porque Edgar Anderson coleccionó los datos para cuantificar la variación morfológica de la flor Iris de tres especies relacionadas. Dos de las tres especies se coleccionaron en la Península de la Gaspesia «todos son de la misma pastura, y recolectado el mismo día y medidos al mismo tiempo por la misma persona con el mismo aparato».
El conjunto de datos contiene 50 muestras de cada una de tres especies de Iris (Iris setosa, Iris virginica e Iris versicolor). Se midió cuatro rasgos de cada muestra: el largo y ancho del sépalo y pétalo, en centímetros. Basado en la combinación de estos cuatro rasgos, Fisher desarrolló un modelo discriminante lineal para distinguir entre una especie y otra. ”
¿Cómo se relacionan las dimensiones del pétalo y sépalo entre sí, y en qué medida estas diferencias permiten distinguir a las especies de iris?
Empezaremos por definir el directorio de trabajo donde se aloja la base de datos ylas librerias que usaremos para el presente análisis
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Abriremos el archivo que se encuentra en formato CSV y exploramos su estructura.
Realizamos la gráfica 1.
## `geom_smooth()` using formula = 'y ~ x'
A partir de la gráfica podemos inferir que: Existe una relación positiva entre Sepal.Length y Petal.Length. Setosa se distingue claramente porque tiene pétalos muy pequeños. Versicolor y Virginica muestran relaciones más fuertes, pero con rangos distintos. Las líneas de regresión muestran cómo la pendiente aumenta según la especie, indicando cambios estructurales en las flores.
Ahora realizaremos la gráfica 2.
La gráfica permite observar que: Setosa tiene los pétalos más pequeños y menor variabilidad.
Virginica presenta valores mayores en todas las variables, salvo el ancho del sépalo.
En Sepal.Width, Setosa es la más ancha, lo que la separa de las otras dos especies.
La gráfica facilita comparar distribuciones, cuartiles y presencia de valores extremos.
A continuación se presenta la gráfica 3.
Podemos observar que:
Setosa aparece completamente separada del resto, con una menor variabilidad.
Versicolor y Virginica se traslapan parcialmente, pero conservan rangos distintos.