El dataset Iris es un conjunto de datos de clasificación multiclase clásico y muy sencillo. Introducido por el estadístico y biólogo británico Ronald Fisher en su artículo de 1936 “The use of multiple measurements in taxonomic problems”. El conjunto de datos de Iris contiene cuatro características (longitud y anchura de sépalos y pétalos) de 50 muestras de tres especies de flores Iris (Iris setosa, Iris virginica e Iris versicolor).
El dataset iris está compuesto por las siguientes variables:
| Variable | Descripción |
|---|---|
| SepalLength | Largo del sépalo de la flor iris |
| SepalWidth | Ancho del sépalo de la flor iris |
| PetalLength | Largo del pétalo de la flor iris |
| PetalWidth | Ancho del pétalo de la flor iris |
| Species | Indica el tipo de especie de la flor iris |
SepalLengthReferencia de las partes de las flores iris
El dataset está completo y no cuenta con valores faltantes
Para más información consulta el siguiente enlace.
Podemos añadir expresiones matemáticas en el mismo texto como: \(x + \alpha = 27\).
O podemos añadir estas expresiones en otra línea:
\[ \frac{x-y}{abc} = 14\]
| Nombre | Apellido |
|---|---|
| Brian | Clemente |
| Jasmin | Santiago |
data(iris)
summary(iris)## Sepal.Length Sepal.Width Petal.Length Petal.Width
## Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100
## 1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300
## Median :5.800 Median :3.000 Median :4.350 Median :1.300
## Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
## 3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
## Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
## Species
## setosa :50
## versicolor:50
## virginica :50
##
##
##
La cantidad de registros que tiene el dataset es 150.
library(ggplot2)
ggplot(iris, aes(x= Petal.Length, y= Petal.Width, color = Species)) + geom_point()Gráfico de dispersión del ancho y largo del pétalo según especie
library(corrplot)## corrplot 0.95 loaded
# matriz de correlaciones
mat_cor = cor(iris[,1:4])
# grafico de correlaciones
corrplot(mat_cor)Gráfico de correlación de variable