Análisis del Dataset Iris

Descripción del dataset

El dataset Iris es un conjunto de datos de clasificación multiclase clásico y muy sencillo. Introducido por el estadístico y biólogo británico Ronald Fisher en su artículo de 1936 “The use of multiple measurements in taxonomic problems”. El conjunto de datos de Iris contiene cuatro características (longitud y anchura de sépalos y pétalos) de 50 muestras de tres especies de flores Iris (Iris setosa, Iris virginica e Iris versicolor).

Detalle de variables

El dataset iris está compuesto por las siguientes variables:

Variable Descripción
SepalLength Largo del sépalo de la flor iris
SepalWidth Ancho del sépalo de la flor iris
PetalLength Largo del pétalo de la flor iris
PetalWidth Ancho del pétalo de la flor iris
Species Indica el tipo de especie de la flor iris
  • SepalLength
  • SepalWidth
  • PetalLength
  • PetalWidth
  • Species
    • setosa
    • versicolor
    • virginica
Referencia de las partes de las flores iris
Referencia de las partes de las flores iris

El dataset está completo y no cuenta con valores faltantes.

Para más información consulta el siguiente enlace.

Algunos ejemplos de expresiones matemáticas con LaTeX

Podemos añadir expresiones matemáticas en el mismo texto como: \(x + \alpha = 27\).

O podemos añadir estas expresiones en otra línea:

\[\frac{x - y}{abc}\]

Resultados en R

Resumen descriptivo de las variables:

summary(iris)
##   Sepal.Length    Sepal.Width     Petal.Length    Petal.Width   
##  Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100  
##  1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300  
##  Median :5.800   Median :3.000   Median :4.350   Median :1.300  
##  Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199  
##  3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800  
##  Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500  
##        Species  
##  setosa    :50  
##  versicolor:50  
##  virginica :50  
##                 
##                 
## 

La cantidad total de registros que tiene el dataset es 150.

Resumen gráfico de las variables:

Gráfico de dispersión del ancho y largo del pétalo según especie

library(ggplot2)
ggplot(iris, aes(x= Petal.Length, y= Petal.Width, color = Species)) + geom_point()