data(iris)
summary(iris)
## Sepal.Length Sepal.Width Petal.Length Petal.Width
## Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100
## 1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300
## Median :5.800 Median :3.000 Median :4.350 Median :1.300
## Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
## 3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
## Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
## Species
## setosa :50
## versicolor:50
## virginica :50
##
##
##
Interpretación:
En la tabla anterior se presenta las estadisticas descrptivas para
el conjunto de datos iris, donde se observa que hay 50 flores de cada
especie
library(ggplot2)
g1= ggplot(iris, aes(x=Sepal.Length))+
geom_histogram(fill="skyblue")
g2=ggplot(iris, aes(x=Sepal.Width))+
geom_histogram(fill="blue")
g3=ggplot(iris, aes(x=Petal.Length))+
geom_histogram(fill="red")
g4=ggplot(iris, aes(x=Petal.Width))+
geom_histogram(fill="darkred")
Panel Grafico
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.

Diagrama de cajas comparativos
ggplot(iris, aes(y=Sepal.Length, x=Species, fill=Species))+
geom_boxplot(fill="skyblue")

ggplot(iris, aes(y=Sepal.Width, x=Species, fill=Species))+
geom_boxplot(fill="blue")

ggplot(iris, aes(y=Petal.Length, x=Species, fill=Species))+
geom_boxplot()

ggplot(iris, aes(y=Petal.Width, x=Species, fill=Species))+
geom_boxplot()

Interpretación
- La especie Setosa es la que presenta menor dimensión en Petal Length
y Petal Width
- La especie Virginica es la que presenta mayor dimensión en casi
todas las variables
Diagramas de Dispersión
ggplot(iris, aes(x=Sepal.Length, y=Petal.Length, fill=Species))+
geom_jitter()+geom_smooth(method="lm",colour="brown")
## `geom_smooth()` using formula = 'y ~ x'

- Se observa que las variables Sepal.Length y Petal.Length se
encuentran correlacionadas, teniendo una relación directamente
proporcional.
cor(iris$Sepal.Length, iris$Petal.Length)
## [1] 0.8717538