data("iris")
head(iris)
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3.0 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5.0 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
library(ggplot2)
p1=ggplot(data = iris,aes(x=Sepal.Length))
p1+geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
En el histograma podemos analizar la frecuencia del largo del sepalo de las flores, en donde se nota que hay una mayor cantidad de flores con una medida entre 5 y 6 cms.
p2=ggplot(data = iris,aes(x=Sepal.Length, y=Sepal.Width))
p2+geom_point()
En este diagrama de puntos observamos la distribución de que presentan las flores con respecto a su largo y a su ancho, aunque no podemos identificar bien por especie ya que no podemos diferenciar dado su color, por esto replicamos este diagrama pero con un color que diferencie cada especie.
p3=ggplot(data = iris,aes(x=Sepal.Length, y=Sepal.Width,color=Species))
p3+geom_point()
Con este diagrama ya podemos ver de mejor manera la distribución por especie, por ejemplo la setosa a medida que aumenta su largo, aumenta en mayor proporción su ancho.
p4=ggplot(data = iris,aes(x=Sepal.Length, y=Sepal.Width,fill=Species))
p4+geom_point()+geom_smooth(method = "lm")
## `geom_smooth()` using formula 'y ~ x'
Con este diagrama podemos observar mucho mejor, el gráfico anterior, ya que nos muestra una linea de tendencia en donde se interpreta mejor la gráfica.
p5=ggplot(data = iris,aes(x=Species, y=Sepal.Length, fill=Species))
p5+geom_boxplot()
Con el diagrama de caja vemos la frecuencia del largo de cada una de las especies donde nos muestra que la especie Virginica tiene los sepalos mas largos y la Setosa los mas pequeños.