library(ggplot2)
library(plotly)
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
data("iris")
head(iris)
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3.0 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5.0 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
ggplot(data = iris, aes(x = Sepal.Length)) +
geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Con el gráfico anterior podemos ver que la variable no presenta una distribución normal, y que los más comunes son 4,7 y 6,5 en cuanto a longitud de los pétalos.
ggplot(data = iris, aes(x = Sepal.Length , y = Sepal.Width)) +
geom_point()
De acuerdo con el gráfico anterior se observa que la relación entre el ancho y el largo del pétalo no es tan directa. Aunque debemos de tener en cuenta que se muestra tres tipos de flores.
ggplot(data = iris, aes(x = Sepal.Length , y = Sepal.Width, color = Species)) +
geom_point()
Con el gráfico anterior se puede apreciar las tres especies de flores, de las cuales hay una diferencia marcada en el comportamiento de la especie setosa, la cual presenta pétalos más anchos y no tan largos, por otro lado puede verse que las otras dos especies tienen un comportamiento casi similar.
ggplot(data = iris, aes(x = Sepal.Length , y = Sepal.Width, color = Species)) +
geom_point() +
geom_smooth(method = "lm")
## `geom_smooth()` using formula 'y ~ x'
Con este gráfico ya muestra una diferencia más clara entre estas especies de flores en cuanto al ancho y largo de sus pétalos.
g5= ggplot(data=iris, aes(x= Species , y= Sepal.Length, fill= Species))
g5+ geom_boxplot()+theme_bw()
Ahora podemos reafirmar que la especie con pétalos más cortos es setosa, y la de pétalos más largos es virginica.