##Se da lectura al archivo de iris
x<-"C:/Users/aacad/OneDrive/Documents/ADRIANA/FCPYS/R COMO INSTRUMENTO DE INVESTIGACION/a4_iris.csv"
y<-read.csv(x,as.is = TRUE)
str(y)
## 'data.frame': 150 obs. of 5 variables:
## $ sepal.length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
## $ sepal.width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
## $ petal.length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
## $ petal.width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
## $ variety : chr "Setosa" "Setosa" "Setosa" "Setosa" ...
summary(y)
## sepal.length sepal.width petal.length petal.width
## Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100
## 1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300
## Median :5.800 Median :3.000 Median :4.350 Median :1.300
## Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
## 3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
## Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
## variety
## Length:150
## Class :character
## Mode :character
##
##
##
#Una revisión rápida de los datos muestra que la longitud del sépalo oscila entre 4.3 y 7.9; el ancho de 2 a 4.4; la longitud del pétalo de 1 a 6.9 y el ancho del pétalo de 0.1 a 2.5.
#La inspección gráfica muestra diferencias entre las variedades, en cuanto a largo del sépalo y pétalo, y ancho de pétalo, la variedad setosa registra los valores más bajos, mientras que virginica los altos, en cuanto al ancho del sépalo, Setosa tiene los valores más grandes, mientras versicolor los más pequeños. Existe asociación entre los largos y anchos de sépalos y pétalos, las cuales se ilustran en la gráfica 5.
library(ggplot2)
library(GGally)
## Warning: package 'GGally' was built under R version 4.5.2
y<-data.frame(y)
graph1<-ggplot(y,aes(x=sepal.length,fill=variety))+
geom_histogram(position = "identity", alpha = 0.6, bins = 20)+
labs(title = "Histogramas de la longitud del sépalo",
x = "Longitud",
y = "Casos")
graph2<-ggplot(y,aes(x=sepal.width,fill=variety))+
geom_histogram(position = "identity", alpha = 0.6, bins = 20)+
labs(title = "Histogramas del ancho del sépalo",
x = "ancho",
y = "Casos")
graph3<-ggplot(y,aes(x=petal.length,fill=variety))+
geom_histogram(position = "identity", alpha = 0.6, bins = 20)+
labs(title = "Histogramas de la longitud del pétalo",
x = "Longitud",
y = "Casos")
graph4<-ggplot(y,aes(x=petal.width,fill=variety))+
geom_histogram(position = "identity", alpha = 0.6, bins = 20)+
labs(title = "Histogramas del ancho del pétalo",
x = "ancho",
y = "Casos")
graph5<-ggpairs(y, aes(color = variety, alpha = 0.5))
print(graph1)
print(graph2)
print(graph3)
print(graph4)
print(graph5)
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.