R Markdown

##Se da lectura al archivo de iris

x<-"C:/Users/aacad/OneDrive/Documents/ADRIANA/FCPYS/R COMO INSTRUMENTO DE INVESTIGACION/a4_iris.csv"
y<-read.csv(x,as.is = TRUE)
str(y)
## 'data.frame':    150 obs. of  5 variables:
##  $ sepal.length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
##  $ sepal.width : num  3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
##  $ petal.length: num  1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
##  $ petal.width : num  0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
##  $ variety     : chr  "Setosa" "Setosa" "Setosa" "Setosa" ...
summary(y)
##   sepal.length    sepal.width     petal.length    petal.width   
##  Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100  
##  1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300  
##  Median :5.800   Median :3.000   Median :4.350   Median :1.300  
##  Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199  
##  3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800  
##  Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500  
##    variety         
##  Length:150        
##  Class :character  
##  Mode  :character  
##                    
##                    
## 

#Una revisión rápida de los datos muestra que la longitud del sépalo oscila entre 4.3 y 7.9; el ancho de 2 a 4.4; la longitud del pétalo de 1 a 6.9 y el ancho del pétalo de 0.1 a 2.5.

#La inspección gráfica muestra diferencias entre las variedades, en cuanto a largo del sépalo y pétalo, y ancho de pétalo, la variedad setosa registra los valores más bajos, mientras que virginica los altos, en cuanto al ancho del sépalo, Setosa tiene los valores más grandes, mientras versicolor los más pequeños. Existe asociación entre los largos y anchos de sépalos y pétalos, las cuales se ilustran en la gráfica 5.

library(ggplot2)
library(GGally)
## Warning: package 'GGally' was built under R version 4.5.2
y<-data.frame(y)
graph1<-ggplot(y,aes(x=sepal.length,fill=variety))+
  geom_histogram(position = "identity", alpha = 0.6, bins = 20)+
  labs(title = "Histogramas de la longitud del sépalo",
       x = "Longitud",
       y = "Casos")

graph2<-ggplot(y,aes(x=sepal.width,fill=variety))+
  geom_histogram(position = "identity", alpha = 0.6, bins = 20)+
  labs(title = "Histogramas del ancho del sépalo",
       x = "ancho",
       y = "Casos")

graph3<-ggplot(y,aes(x=petal.length,fill=variety))+
  geom_histogram(position = "identity", alpha = 0.6, bins = 20)+
  labs(title = "Histogramas de la longitud del pétalo",
       x = "Longitud",
       y = "Casos")

graph4<-ggplot(y,aes(x=petal.width,fill=variety))+
  geom_histogram(position = "identity", alpha = 0.6, bins = 20)+
  labs(title = "Histogramas del ancho del pétalo",
       x = "ancho",
       y = "Casos")

graph5<-ggpairs(y, aes(color = variety, alpha = 0.5))

print(graph1)

print(graph2)

print(graph3)

print(graph4)

print(graph5)
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.