Blog 1 Data 621

Blog Entry 1: Introduction to Descriptive Statistics with Iris Dataset

Title: Exploring the Iris Dataset: A Statistical Journey

Overview

In this blog entry, we delve into the fascinating world of statistics through the lens of the famous Iris dataset. The Iris dataset is a classic in the field of statistics and data science, comprising measurements of Sepal Length, Sepal Width, Petal Length, and Petal Width for three species of iris flowers: Setosa, Versicolor, and Virginica.

Importance

Understanding statistical methods is crucial in today’s data-driven world, and the Iris dataset serves as an excellent starting point for exploring various statistical techniques. By analyzing this dataset, we can gain insights into key statistical concepts such as summary statistics, data visualization, and inferential statistics.

#Loading necessary libraries
library(datasets)
library(ggplot2)
#install.packages("gridExtra")
library(gridExtra)

#Loading Iris dataset 
data(iris)

#Summary statistics for Sepal Length, Width, Petal Length, and Width
summary_stats <- summary(iris[, c("Sepal.Length", "Sepal.Width", "Petal.Length", "Petal.Width")])

#Creating boxplot of Sepal Length, Width, Petal Length, and Width
boxplots <- lapply(names(iris)[1:4], function(var) {
  ggplot(iris, aes_string(y = var, x = "Species", fill = "Species")) +
    geom_boxplot() +
    labs(title = paste("Boxplot of", var, "by Species"),
         x = "Species", y = var) +
    theme_minimal()
})

## Warning: `aes_string()` was deprecated in ggplot2 3.0.0.
## ℹ Please use tidy evaluation idioms with `aes()`.
## ℹ See also `vignette("ggplot2-in-packages")` for more information.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

#Combining boxplots into one plot
boxplot_grid <- grid.arrange(grobs = boxplots, ncol = 2)

#Creating histogram of Sepal Length, Width, Petal Length, and Width
histograms <- lapply(names(iris)[1:4], function(var) {
  ggplot(iris, aes_string(x = var, fill = "Species")) +
    geom_histogram(binwidth = 0.5, color = "black") +
    labs(title = paste("Histogram of", var),
         x = var, y = "Frequency") +
    theme_minimal()
})

#Combining histograms into one plot
histogram_grid <- grid.arrange(grobs = histograms, ncol = 2)

#Printing summary statistics and visualizations
cat("Summary Statistics for Sepal Length, Sepal Width, Petal Length, and Petal Width:\n")

## Summary Statistics for Sepal Length, Sepal Width, Petal Length, and Petal Width:

print(summary_stats)

##   Sepal.Length    Sepal.Width     Petal.Length    Petal.Width   
##  Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100  
##  1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300  
##  Median :5.800   Median :3.000   Median :4.350   Median :1.300  
##  Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199  
##  3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800  
##  Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500

print(boxplot_grid)

## TableGrob (2 x 2) "arrange": 4 grobs
##   z     cells    name           grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## 3 3 (2-2,1-1) arrange gtable[layout]
## 4 4 (2-2,2-2) arrange gtable[layout]

print(histogram_grid)

## TableGrob (2 x 2) "arrange": 4 grobs
##   z     cells    name           grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## 3 3 (2-2,1-1) arrange gtable[layout]
## 4 4 (2-2,2-2) arrange gtable[layout]

Conclusion

In conclusion, this blog entry highlights the importance of statistical analysis in extracting meaningful insights from real-life datasets. By leveraging statistical methods and visualization techniques, we can uncover hidden patterns, relationships, and trends in data, ultimately enabling informed decision-making in various fields ranging from biology and ecology to business and finance. ```

LS0tDQp0aXRsZTogIkJsb2cgMSBEYXRhIDYyMSINCmF1dGhvcjogIkxhdXJhIEIiDQpkYXRlOiAiYHIgU3lzLkRhdGUoKWAiDQpvdXRwdXQ6IG9wZW5pbnRybzo6bGFiX3JlcG9ydA0KLS0tDQoNCg0KIyMgQmxvZyBFbnRyeSAxOiBJbnRyb2R1Y3Rpb24gdG8gRGVzY3JpcHRpdmUgU3RhdGlzdGljcyB3aXRoIElyaXMgRGF0YXNldA0KDQoNCg0KDQpUaXRsZTogRXhwbG9yaW5nIHRoZSBJcmlzIERhdGFzZXQ6IEEgU3RhdGlzdGljYWwgSm91cm5leQ0KDQojIyMgT3ZlcnZpZXcNCg0KSW4gdGhpcyBibG9nIGVudHJ5LCB3ZSBkZWx2ZSBpbnRvIHRoZSBmYXNjaW5hdGluZyB3b3JsZCBvZiBzdGF0aXN0aWNzIHRocm91Z2ggdGhlIGxlbnMgb2YgdGhlIGZhbW91cyBJcmlzIGRhdGFzZXQuIFRoZSBJcmlzIGRhdGFzZXQgaXMgYSBjbGFzc2ljIGluIHRoZSBmaWVsZCBvZiBzdGF0aXN0aWNzIGFuZCBkYXRhIHNjaWVuY2UsIGNvbXByaXNpbmcgbWVhc3VyZW1lbnRzIG9mIFNlcGFsIExlbmd0aCwgU2VwYWwgV2lkdGgsIFBldGFsIExlbmd0aCwgYW5kIFBldGFsIFdpZHRoIGZvciB0aHJlZSBzcGVjaWVzIG9mIGlyaXMgZmxvd2VyczogU2V0b3NhLCBWZXJzaWNvbG9yLCBhbmQgVmlyZ2luaWNhLg0KDQojIyMgSW1wb3J0YW5jZQ0KDQpVbmRlcnN0YW5kaW5nIHN0YXRpc3RpY2FsIG1ldGhvZHMgaXMgY3J1Y2lhbCBpbiB0b2RheSdzIGRhdGEtZHJpdmVuIHdvcmxkLCBhbmQgdGhlIElyaXMgZGF0YXNldCBzZXJ2ZXMgYXMgYW4gZXhjZWxsZW50IHN0YXJ0aW5nIHBvaW50IGZvciBleHBsb3JpbmcgdmFyaW91cyBzdGF0aXN0aWNhbCB0ZWNobmlxdWVzLiBCeSBhbmFseXppbmcgdGhpcyBkYXRhc2V0LCB3ZSBjYW4gZ2FpbiBpbnNpZ2h0cyBpbnRvIGtleSBzdGF0aXN0aWNhbCBjb25jZXB0cyBzdWNoIGFzIHN1bW1hcnkgc3RhdGlzdGljcywgZGF0YSB2aXN1YWxpemF0aW9uLCBhbmQgaW5mZXJlbnRpYWwgc3RhdGlzdGljcy4NCg0KDQpgYGB7ciBsb2FkLXBhY2thZ2VzLCBtZXNzYWdlPUZBTFNFfQ0KI0xvYWRpbmcgbmVjZXNzYXJ5IGxpYnJhcmllcw0KbGlicmFyeShkYXRhc2V0cykNCmxpYnJhcnkoZ2dwbG90MikNCiNpbnN0YWxsLnBhY2thZ2VzKCJncmlkRXh0cmEiKQ0KbGlicmFyeShncmlkRXh0cmEpDQoNCiNMb2FkaW5nIElyaXMgZGF0YXNldCANCmRhdGEoaXJpcykNCg0KI1N1bW1hcnkgc3RhdGlzdGljcyBmb3IgU2VwYWwgTGVuZ3RoLCBXaWR0aCwgUGV0YWwgTGVuZ3RoLCBhbmQgV2lkdGgNCnN1bW1hcnlfc3RhdHMgPC0gc3VtbWFyeShpcmlzWywgYygiU2VwYWwuTGVuZ3RoIiwgIlNlcGFsLldpZHRoIiwgIlBldGFsLkxlbmd0aCIsICJQZXRhbC5XaWR0aCIpXSkNCg0KI0NyZWF0aW5nIGJveHBsb3Qgb2YgU2VwYWwgTGVuZ3RoLCBXaWR0aCwgUGV0YWwgTGVuZ3RoLCBhbmQgV2lkdGgNCmJveHBsb3RzIDwtIGxhcHBseShuYW1lcyhpcmlzKVsxOjRdLCBmdW5jdGlvbih2YXIpIHsNCiAgZ2dwbG90KGlyaXMsIGFlc19zdHJpbmcoeSA9IHZhciwgeCA9ICJTcGVjaWVzIiwgZmlsbCA9ICJTcGVjaWVzIikpICsNCiAgICBnZW9tX2JveHBsb3QoKSArDQogICAgbGFicyh0aXRsZSA9IHBhc3RlKCJCb3hwbG90IG9mIiwgdmFyLCAiYnkgU3BlY2llcyIpLA0KICAgICAgICAgeCA9ICJTcGVjaWVzIiwgeSA9IHZhcikgKw0KICAgIHRoZW1lX21pbmltYWwoKQ0KfSkNCg0KI0NvbWJpbmluZyBib3hwbG90cyBpbnRvIG9uZSBwbG90DQpib3hwbG90X2dyaWQgPC0gZ3JpZC5hcnJhbmdlKGdyb2JzID0gYm94cGxvdHMsIG5jb2wgPSAyKQ0KDQojQ3JlYXRpbmcgaGlzdG9ncmFtIG9mIFNlcGFsIExlbmd0aCwgV2lkdGgsIFBldGFsIExlbmd0aCwgYW5kIFdpZHRoDQpoaXN0b2dyYW1zIDwtIGxhcHBseShuYW1lcyhpcmlzKVsxOjRdLCBmdW5jdGlvbih2YXIpIHsNCiAgZ2dwbG90KGlyaXMsIGFlc19zdHJpbmcoeCA9IHZhciwgZmlsbCA9ICJTcGVjaWVzIikpICsNCiAgICBnZW9tX2hpc3RvZ3JhbShiaW53aWR0aCA9IDAuNSwgY29sb3IgPSAiYmxhY2siKSArDQogICAgbGFicyh0aXRsZSA9IHBhc3RlKCJIaXN0b2dyYW0gb2YiLCB2YXIpLA0KICAgICAgICAgeCA9IHZhciwgeSA9ICJGcmVxdWVuY3kiKSArDQogICAgdGhlbWVfbWluaW1hbCgpDQp9KQ0KDQojQ29tYmluaW5nIGhpc3RvZ3JhbXMgaW50byBvbmUgcGxvdA0KaGlzdG9ncmFtX2dyaWQgPC0gZ3JpZC5hcnJhbmdlKGdyb2JzID0gaGlzdG9ncmFtcywgbmNvbCA9IDIpDQoNCiNQcmludGluZyBzdW1tYXJ5IHN0YXRpc3RpY3MgYW5kIHZpc3VhbGl6YXRpb25zDQpjYXQoIlN1bW1hcnkgU3RhdGlzdGljcyBmb3IgU2VwYWwgTGVuZ3RoLCBTZXBhbCBXaWR0aCwgUGV0YWwgTGVuZ3RoLCBhbmQgUGV0YWwgV2lkdGg6XG4iKQ0KcHJpbnQoc3VtbWFyeV9zdGF0cykNCnByaW50KGJveHBsb3RfZ3JpZCkNCnByaW50KGhpc3RvZ3JhbV9ncmlkKQ0KDQoNCmBgYA0KDQojIyBDb25jbHVzaW9uDQoNCkluIGNvbmNsdXNpb24sIHRoaXMgYmxvZyBlbnRyeSBoaWdobGlnaHRzIHRoZSBpbXBvcnRhbmNlIG9mIHN0YXRpc3RpY2FsIGFuYWx5c2lzIGluIGV4dHJhY3RpbmcgbWVhbmluZ2Z1bCBpbnNpZ2h0cyBmcm9tIHJlYWwtbGlmZSBkYXRhc2V0cy4gQnkgbGV2ZXJhZ2luZyBzdGF0aXN0aWNhbCBtZXRob2RzIGFuZCB2aXN1YWxpemF0aW9uIHRlY2huaXF1ZXMsIHdlIGNhbiB1bmNvdmVyIGhpZGRlbiBwYXR0ZXJucywgcmVsYXRpb25zaGlwcywgYW5kIHRyZW5kcyBpbiBkYXRhLCB1bHRpbWF0ZWx5IGVuYWJsaW5nIGluZm9ybWVkIGRlY2lzaW9uLW1ha2luZyBpbiB2YXJpb3VzIGZpZWxkcyByYW5naW5nIGZyb20gYmlvbG9neSBhbmQgZWNvbG9neSB0byBidXNpbmVzcyBhbmQgZmluYW5jZS4NCmBgYA0K

Blog 1 Data 621

Laura B

2024-05-12

Blog Entry 1: Introduction to Descriptive Statistics with Iris Dataset

Overview

Importance

Conclusion