Ще один класичний датасет - Іриси

Ваша робота сьогодні - самостійна.

iris_data <- iris
head(iris_data)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa

Отримати наступну табличку:

## 
##     setosa versicolor  virginica 
##         50         50         50

Знайти середні значення по вимірам

## [1] 5.843333
## [1] 3.057333
## [1] 3.758
## [1] 1.199333

Побудувати гістограми для всіх вимірів і окремо за кожним видом.

ggplot(iris_data,aes(Sepal.Length, Sepal.Width)) + geom_point() + facet_grid(~Species)

Датасет фільми

Задача - знайти три улюблені фільми, вивести їх оцінки

library(ggplot2movies)
m <- movies

Скільки фільмів усього

## [1] 58788

Скільки фільмів знімали на рік?

Коли почали? Коли перший фільм?

Які жанри фільмів є на сьогодні і скільки їх у відсотках?

## [1] 4688
## [1] 3690
## [1] 17271
## [1] 21811
## [1] 3472
## [1] 4744
## [1] 9458

Вибрати топ 10 найрейтинговіших фільмів

m1 <- subset(m,m$votes > 1000)
m1 <- m1[order(m1$rating, decreasing = T),]

Додати жанр

Витягування кульок