library(readr)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
data_kesehatan <- read.csv("data_kesehatan.csv")
total_rata_rata <- aggregate(umur ~ 1, data = data_kesehatan, mean)
total_rata_rata
## umur
## 1 44.315
rata_rata <- aggregate(tinggi_badan ~ jenis_kelamin,
data = data_kesehatan, mean)
rata_rata
## jenis_kelamin tinggi_badan
## 1 Laki-laki 171.0215
## 2 Perempuan 159.6470
data_terurut <- data_kesehatan[order(data_kesehatan$skor_kesehatan), ]
skor_terendah <- head(data_terurut, 5)
skor_terendah
## X id umur jenis_kelamin tinggi_badan berat_badan gula_darah
## 49 49 49 32 Perempuan 147.6860 72.92436 135.0351
## 11 11 11 68 Perempuan 162.9534 39.93666 155.9478
## 70 70 70 41 Laki-laki 170.6245 80.10678 135.5821
## 193 193 193 69 Laki-laki 176.1898 78.86749 143.8718
## 176 176 176 50 Laki-laki 165.8736 88.77864 115.3701
## tekanan_sistolik tekanan_diastolik kolesterol skor_kesehatan
## 49 141.0703 85.51274 218.5767 45.44594
## 11 123.0276 80.65068 224.3279 48.51474
## 70 136.8850 71.69891 238.1264 53.51686
## 193 135.8586 75.48187 236.9744 54.22224
## 176 129.4345 88.19628 232.7038 57.96087
gula_terendah <- data_kesehatan %>%
filter(gula_darah == min(gula_darah))
gula_terendah %>% select(id, umur, jenis_kelamin, gula_darah)
## id umur jenis_kelamin gula_darah
## 1 5 67 Perempuan 49.01314
data_subset <- subset(data_kesehatan, kolesterol < 200 & gula_darah < 110)
rata_rata_skor <- mean(data_subset$skor_kesehatan)
rata_rata_skor
## [1] 96.57272
data_kesehatan$BMI <- data_kesehatan$berat_badan / (data_kesehatan$tinggi_badan / 100)^2
data_obesitas <- subset(data_kesehatan, BMI > 30)
rata_rata_skor <- mean(data_obesitas$skor_kesehatan)
rata_rata_skor
## [1] 74.92593