df_kesehatan <- readxl::read_excel("data_kesehatan.xlsx")
df_kesehatan
## # A tibble: 200 × 10
## id umur jenis_kelamin tinggi_badan berat_badan gula_darah
## <dbl> <dbl> <chr> <dbl> <dbl> <dbl>
## 1 1 33 Perempuan 160. 62.9 80.1
## 2 2 59 Perempuan 153. 54.7 79.2
## 3 3 39 Perempuan 156. 66.8 99.6
## 4 4 64 Laki-laki 174. 54.8 97.4
## 5 5 67 Perempuan 164. 62.2 49.0
## 6 6 20 Perempuan 150. 61.2 121.
## 7 7 45 Perempuan 158. 59.4 105.
## 8 8 64 Laki-laki 166. 55.9 148.
## 9 9 47 Perempuan 157. 62.2 114.
## 10 10 42 Perempuan 161. 58.7 91.1
## # ℹ 190 more rows
## # ℹ 4 more variables: tekanan_sistolik <dbl>, tekanan_diastolik <dbl>,
## # kolesterol <dbl>, skor_kesehatan <dbl>
# Mencari rata rata umur
df_kesehatan <- readxl::read_excel("data_kesehatan.xlsx")
mean(df_kesehatan$umur)
## [1] 44.315
# Mencari rata rata tinggi badan berdasarkan jenis kelamin (Laki laki yg ditanyakan)
aggregate(tinggi_badan ~ jenis_kelamin, data = df_kesehatan, mean)
## jenis_kelamin tinggi_badan
## 1 Laki-laki 171.0215
## 2 Perempuan 159.6470
# Rata rata skor kesehatan berdasarkan kelompok umur
aggregate(skor_kesehatan ~ umur<30, data = df_kesehatan, mean)
## umur < 30 skor_kesehatan
## 1 FALSE 89.43454
## 2 TRUE 90.37880
aggregate(skor_kesehatan ~ umur>=30 & umur<=50, data = df_kesehatan, mean)
## umur >= 30 & umur <= 50 skor_kesehatan
## 1 FALSE 89.82159
## 2 TRUE 89.35499
aggregate(skor_kesehatan ~ umur>50, data = df_kesehatan, mean)
## umur > 50 skor_kesehatan
## 1 FALSE 89.66132
## 2 TRUE 89.53153
# ID yang memiliki gula darah terendah
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
gd <- df_kesehatan %>%
filter(gula_darah == min(gula_darah))
gd
## # A tibble: 1 × 10
## id umur jenis_kelamin tinggi_badan berat_badan gula_darah tekanan_sistolik
## <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl>
## 1 5 67 Perempuan 164. 62.2 49.0 129.
## # ℹ 3 more variables: tekanan_diastolik <dbl>, kolesterol <dbl>,
## # skor_kesehatan <dbl>