df_kesehatan <- readxl::read_excel("data_kesehatan.xlsx")
df_kesehatan 
## # A tibble: 200 × 10
##       id  umur jenis_kelamin tinggi_badan berat_badan gula_darah
##    <dbl> <dbl> <chr>                <dbl>       <dbl>      <dbl>
##  1     1    33 Perempuan             160.        62.9       80.1
##  2     2    59 Perempuan             153.        54.7       79.2
##  3     3    39 Perempuan             156.        66.8       99.6
##  4     4    64 Laki-laki             174.        54.8       97.4
##  5     5    67 Perempuan             164.        62.2       49.0
##  6     6    20 Perempuan             150.        61.2      121. 
##  7     7    45 Perempuan             158.        59.4      105. 
##  8     8    64 Laki-laki             166.        55.9      148. 
##  9     9    47 Perempuan             157.        62.2      114. 
## 10    10    42 Perempuan             161.        58.7       91.1
## # ℹ 190 more rows
## # ℹ 4 more variables: tekanan_sistolik <dbl>, tekanan_diastolik <dbl>,
## #   kolesterol <dbl>, skor_kesehatan <dbl>
# Mencari rata rata umur 
df_kesehatan <- readxl::read_excel("data_kesehatan.xlsx")
mean(df_kesehatan$umur)
## [1] 44.315
# Mencari rata rata tinggi badan berdasarkan jenis kelamin (Laki laki yg ditanyakan)

aggregate(tinggi_badan ~ jenis_kelamin, data = df_kesehatan, mean)
##   jenis_kelamin tinggi_badan
## 1     Laki-laki     171.0215
## 2     Perempuan     159.6470
# Rata rata skor kesehatan berdasarkan kelompok umur 
aggregate(skor_kesehatan ~ umur<30, data = df_kesehatan, mean)
##   umur < 30 skor_kesehatan
## 1     FALSE       89.43454
## 2      TRUE       90.37880
aggregate(skor_kesehatan ~ umur>=30 & umur<=50, data = df_kesehatan, mean)
##   umur >= 30 & umur <= 50 skor_kesehatan
## 1                   FALSE       89.82159
## 2                    TRUE       89.35499
aggregate(skor_kesehatan ~ umur>50, data = df_kesehatan, mean)
##   umur > 50 skor_kesehatan
## 1     FALSE       89.66132
## 2      TRUE       89.53153
# ID yang memiliki gula darah terendah
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
gd <- df_kesehatan %>%
  filter(gula_darah == min(gula_darah))
gd
## # A tibble: 1 × 10
##      id  umur jenis_kelamin tinggi_badan berat_badan gula_darah tekanan_sistolik
##   <dbl> <dbl> <chr>                <dbl>       <dbl>      <dbl>            <dbl>
## 1     5    67 Perempuan             164.        62.2       49.0             129.
## # ℹ 3 more variables: tekanan_diastolik <dbl>, kolesterol <dbl>,
## #   skor_kesehatan <dbl>