data.kesehatan <- read.csv("data_kesehatan.csv")
library (dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
# Rata-rata umur responden
q1 <- data.kesehatan
q1 <- q1%>%
  summarise(rata_rata = mean(umur, na.rm = TRUE))
q1
##   rata_rata
## 1    44.315
# Selisih rata-rata tinggi laki-laki dan perempuan
rata.tinggi <- aggregate(tinggi_badan~jenis_kelamin, data=data.kesehatan, mean)
rata.tinggi
##   jenis_kelamin tinggi_badan
## 1     Laki-laki     171.0215
## 2     Perempuan     159.6470
# Berapa jumlah responden yang memenuhi semua indikator sehat (gula <110, kolesterol <200, tekanan <130/85)?
q3 <- data.kesehatan
q3 <- q3%>%
  filter(gula_darah<110, kolesterol<200, tekanan_sistolik<130, tekanan_diastolik<85)%>%
  count(id)%>%
  summarise(jumlah = n())
q3
##   jumlah
## 1     48
library (dplyr)
#Berapa rata-rata skor_kesehatan responden obesitas (BMI > 30)?
obesitas <- data.kesehatan
obesitas <- obesitas%>%
  mutate(data.kesehatan, BMI = berat_badan / tinggi_badan*tinggi_badan)%>%
  filter (BMI>30)%>%
  summarise(rata_rata = mean(skor_kesehatan, na.rm = TRUE))
obesitas
##   rata_rata
## 1  89.61395