library(readr)
data <- read_csv("data_kesehatan.csv")
## New names:
## Rows: 200 Columns: 11
## ── Column specification
## ──────────────────────────────────────────────────────── Delimiter: "," chr
## (1): jenis_kelamin dbl (10): ...1, id, umur, tinggi_badan, berat_badan,
## gula_darah, tekanan_sis...
## ℹ Use `spec()` to retrieve the full column specification for this data. ℹ
## Specify the column types or set `show_col_types = FALSE` to quiet this message.
## • `` -> `...1`
data
## # A tibble: 200 × 11
## ...1 id umur jenis_kelamin tinggi_badan berat_badan gula_darah
## <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl>
## 1 1 1 33 Perempuan 160. 62.9 80.1
## 2 2 2 59 Perempuan 153. 54.7 79.2
## 3 3 3 39 Perempuan 156. 66.8 99.6
## 4 4 4 64 Laki-laki 174. 54.8 97.4
## 5 5 5 67 Perempuan 164. 62.2 49.0
## 6 6 6 20 Perempuan 150. 61.2 121.
## 7 7 7 45 Perempuan 158. 59.4 105.
## 8 8 8 64 Laki-laki 166. 55.9 148.
## 9 9 9 47 Perempuan 157. 62.2 114.
## 10 10 10 42 Perempuan 161. 58.7 91.1
## # ℹ 190 more rows
## # ℹ 4 more variables: tekanan_sistolik <dbl>, tekanan_diastolik <dbl>,
## # kolesterol <dbl>, skor_kesehatan <dbl>
head(data)
## # A tibble: 6 × 11
## ...1 id umur jenis_kelamin tinggi_badan berat_badan gula_darah
## <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl>
## 1 1 1 33 Perempuan 160. 62.9 80.1
## 2 2 2 59 Perempuan 153. 54.7 79.2
## 3 3 3 39 Perempuan 156. 66.8 99.6
## 4 4 4 64 Laki-laki 174. 54.8 97.4
## 5 5 5 67 Perempuan 164. 62.2 49.0
## 6 6 6 20 Perempuan 150. 61.2 121.
## # ℹ 4 more variables: tekanan_sistolik <dbl>, tekanan_diastolik <dbl>,
## # kolesterol <dbl>, skor_kesehatan <dbl>
getwd()
## [1] "C:/Users/ahmad/Documents/uts psd"
names(data)
## [1] "...1" "id" "umur"
## [4] "jenis_kelamin" "tinggi_badan" "berat_badan"
## [7] "gula_darah" "tekanan_sistolik" "tekanan_diastolik"
## [10] "kolesterol" "skor_kesehatan"
rata_laki <- mean(subset(data, jenis_kelamin == "Laki-laki")$tinggi_badan, na.rm = TRUE)
rata_laki
## [1] 171.0215
summary(data$tinggi_badan)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 143.1 159.4 165.1 165.8 171.7 186.9
data$kelompok_umur <- cut(
data$umur,
breaks = c(-Inf, 29, 50, Inf),
labels = c("<30", "30-50", ">50")
)
rata_per_kelompok <- aggregate(skor_kesehatan ~ kelompok_umur, data = data, FUN = mean)
print(rata_per_kelompok)
## kelompok_umur skor_kesehatan
## 1 <30 90.37880
## 2 30-50 89.35499
## 3 >50 89.53153
data[data$gula_darah == min(data$gula_darah, na.rm = TRUE), c("id", "gula_darah")]
## # A tibble: 1 × 2
## id gula_darah
## <dbl> <dbl>
## 1 5 49.0