library(readr)
data <- read_csv("data_kesehatan.csv")
## New names:
## Rows: 200 Columns: 11
## ── Column specification
## ──────────────────────────────────────────────────────── Delimiter: "," chr
## (1): jenis_kelamin dbl (10): ...1, id, umur, tinggi_badan, berat_badan,
## gula_darah, tekanan_sis...
## ℹ Use `spec()` to retrieve the full column specification for this data. ℹ
## Specify the column types or set `show_col_types = FALSE` to quiet this message.
## • `` -> `...1`
data
## # A tibble: 200 × 11
##     ...1    id  umur jenis_kelamin tinggi_badan berat_badan gula_darah
##    <dbl> <dbl> <dbl> <chr>                <dbl>       <dbl>      <dbl>
##  1     1     1    33 Perempuan             160.        62.9       80.1
##  2     2     2    59 Perempuan             153.        54.7       79.2
##  3     3     3    39 Perempuan             156.        66.8       99.6
##  4     4     4    64 Laki-laki             174.        54.8       97.4
##  5     5     5    67 Perempuan             164.        62.2       49.0
##  6     6     6    20 Perempuan             150.        61.2      121. 
##  7     7     7    45 Perempuan             158.        59.4      105. 
##  8     8     8    64 Laki-laki             166.        55.9      148. 
##  9     9     9    47 Perempuan             157.        62.2      114. 
## 10    10    10    42 Perempuan             161.        58.7       91.1
## # ℹ 190 more rows
## # ℹ 4 more variables: tekanan_sistolik <dbl>, tekanan_diastolik <dbl>,
## #   kolesterol <dbl>, skor_kesehatan <dbl>
head(data)
## # A tibble: 6 × 11
##    ...1    id  umur jenis_kelamin tinggi_badan berat_badan gula_darah
##   <dbl> <dbl> <dbl> <chr>                <dbl>       <dbl>      <dbl>
## 1     1     1    33 Perempuan             160.        62.9       80.1
## 2     2     2    59 Perempuan             153.        54.7       79.2
## 3     3     3    39 Perempuan             156.        66.8       99.6
## 4     4     4    64 Laki-laki             174.        54.8       97.4
## 5     5     5    67 Perempuan             164.        62.2       49.0
## 6     6     6    20 Perempuan             150.        61.2      121. 
## # ℹ 4 more variables: tekanan_sistolik <dbl>, tekanan_diastolik <dbl>,
## #   kolesterol <dbl>, skor_kesehatan <dbl>
getwd()
## [1] "C:/Users/ahmad/Documents/uts psd"
names(data)
##  [1] "...1"              "id"                "umur"             
##  [4] "jenis_kelamin"     "tinggi_badan"      "berat_badan"      
##  [7] "gula_darah"        "tekanan_sistolik"  "tekanan_diastolik"
## [10] "kolesterol"        "skor_kesehatan"
rata_laki <- mean(subset(data, jenis_kelamin == "Laki-laki")$tinggi_badan, na.rm = TRUE)
rata_laki
## [1] 171.0215
summary(data$tinggi_badan)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   143.1   159.4   165.1   165.8   171.7   186.9
data$kelompok_umur <- cut(
  data$umur,
  breaks = c(-Inf, 29, 50, Inf),
  labels = c("<30", "30-50", ">50")
)

rata_per_kelompok <- aggregate(skor_kesehatan ~ kelompok_umur, data = data, FUN = mean)

print(rata_per_kelompok)
##   kelompok_umur skor_kesehatan
## 1           <30       90.37880
## 2         30-50       89.35499
## 3           >50       89.53153
data[data$gula_darah == min(data$gula_darah, na.rm = TRUE), c("id", "gula_darah")]
## # A tibble: 1 × 2
##      id gula_darah
##   <dbl>      <dbl>
## 1     5       49.0