Mengakses data

Data yang digunakan bersumber dari mahasiswa statistika 57. Data ini memiliki 10 variabel.

# Melakukan Import Data dari file CSV
Hasil_survey<- read.csv("E:/SEM 4/Visulisasi data/DataTugas1.csv")
#untuk mengubah nama kolom 
names(Hasil_survey)<- c("Umur", "Hobi", "Domisili", "Sarapan", "Berat_Badan", "Luring_Daring", "Waktu_Belajar", "Waktu_Tidur", "Waktu_Istirahat", "Penguasaan_R")
head(Hasil_survey)
##   Umur      Hobi   Domisili Sarapan Berat_Badan Luring_Daring Waktu_Belajar
## 1   19  Olahraga Pulau Jawa      Ya          83        Luring             1
## 2   19     Musik Pulau Jawa      Ya          75        Daring             2
## 3   19     Musik Pulau Jawa      Ya          49        Luring             6
## 4   20   Ngoding Pulau Jawa      Ya          77        Daring            18
## 5   19     Musik Pulau Jawa      Ya          54        Luring             3
## 6   19 Traveling Pulau Jawa   Tidak          65        Luring             8
##   Waktu_Tidur Waktu_Istirahat Penguasaan_R
## 1           8               2     Beginner
## 2           6               7     Beginner
## 3           7               7     Beginner
## 4           5               2     Beginner
## 5           4               4     Beginner
## 6           9               4     Beginner

Melihat struktur data dan variabel yang terdapat di dalam data

str(Hasil_survey)
## 'data.frame':    46 obs. of  10 variables:
##  $ Umur           : int  19 19 19 20 19 19 20 19 19 20 ...
##  $ Hobi           : chr  "Olahraga" "Musik" "Musik" "Ngoding" ...
##  $ Domisili       : chr  "Pulau Jawa" "Pulau Jawa" "Pulau Jawa" "Pulau Jawa" ...
##  $ Sarapan        : chr  "Ya" "Ya" "Ya" "Ya" ...
##  $ Berat_Badan    : int  83 75 49 77 54 65 54 75 55 68 ...
##  $ Luring_Daring  : chr  "Luring" "Daring" "Luring" "Daring" ...
##  $ Waktu_Belajar  : int  1 2 6 18 3 8 6 6 3 6 ...
##  $ Waktu_Tidur    : int  8 6 7 5 4 9 6 7 6 8 ...
##  $ Waktu_Istirahat: int  2 7 7 2 4 4 3 2 2 4 ...
##  $ Penguasaan_R   : chr  "Beginner" "Beginner" "Beginner" "Beginner" ...

Data Hasil_survey tersebut merupakan data frame yang terdiri dari 46 observasi dari 10 variabel.

Visualisasi data kategorik

Bar chart distribusi frekuensi Domisili, Luring/Daring, Hobi, Sarapan, dan Penguasaan R

library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5     v purrr   0.3.4
## v tibble  3.1.5     v dplyr   1.0.7
## v tidyr   1.1.4     v stringr 1.4.0
## v readr   2.0.2     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
par(mfrow=c(2,3))
counts <- table(Hasil_survey$Domisili)
Domisili <-ggplot(Hasil_survey,aes(Domisili))+geom_bar(fill="#ff4d4d")+theme_bw()+labs(title="Domisili Mahasiswa", x = "Domisili", y = "Frekuensi")
Domisili

counts <- table(Hasil_survey$Luring_Daring)
Luring_Daring <-ggplot(Hasil_survey,aes(Luring_Daring))+geom_bar(fill="#ffbb33")+theme_bw()+labs(title="Pilih Luring atau Daring", x = "Luring_Daring", y = "Frekuensi")
Luring_Daring

counts <- table(Hasil_survey$Hobi)
Hobi <-ggplot(Hasil_survey,aes(Hobi))+geom_bar(fill="#29a329")+theme_bw()+coord_flip()+labs(title="Hobi Mahasiswa", x = "Hobi", y = "Frekuensi")
Hobi

counts <- table(Hasil_survey$Sarapan)
Sarapan <-ggplot(Hasil_survey,aes(Sarapan))+geom_bar(fill="#0080ff")+theme_bw()+coord_flip()+labs(tittle="Terbiasa untuk Sarapan", x = "Sarapan", y = "Frekuensi")
Sarapan

counts <- table(Hasil_survey$Penguasaan_R)
Penguasaan_R <-ggplot(Hasil_survey,aes(Penguasaan_R))+geom_bar(fill="#000099")+theme_bw()+coord_flip()+labs(title="Penguasaan R Mahasiswa", x = "Penguasaan R", y = "Frekuensi")
Penguasaan_R

Kombinasi distribusi frekuensi variabel Domisili dan Laring_Daring

library(ggplot2)
par(mfrow=c(1,2))
Hasil_survey %>%
  ggplot(aes(Domisili, fill = Luring_Daring)) + geom_bar(position="dodge", alpha=1)+theme_bw()+theme(panel.grid.major=element_blank(), panel.grid.minor=element_blank())+labs(title="Domisili vs Laring_Daring")

Hasil_survey %>%
ggplot(aes(Domisili, fill = Luring_Daring)) + geom_bar(position="fill", alpha=1)+theme_bw()+theme(panel.grid.major=element_blank(), panel.grid.minor=element_blank())+labs(title="Domisili vs Laring_Daring")

Visualisasi data peubah Berat badan

a<- ggplot(Hasil_survey, aes(x=Berat_Badan))
a + geom_area(stat = "bin", color="blue",fill="skyblue",size=1) +
    labs(
      x = "Berat Badan",
      y = "frekuensi",
      title = "Berat Badan ")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

      a + geom_histogram(binwidth = 10)

Bar Chart peubah Umur

b <- ggplot(Hasil_survey, aes(Umur))
b + geom_bar(color="black", fill = "#bf00ff") +
    labs(
      x = "Umur",
      y = "Frekuensi",
      title = "Umur",
    )

Scatterplot Waktu_tidur vs Berat_badan

ggplot(Hasil_survey, aes(x=Waktu_Tidur, y=Berat_Badan))+ geom_point()+geom_smooth(formula= y~x, method="lm")

Tidak terlihat adanya hubungan linear antara waktu tidur dengan berat badan, dan plot menyebar menandakan lemah atau tidak adanya hubungan antar kedua peubah.

Scatterplot Waktu_Belajar vs Waktu_Istirahat

ggplot(Hasil_survey, aes(x=Waktu_Belajar, y=Waktu_Istirahat))+ geom_point()+geom_smooth(formula= y~x, method="lm")

Tidak terlihat adanya hubungan linear antara waktu belajar dengan waktu istirahat.