A. INPUT DATA
Data <- read.csv("D:/Semester 4/Visualisasi Data/data.csv")
head(Data)
## Umur Hobi Domisili Terbiasa_untuk_sarapan Berat_Badan
## 1 19 Olahraga Pulau Jawa Ya 83
## 2 19 Musik Pulau Jawa Ya 75
## 3 19 Musik Pulau Jawa Ya 49
## 4 20 Ngoding Pulau Jawa Ya 77
## 5 19 Musik Pulau Jawa Ya 54
## 6 19 Traveling Pulau Jawa Tidak 65
## kuliah_luring_atau_daring Waktu_belajar Waktu_tidur Waktu_istirahat
## 1 Luring 1 8 2
## 2 Daring 2 6 7
## 3 Luring 6 7 7
## 4 Daring 18 5 2
## 5 Luring 3 4 4
## 6 Luring 8 9 4
## Penguasaan_R
## 1 Beginner
## 2 Beginner
## 3 Beginner
## 4 Beginner
## 5 Beginner
## 6 Beginner
B. DATA EXPLORER
#install.packages("DataExplorer")
library("DataExplorer")
plot_histogram(Data)
a.Histogram umur
hist(Data$Umur, col="Orange", main="Histogram Umur Mahasiswa Departemen Statistika 57",xlab="Umur(tahun)", ylab="Jumlah Mahasiswa")
hist(Data$Berat_Badan, col="Orange", main="Histogram Berat Mahasiswa Departemen Statistika 57",xlab="Berat Badan(kg)", ylab="Jumlah Mahasiswa")
hist(Data$Waktu_belajar, col="Orange", main="Histogram Waktu Belajar Mahasiswa Departemen Statistika 57",xlab="Waktu Belajar(jam)", ylab="Jumlah Mahasiswa")
hist(Data$Waktu_tidur, col="Orange", main="Histogram Waktu Tidur Mahasiswa Departemen Statistika 57",xlab="Waktu Tidur(jam)", ylab="Jumlah Mahasiswa")
hist(Data$Waktu_istirahat, col="Orange", main="Histogram Waktu Istirahat Mahasiswa Departemen Statistika 57",xlab="Waktu Istirahat(jam)", ylab="Jumlah Mahasiswa")
plot_density(Data,geom_density_args = list(fill="purple"))
plot_bar(Data)
plot_scatterplot(Data,by = "Umur")
plot_correlation(Data,type = "c")
C. ggpubr
#install.packages("ggpubr")
library(ggpubr)
## Loading required package: ggplot2
gghistogram(Data,x="Umur",fill="red")+scale_y_continuous(expand = c(0,0))
## Warning: Using `bins = 30` by default. Pick better value with the argument
## `bins`.
ggdensity(Data,x ="Umur",fill ="green")+
scale_y_continuous(expand = c(0,0))+
scale_x_continuous(expand = c(0,0))
library("tidyverse")
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v tibble 3.1.5 v dplyr 1.0.7
## v tidyr 1.1.4 v stringr 1.4.0
## v readr 2.1.0 v forcats 0.5.1
## v purrr 0.3.4
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
names_cont <- colnames(Data %>% select(where(is.numeric)))
p1 <- map(names_cont,~
ggdensity(Data,x = .x,fill ="pink")+
scale_y_continuous(expand = c(0,0))+
scale_x_continuous(expand = c(0,0))
)
ggarrange(plotlist = p1)
ggscatter(Data,x = "Umur",y="Waktu_belajar",color = "pink")
ggscatter(Data,x = "Umur",y="Waktu_belajar",color="pink",
add = "reg.line" , # Add regression line
conf.int = TRUE, # Add confidence interval
add.params = list(color = "blue",
fill = "lightgray")
)
## `geom_smooth()` using formula 'y ~ x'
D. ggplot2
One Variable, Data Continuous
#install.packages("ggplot2")
library(ggplot2)
a <- ggplot(Data, aes(x=Waktu_belajar))
a + geom_area(stat = "bin", color="blue",fill="skyblue",size=1) +
labs(
x = "Waktu Belajar",
y = "Jumlah Mahasiswa",
title = "Waktu Belajar Mahasiswa Departemen Statistika",
subtitle = "Angkatan 57",
)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Data Discrete
c <- ggplot(Data, aes(Penguasaan_R))
c + geom_bar(color="green",fill="red") +
labs(
x = "Penguasaan R",
y = "Jumlah Mahasiswa",
title = "Tingkat Penguasaan R Mahasiswa Departemen Statistika",
subtitle = "Angkatan 57",
)