將資料視覺化的方法,以直觀的角度就是畫圖,那在運用在R語言中,針對不同類型的資料對應其不同類型指令,接下來的章節為大家一一介紹。
當你的資料為多種變數名稱,且是以“次數”的方式呈現,我們利用R軟體中關於空氣品質的資料集airquality來作為例子:
require(datasets) #載入資料集
head(airquality) #預覽前六筆資料
## Ozone Solar.R Wind Temp Month Day
## 1 41 190 7.4 67 5 1
## 2 36 118 8.0 72 5 2
## 3 12 149 12.6 74 5 3
## 4 18 313 11.5 62 5 4
## 5 NA NA 14.3 56 5 5
## 6 28 NA 14.9 66 5 6
由上表可先得知我們有臭氧(Ozone)、太陽輻射(Solar.R)、風力(Wind)、溫度(Temp)、月(Month)與日(Day)等資料,我們想看各個月份(Month)有多少筆資料:
barplot(table(airquality$Month), # 針對airquality資料裡的Month資料最table
main="Bar chart of Month", # 圖片的名稱
xlab="Month", # X軸的名稱
ylab="Frequency", # Y軸的名稱
col="green" # 顏色為綠
)
畫直方圖我們運用的函式為barplot(),其中的參數如後方註解所示。
將空氣品質的資料集airquality,畫成圓形圖(pie chart)之前,先將資料分析。
table(airquality$Month) #查看各月份資料數
##
## 5 6 7 8 9
## 31 30 31 31 30
利用table()可以看個別月份的資料數,在將此資料宣告在data.month裡並建立對應月份名稱name.month
data.month <- c(31,30,31,31,30) #宣告個別月份資料數
name.month <- c("May","June","July","August","September") #宣告個別月份名稱
畫圓形圖(pie chart)我們運用的函式為pie(),其中的參數如後方註解所示。
pie(x=data.month, # 月份資料
main="Pie of Month", # 圖片名稱
labels =name.month # 月份名稱
)
描素兩個名目變數之間的關係,要探討前先建立出適合的資料,我們建立男性與女性的薪水高低來當例子:
salary <- sample(c('Low','Medium','High'),50,replace=T) #隨機50筆薪水分別為低、中、高三種級別
table(salary) #顯示薪水資料
## salary
## High Low Medium
## 23 21 6
由此可以觀察到薪水三種級別資料數目
amount <- sample (c("Men","Women"),50,replace=T) #隨機50位工作者分別為男、女兩種類別
table(amount) #顯示工作者資料
## amount
## Men Women
## 26 24
由此可以觀察到工作者兩種類別資料數目
barplot(table(salary,amount),beside=T) #畫出交叉分類表
畫交叉分類表這裡使用barplot()函式,藉由此分類表可以清楚分析薪水與工作者之間的關係。