將資料視覺化的方法,以直觀的角度就是畫圖,那在運用在R語言中,針對不同類型的資料對應其不同類型指令,接下來的章節為大家一一介紹。

長條圖(bar chart)

當你的資料為多種變數名稱,且是以“次數”的方式呈現,我們利用R軟體中關於空氣品質的資料集airquality來作為例子:

require(datasets) #載入資料集
head(airquality)  #預覽前六筆資料
##   Ozone Solar.R Wind Temp Month Day
## 1    41     190  7.4   67     5   1
## 2    36     118  8.0   72     5   2
## 3    12     149 12.6   74     5   3
## 4    18     313 11.5   62     5   4
## 5    NA      NA 14.3   56     5   5
## 6    28      NA 14.9   66     5   6

由上表可先得知我們有臭氧(Ozone)、太陽輻射(Solar.R)、風力(Wind)、溫度(Temp)、月(Month)與日(Day)等資料,我們想看各個月份(Month)有多少筆資料:

barplot(table(airquality$Month),        # 針對airquality資料裡的Month資料最table
     main="Bar chart of Month",         # 圖片的名稱
     xlab="Month",                      # X軸的名稱
     ylab="Frequency",                  # Y軸的名稱
     col="green"                        # 顏色為綠                     
     )

畫直方圖我們運用的函式為barplot(),其中的參數如後方註解所示。

圓形圖(pie chart)

將空氣品質的資料集airquality,畫成圓形圖(pie chart)之前,先將資料分析。

table(airquality$Month)   #查看各月份資料數
## 
##  5  6  7  8  9 
## 31 30 31 31 30

利用table()可以看個別月份的資料數,在將此資料宣告在data.month裡並建立對應月份名稱name.month

data.month <- c(31,30,31,31,30)                              #宣告個別月份資料數
name.month <- c("May","June","July","August","September")    #宣告個別月份名稱

畫圓形圖(pie chart)我們運用的函式為pie(),其中的參數如後方註解所示。

pie(x=data.month,                # 月份資料
     main="Pie of Month",        # 圖片名稱
     labels =name.month          # 月份名稱
     )

交叉分類表(cross-classification table)

描素兩個名目變數之間的關係,要探討前先建立出適合的資料,我們建立男性與女性的薪水高低來當例子:

salary <- sample(c('Low','Medium','High'),50,replace=T)      #隨機50筆薪水分別為低、中、高三種級別
table(salary)                                                #顯示薪水資料
## salary
##   High    Low Medium 
##     23     21      6

由此可以觀察到薪水三種級別資料數目

amount <- sample (c("Men","Women"),50,replace=T)    #隨機50位工作者分別為男、女兩種類別
table(amount)                                       #顯示工作者資料
## amount
##   Men Women 
##    26    24

由此可以觀察到工作者兩種類別資料數目

barplot(table(salary,amount),beside=T)   #畫出交叉分類表

畫交叉分類表這裡使用barplot()函式,藉由此分類表可以清楚分析薪水與工作者之間的關係。