#讀檔案,資料來自於 TIMSS 2011 年
install.packages("https://cran.rstudio.com/bin/windows/contrib/4.1/faraway_1.0.7.zip", repos = NULL)
## 將程式套件安載入 'C:/Users/user/Documents/R/win-library/4.1'
## (因為 'lib' 沒有被指定)
## package 'faraway' successfully unpacked and MD5 sums checked
library(faraway)
## Warning: 套件 'faraway' 是用 R 版本 4.1.2 來建造的
#檢視資料結構
str(ozone)
## 'data.frame': 330 obs. of 10 variables:
## $ O3 : num 3 5 5 6 4 4 6 7 4 6 ...
## $ vh : num 5710 5700 5760 5720 5790 5790 5700 5700 5770 5720 ...
## $ wind : num 4 3 3 4 6 3 3 3 8 3 ...
## $ humidity: num 28 37 51 69 19 25 73 59 27 44 ...
## $ temp : num 40 45 54 35 45 55 41 44 54 51 ...
## $ ibh : num 2693 590 1450 1568 2631 ...
## $ dpg : num -25 -24 25 15 -33 -28 23 -2 -19 9 ...
## $ ibt : num 87 128 139 121 123 182 114 91 92 173 ...
## $ vis : num 250 100 60 60 100 250 120 120 120 150 ...
## $ doy : num 33 34 35 36 37 38 39 40 41 42 ...
#看看前六筆
head(ozone)
## O3 vh wind humidity temp ibh dpg ibt vis doy
## 1 3 5710 4 28 40 2693 -25 87 250 33
## 2 5 5700 3 37 45 590 -24 128 100 34
## 3 5 5760 3 51 54 1450 25 139 60 35
## 4 6 5720 4 69 35 1568 15 121 60 36
## 5 4 5790 6 19 45 2631 -33 123 100 37
## 6 4 5790 3 25 55 554 -28 182 250 38
#看看資料基本統計
summary(ozone)
## O3 vh wind humidity
## Min. : 1.00 Min. :5320 Min. : 0.000 Min. :19.00
## 1st Qu.: 5.00 1st Qu.:5690 1st Qu.: 3.000 1st Qu.:47.00
## Median :10.00 Median :5760 Median : 5.000 Median :64.00
## Mean :11.78 Mean :5750 Mean : 4.848 Mean :58.13
## 3rd Qu.:17.00 3rd Qu.:5830 3rd Qu.: 6.000 3rd Qu.:73.00
## Max. :38.00 Max. :5950 Max. :11.000 Max. :93.00
## temp ibh dpg ibt
## Min. :25.00 Min. : 111.0 Min. :-69.00 Min. :-25.0
## 1st Qu.:51.00 1st Qu.: 877.5 1st Qu.: -9.00 1st Qu.:107.0
## Median :62.00 Median :2112.5 Median : 24.00 Median :167.5
## Mean :61.75 Mean :2572.9 Mean : 17.37 Mean :161.2
## 3rd Qu.:72.00 3rd Qu.:5000.0 3rd Qu.: 44.75 3rd Qu.:214.0
## Max. :93.00 Max. :5000.0 Max. :107.00 Max. :332.0
## vis doy
## Min. : 0.0 Min. : 33.0
## 1st Qu.: 70.0 1st Qu.:120.2
## Median :120.0 Median :205.5
## Mean :124.5 Mean :209.4
## 3rd Qu.:150.0 3rd Qu.:301.8
## Max. :350.0 Max. :390.0
#先看看內建的兩兩散佈圖
plot(ozone$wind, ozone$doy)
#也是內建的直方圖
hist(ozone$wind)
#載進 lattice,準備畫圖。
library(lattice)
## Warning: 套件 'lattice' 是用 R 版本 4.1.2 來建造的
##
## 載入套件:'lattice'
## 下列物件被遮斷自 'package:faraway':
##
## melanoma
#看看數學分數的直方圖
histogram(~ wind, data = ozone, xlab = '風速', ylab='機率',type = "density")
##連續變項間關係 #把學科分數取出來
dta_scores <- ozone[, c('wind', 'humidity', 'temp', 'ibh', 'dpg')]
#兩兩變項畫散佈圖
pairs(dta_scores, pch = '.', upper.panel = panel.smooth, lower.panel = NULL, col = 'gray')
#數學與物理分數相關
round(cor(ozone$wind,ozone$temp), 3)
## [1] -0.006
#所有學科分數相關
round(cor(dta_scores), 3)
## wind humidity temp ibh dpg
## wind 1.000 0.223 -0.006 0.197 0.342
## humidity 0.223 1.000 0.340 -0.242 0.648
## temp -0.006 0.340 1.000 -0.533 0.189
## ibh 0.197 -0.242 -0.533 1.000 0.037
## dpg 0.342 0.648 0.189 0.037 1.000
#檢定相關是否顯著,也可以看到信賴區間
cor.test( ~ wind + temp, data = dta_scores)
##
## Pearson's product-moment correlation
##
## data: wind and temp
## t = -0.1066, df = 328, p-value = 0.9152
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.1137774 0.1021428
## sample estimates:
## cor
## -0.005885934
#載進 Hmist,一次檢定所有相關
library(Hmisc)
## Warning: 套件 'Hmisc' 是用 R 版本 4.1.2 來建造的
## 載入需要的套件:survival
##
## 載入套件:'survival'
## 下列物件被遮斷自 'package:faraway':
##
## rats, solder
## 載入需要的套件:Formula
## Warning: 套件 'Formula' 是用 R 版本 4.1.1 來建造的
## 載入需要的套件:ggplot2
## Warning: 套件 'ggplot2' 是用 R 版本 4.1.2 來建造的
##
## 載入套件:'Hmisc'
## 下列物件被遮斷自 'package:base':
##
## format.pval, units
rcorr(as.matrix(dta_scores), type="pearson")
## wind humidity temp ibh dpg
## wind 1.00 0.22 -0.01 0.20 0.34
## humidity 0.22 1.00 0.34 -0.24 0.65
## temp -0.01 0.34 1.00 -0.53 0.19
## ibh 0.20 -0.24 -0.53 1.00 0.04
## dpg 0.34 0.65 0.19 0.04 1.00
##
## n= 330
##
##
## P
## wind humidity temp ibh dpg
## wind 0.0000 0.9152 0.0003 0.0000
## humidity 0.0000 0.0000 0.0000 0.0000
## temp 0.9152 0.0000 0.0000 0.0005
## ibh 0.0003 0.0000 0.0000 0.5021
## dpg 0.0000 0.0000 0.0005 0.5021
library(here)
## Warning: 套件 'here' 是用 R 版本 4.1.2 來建造的
## here() starts at C:/Users/user/Desktop