#讀檔案,資料來自於 TIMSS 2011 年

install.packages("https://cran.rstudio.com/bin/windows/contrib/4.1/faraway_1.0.7.zip", repos = NULL)
## 將程式套件安載入 'C:/Users/user/Documents/R/win-library/4.1'
## (因為 'lib' 沒有被指定)
## package 'faraway' successfully unpacked and MD5 sums checked
library(faraway)
## Warning: 套件 'faraway' 是用 R 版本 4.1.2 來建造的

#檢視資料結構

str(ozone)
## 'data.frame':    330 obs. of  10 variables:
##  $ O3      : num  3 5 5 6 4 4 6 7 4 6 ...
##  $ vh      : num  5710 5700 5760 5720 5790 5790 5700 5700 5770 5720 ...
##  $ wind    : num  4 3 3 4 6 3 3 3 8 3 ...
##  $ humidity: num  28 37 51 69 19 25 73 59 27 44 ...
##  $ temp    : num  40 45 54 35 45 55 41 44 54 51 ...
##  $ ibh     : num  2693 590 1450 1568 2631 ...
##  $ dpg     : num  -25 -24 25 15 -33 -28 23 -2 -19 9 ...
##  $ ibt     : num  87 128 139 121 123 182 114 91 92 173 ...
##  $ vis     : num  250 100 60 60 100 250 120 120 120 150 ...
##  $ doy     : num  33 34 35 36 37 38 39 40 41 42 ...

#看看前六筆

head(ozone)
##   O3   vh wind humidity temp  ibh dpg ibt vis doy
## 1  3 5710    4       28   40 2693 -25  87 250  33
## 2  5 5700    3       37   45  590 -24 128 100  34
## 3  5 5760    3       51   54 1450  25 139  60  35
## 4  6 5720    4       69   35 1568  15 121  60  36
## 5  4 5790    6       19   45 2631 -33 123 100  37
## 6  4 5790    3       25   55  554 -28 182 250  38

#看看資料基本統計

summary(ozone)
##        O3              vh            wind           humidity    
##  Min.   : 1.00   Min.   :5320   Min.   : 0.000   Min.   :19.00  
##  1st Qu.: 5.00   1st Qu.:5690   1st Qu.: 3.000   1st Qu.:47.00  
##  Median :10.00   Median :5760   Median : 5.000   Median :64.00  
##  Mean   :11.78   Mean   :5750   Mean   : 4.848   Mean   :58.13  
##  3rd Qu.:17.00   3rd Qu.:5830   3rd Qu.: 6.000   3rd Qu.:73.00  
##  Max.   :38.00   Max.   :5950   Max.   :11.000   Max.   :93.00  
##       temp            ibh              dpg              ibt       
##  Min.   :25.00   Min.   : 111.0   Min.   :-69.00   Min.   :-25.0  
##  1st Qu.:51.00   1st Qu.: 877.5   1st Qu.: -9.00   1st Qu.:107.0  
##  Median :62.00   Median :2112.5   Median : 24.00   Median :167.5  
##  Mean   :61.75   Mean   :2572.9   Mean   : 17.37   Mean   :161.2  
##  3rd Qu.:72.00   3rd Qu.:5000.0   3rd Qu.: 44.75   3rd Qu.:214.0  
##  Max.   :93.00   Max.   :5000.0   Max.   :107.00   Max.   :332.0  
##       vis             doy       
##  Min.   :  0.0   Min.   : 33.0  
##  1st Qu.: 70.0   1st Qu.:120.2  
##  Median :120.0   Median :205.5  
##  Mean   :124.5   Mean   :209.4  
##  3rd Qu.:150.0   3rd Qu.:301.8  
##  Max.   :350.0   Max.   :390.0

#先看看內建的兩兩散佈圖

plot(ozone$wind, ozone$doy)

#也是內建的直方圖

hist(ozone$wind)

#載進 lattice,準備畫圖。

library(lattice)
## Warning: 套件 'lattice' 是用 R 版本 4.1.2 來建造的
## 
## 載入套件:'lattice'
## 下列物件被遮斷自 'package:faraway':
## 
##     melanoma

#看看數學分數的直方圖

histogram(~ wind, data = ozone, xlab = '風速', ylab='機率',type = "density")

##連續變項間關係 #把學科分數取出來

dta_scores <- ozone[, c('wind', 'humidity', 'temp', 'ibh', 'dpg')]

#兩兩變項畫散佈圖

pairs(dta_scores, pch = '.', upper.panel = panel.smooth, lower.panel = NULL, col = 'gray')

#數學與物理分數相關

round(cor(ozone$wind,ozone$temp), 3)
## [1] -0.006

#所有學科分數相關

round(cor(dta_scores), 3)
##            wind humidity   temp    ibh   dpg
## wind      1.000    0.223 -0.006  0.197 0.342
## humidity  0.223    1.000  0.340 -0.242 0.648
## temp     -0.006    0.340  1.000 -0.533 0.189
## ibh       0.197   -0.242 -0.533  1.000 0.037
## dpg       0.342    0.648  0.189  0.037 1.000

#檢定相關是否顯著,也可以看到信賴區間

cor.test( ~ wind + temp, data = dta_scores)
## 
##  Pearson's product-moment correlation
## 
## data:  wind and temp
## t = -0.1066, df = 328, p-value = 0.9152
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.1137774  0.1021428
## sample estimates:
##          cor 
## -0.005885934

#載進 Hmist,一次檢定所有相關

library(Hmisc)
## Warning: 套件 'Hmisc' 是用 R 版本 4.1.2 來建造的
## 載入需要的套件:survival
## 
## 載入套件:'survival'
## 下列物件被遮斷自 'package:faraway':
## 
##     rats, solder
## 載入需要的套件:Formula
## Warning: 套件 'Formula' 是用 R 版本 4.1.1 來建造的
## 載入需要的套件:ggplot2
## Warning: 套件 'ggplot2' 是用 R 版本 4.1.2 來建造的
## 
## 載入套件:'Hmisc'
## 下列物件被遮斷自 'package:base':
## 
##     format.pval, units
rcorr(as.matrix(dta_scores), type="pearson")
##           wind humidity  temp   ibh  dpg
## wind      1.00     0.22 -0.01  0.20 0.34
## humidity  0.22     1.00  0.34 -0.24 0.65
## temp     -0.01     0.34  1.00 -0.53 0.19
## ibh       0.20    -0.24 -0.53  1.00 0.04
## dpg       0.34     0.65  0.19  0.04 1.00
## 
## n= 330 
## 
## 
## P
##          wind   humidity temp   ibh    dpg   
## wind            0.0000   0.9152 0.0003 0.0000
## humidity 0.0000          0.0000 0.0000 0.0000
## temp     0.9152 0.0000          0.0000 0.0005
## ibh      0.0003 0.0000   0.0000        0.5021
## dpg      0.0000 0.0000   0.0005 0.5021
library(here)
## Warning: 套件 'here' 是用 R 版本 4.1.2 來建造的
## here() starts at C:/Users/user/Desktop