Aulas 4.12 à 4.18

Teste T para variâncias heterogêneas

Este material está disponível em: http://rpubs.com/leonardoreffatti.

1- Lendo os dados, resumo dos dados e carregando pacotes

setwd("C:/R/Curso do R/MODULO_4.2/4.12 e 4.13 - Outliers e log")
dados<-read.table("pratica1_mod.txt", h=T)
dados
##    UA   Ambiente Área Riqueza Abund_sp1
## 1   1   primário  101      35         3
## 2   2   primário  115      31         3
## 3   3   primário  143      39         1
## 4   4   primário   92      25         6
## 5   5   primário   51      22         1
## 6   6   primário   89      35         0
## 7   7   primário  128      43         3
## 8   8   primário  149      48         5
## 9   9   primário  127      35         0
## 10 10   primário  108      38         2
## 11 11   primário   83      32         0
## 12 12   primário  140      33         2
## 13 13   primário  163      40         2
## 14 14   primário   41      16         3
## 15 15   primário  107      31         5
## 16 16   primário   79      23         3
## 17 17   primário  104      32         1
## 18 18   primário   60      35         4
## 19 19   primário   82      22         3
## 20 20   primário  148      41         0
## 21 21   primário   97      24         2
## 22 22   primário   49      18         3
## 23 23 secundário  164      39         1
## 24 24 secundário  110      32         3
## 25 25 secundário   51      19         3
## 26 26 secundário   40      20         1
## 27 27 secundário   92      31         3
## 28 28 secundário  163      26         1
## 29 29 secundário  128      20         2
## 30 30 secundário  130      33         2
## 31 31 secundário  122      36         2
## 32 32 secundário   96      32         2
## 33 33 secundário   59      28         8
## 34 34 secundário   73      23         5
## 35 35 secundário   90      28         1
## 36 36 secundário   48      16         0
## 37 37 secundário  166      44         3
## 38 38 secundário  121      27         0
## 39 39 secundário  167      37         3
## 40 40 secundário   48      24         2
## 41 41 secundário   78      19         0
## 42 42 secundário  105      28         2
## 43 43 secundário   90      27         0
## 44 44 secundário  105      28         0
## 45 45 secundário  166      27         1
## 46 46 secundário   84      20         3
## 47 47 secundário   57      34         3
## 48 48 secundário   81      20         4
## 49 49 secundário  122      31         1
## 50 50 secundário  112      14         0
## 51 51   primário   92       3         6
## 52 52   primário   51       5         1
## 53 53   primário   89      70         0
## 54 54   primário  122      65         3
attach(dados)
summary(dados)
##        UA              Ambiente       Área          Riqueza     
##  Min.   : 1.00   primário  :26   Min.   : 40.0   Min.   : 3.00  
##  1st Qu.:14.25   secundário:28   1st Qu.: 79.5   1st Qu.:22.25  
##  Median :27.50                   Median : 99.0   Median :29.50  
##  Mean   :27.50                   Mean   :101.4   Mean   :29.70  
##  3rd Qu.:40.75                   3rd Qu.:125.8   3rd Qu.:35.00  
##  Max.   :54.00                   Max.   :167.0   Max.   :70.00  
##    Abund_sp1    
##  Min.   :0.000  
##  1st Qu.:1.000  
##  Median :2.000  
##  Mean   :2.185  
##  3rd Qu.:3.000  
##  Max.   :8.000
library(car)
## Loading required package: carData
library(carData)
library(sciplot)

2- Inspeção visual da simetria dos dados

boxplot(Riqueza~Ambiente)

3- Pressuposto da Normalidade para cada ambiente - inspeção visual

par(mfrow=c(1,2))
qqnorm(Riqueza[Ambiente=="primário"], pch=16, main = "primário")
qqline(Riqueza[Ambiente=="primário"], lty=2, col="red")
qqnorm(Riqueza[Ambiente=="secundário"], pch=16, main = "secundário")
qqline(Riqueza[Ambiente=="secundário"], lty=2, col="red")

4- Teste de Normalidade - Teste de Shapiro Wilk

Se p>0,05 os dados apresentam normalidade
shapiro.test(Riqueza[Ambiente=="primário"])
## 
##  Shapiro-Wilk normality test
## 
## data:  Riqueza[Ambiente == "primário"]
## W = 0.94442, p-value = 0.1712
shapiro.test(Riqueza[Ambiente=="secundário"])
## 
##  Shapiro-Wilk normality test
## 
## data:  Riqueza[Ambiente == "secundário"]
## W = 0.9773, p-value = 0.7815

5- Pressuposto da Homogeneidade de Variâncias - Teste de Levene

Se pr<0,05, variâncias apresentam heterogeneidade
leveneTest(Riqueza~Ambiente)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)  
## group  1  5.0172 0.0294 *
##       52                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

6- Teste T

var.equal=F para variâncias com heterogeneidade
Se p<0,05, as médias são diferentes
t.test(Riqueza~Ambiente, var.equal=F)
## 
##  Welch Two Sample t-test
## 
## data:  Riqueza by Ambiente
## t = 1.5738, df = 35.562, p-value = 0.1244
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -1.473894 11.666201
## sample estimates:
##   mean in group primário mean in group secundário 
##                 32.34615                 27.25000

Seguir etapas 7, 8 e 9 do MODULO 4 - Parte 1

__________________________________________________________________________

Teste T com Caudalidade, MONOCAUDAL

1- Lendo os dados, resumo dos dados e carregando pacotes

dados<-read.table("pratica1_mod.txt", h=T)
dados
##    UA   Ambiente Área Riqueza Abund_sp1
## 1   1   primário  101      35         3
## 2   2   primário  115      31         3
## 3   3   primário  143      39         1
## 4   4   primário   92      25         6
## 5   5   primário   51      22         1
## 6   6   primário   89      35         0
## 7   7   primário  128      43         3
## 8   8   primário  149      48         5
## 9   9   primário  127      35         0
## 10 10   primário  108      38         2
## 11 11   primário   83      32         0
## 12 12   primário  140      33         2
## 13 13   primário  163      40         2
## 14 14   primário   41      16         3
## 15 15   primário  107      31         5
## 16 16   primário   79      23         3
## 17 17   primário  104      32         1
## 18 18   primário   60      35         4
## 19 19   primário   82      22         3
## 20 20   primário  148      41         0
## 21 21   primário   97      24         2
## 22 22   primário   49      18         3
## 23 23 secundário  164      39         1
## 24 24 secundário  110      32         3
## 25 25 secundário   51      19         3
## 26 26 secundário   40      20         1
## 27 27 secundário   92      31         3
## 28 28 secundário  163      26         1
## 29 29 secundário  128      20         2
## 30 30 secundário  130      33         2
## 31 31 secundário  122      36         2
## 32 32 secundário   96      32         2
## 33 33 secundário   59      28         8
## 34 34 secundário   73      23         5
## 35 35 secundário   90      28         1
## 36 36 secundário   48      16         0
## 37 37 secundário  166      44         3
## 38 38 secundário  121      27         0
## 39 39 secundário  167      37         3
## 40 40 secundário   48      24         2
## 41 41 secundário   78      19         0
## 42 42 secundário  105      28         2
## 43 43 secundário   90      27         0
## 44 44 secundário  105      28         0
## 45 45 secundário  166      27         1
## 46 46 secundário   84      20         3
## 47 47 secundário   57      34         3
## 48 48 secundário   81      20         4
## 49 49 secundário  122      31         1
## 50 50 secundário  112      14         0
## 51 51   primário   92       3         6
## 52 52   primário   51       5         1
## 53 53   primário   89      70         0
## 54 54   primário  122      65         3
attach(dados)
## The following objects are masked from dados (pos = 6):
## 
##     Abund_sp1, Ambiente, Área, Riqueza, UA
summary(dados)
##        UA              Ambiente       Área          Riqueza     
##  Min.   : 1.00   primário  :26   Min.   : 40.0   Min.   : 3.00  
##  1st Qu.:14.25   secundário:28   1st Qu.: 79.5   1st Qu.:22.25  
##  Median :27.50                   Median : 99.0   Median :29.50  
##  Mean   :27.50                   Mean   :101.4   Mean   :29.70  
##  3rd Qu.:40.75                   3rd Qu.:125.8   3rd Qu.:35.00  
##  Max.   :54.00                   Max.   :167.0   Max.   :70.00  
##    Abund_sp1    
##  Min.   :0.000  
##  1st Qu.:1.000  
##  Median :2.000  
##  Mean   :2.185  
##  3rd Qu.:3.000  
##  Max.   :8.000
library(car)
library(carData)
library(sciplot)

Seguir etapas 2, 3, 4 e 5 do MODULO 4 - Parte 1

6- Teste T, monocaudal

var.equal=T para variâncias com homogeneidade
alternative = c(“two.sided”, “less”, “greater”)
Se p<0,05, as médias são diferentes
levels(Ambiente)
## [1] "primário"   "secundário"
tapply(Riqueza, Ambiente, mean)
##   primário secundário 
##   32.34615   27.25000
t.test(Riqueza~Ambiente, var.equal=T, alternative="greater")
## 
##  Two Sample t-test
## 
## data:  Riqueza by Ambiente
## t = 1.611, df = 52, p-value = 0.05662
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
##  -0.2014775        Inf
## sample estimates:
##   mean in group primário mean in group secundário 
##                 32.34615                 27.25000

Seguir etapas 7, 8 e 9 do MODULO 4 - Parte 1

__________________________________________________________________________

Teste T Pareado, ou para amostras dependentes

1- Lendo os dados, resumo dos dados e carregando pacotes

dados<-read.table("pares.txt", h=T)
dados
##    Planta Ramo_desoberto Ramo_coberto
## 1       1             40           35
## 2       2             27           15
## 3       3             34           20
## 4       4             23           17
## 5       5             37           24
## 6       6             26           18
## 7       7             40           33
## 8       8             26           13
## 9       9             19            3
## 10     10             41           35
## 11     11             32           21
## 12     12             35           27
## 13     13             31           25
## 14     14             35           22
## 15     15             30           15
## 16     16             25           16
## 17     17             37           23
## 18     18             29           20
## 19     19             33           28
## 20     20             40           29
## 21     21             32           16
## 22     22             26           17
## 23     23             20            9
## 24     24             34           23
## 25     25             36           24
## 26     26             32           22
## 27     27             20            9
attach(dados)
summary(dados)
##      Planta     Ramo_desoberto   Ramo_coberto 
##  Min.   : 1.0   Min.   :19.00   Min.   : 3.0  
##  1st Qu.: 7.5   1st Qu.:26.00   1st Qu.:16.0  
##  Median :14.0   Median :32.00   Median :21.0  
##  Mean   :14.0   Mean   :31.11   Mean   :20.7  
##  3rd Qu.:20.5   3rd Qu.:35.50   3rd Qu.:24.5  
##  Max.   :27.0   Max.   :41.00   Max.   :35.0
library(car)
library(carData)
library(sciplot)

Seguir etapas 2, 3, 4 e 5 do MODULO 4 - Parte 1, para os dados das diferenças das variáveis

diferenças<-Ramo_desoberto-Ramo_coberto
diferenças
##  [1]  5 12 14  6 13  8  7 13 16  6 11  8  6 13 15  9 14  9  5 11 16  9 11
## [24] 11 12 10 11

3- Pressuposto da Normalidade - inspeção visual

qqnorm(diferenças, pch=16)
qqline(diferenças, lty=2, col="red")

6- Teste T Pareado

paired = TRUE
alternative = c(“two.sided”, “less”, “greater”)
Se p<0,05, as médias são diferentes
t.test(Ramo_desoberto, Ramo_coberto, paired = T, alternative = "greater")
## 
##  Paired t-test
## 
## data:  Ramo_desoberto and Ramo_coberto
## t = 16.405, df = 26, p-value = 1.556e-15
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
##  9.325384      Inf
## sample estimates:
## mean of the differences 
##                10.40741
t.test(Ramo_desoberto, Ramo_coberto, paired = T)
## 
##  Paired t-test
## 
## data:  Ramo_desoberto and Ramo_coberto
## t = 16.405, df = 26, p-value = 3.113e-15
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##   9.103404 11.711410
## sample estimates:
## mean of the differences 
##                10.40741

7- Gráfico para Teste T pareado

matplot(t(dados[,2:3]), type="b", pch=16, col="black", lty=3, 
        ylab="Número de Frutos", xlab="Tratamentos")