1 Intro

Este projeto investigou os scouts de seleções de rugby.

2 Métodos

Os dados são apresentados como média e desvio padrão. As premissas para utilização da ANOVA One Way foram investigados utilizando o teste de Shapiro Wilk, para investigar se os residuos apresentam distribuição normal, bem como o teste de Levene foi implementado, visando investigar a homogeneidade da variância. A ANOVA de Welch foi utilizada para comparar os trimestres, e como comparações post-hoc, foi utilizado uma comparação do tipo pairwise com o teste Games-Howell. Nível de significância adotado foi de p < 0,05. As análises foram conduzidas utilizando o software R e bibliotecas dedicadas.

3 Imports

4 Load Data

5 Check data

## Rows: 50
## Columns: 43
## $ `#`                          <dbl> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13…
## $ jogador_tries                <chr> "Will Jordan", "Damian Penaud", "Bundee A…
## $ trimestre_tries              <dbl> 1, 3, 2, 4, 2, 1, 4, 2, 4, 2, 1, 1, 4, 4,…
## $ tries                        <dbl> 8, 6, 5, 5, 5, 5, 5, 5, 4, 4, 4, 3, 3, 3,…
## $ jogador_tackles_completos    <chr> "Marcos Kremer", "Ben Earl", "Franco Most…
## $ trimestre_tackles_completos  <dbl> 3, 1, 4, 1, 3, 3, 1, 4, 1, 2, 4, 4, 4, 4,…
## $ tackles_completos            <dbl> 92, 80, 73, 67, 66, 65, 63, 62, 61, 61, 6…
## $ jogador_chutes               <chr> "Alex Mitchell", "Beauden Barrett", "Sant…
## $ trimestre_chutes             <dbl> 2, 2, 1, 2, 1, 4, 3, 1, 4, 2, 3, 3, 2, 3,…
## $ chutes                       <dbl> 64, 60, 53, 49, 46, 45, 44, 36, 36, 34, 3…
## $ jogador_pontos               <chr> "Owen Farrell", "Thomas Ramos", "Emiliano…
## $ trimestre_pontos             <dbl> 3, 3, 1, 3, 2, 2, 2, 2, 1, 1, 4, 2, 1, 2,…
## $ pontos                       <dbl> 75, 74, 67, 58, 56, 53, 46, 45, 41, 40, 3…
## $ jogador_carregadas           <chr> "Ardie Savea", "Bundee Aki", "Beauden Bar…
## $ trimestre_carregadas         <dbl> 4, 2, 2, 3, 1, 1, 3, 1, 2, 4, 2, 1, 1, 4,…
## $ carregadas                   <dbl> 82, 81, 72, 67, 64, 63, 59, 59, 59, 56, 5…
## $ jogador_metros_carregados    <chr> "Will Jordan", "Beauden Barrett", "Bundee…
## $ trimestre_metros_carregados  <dbl> 1, 2, 2, 3, 2, 4, 1, 2, 3, 4, 4, 2, 2, 3,…
## $ metros_carregados            <dbl> 494, 493, 446, 425, 419, 392, 390, 389, 3…
## $ jogador_quebras_linha        <chr> "Damian Penaud", "Will Jordan", "Louis Bi…
## $ trimestre_quebras_linha      <dbl> 3, 1, 2, 2, 2, 4, 4, 4, 3, 1, 1, 1, 1, 4,…
## $ quebras_linha                <dbl> 13, 12, 10, 10, 9, 8, 8, 8, 8, 7, 7, 7, 7…
## $ jogador_offloads             <chr> "Antoine Dupont", "Charles Piutau", "Ardi…
## $ trimestre_offloads           <dbl> 4, 4, 4, 3, 1, 4, 4, 3, 4, 3, 1, 4, 2, 3,…
## $ offloads                     <dbl> 10, 10, 9, 8, 8, 8, 7, 7, 7, 6, 6, 6, 6, …
## $ jogador_defensores_batidos   <chr> "Mark Telea", "Mateo Carreras", "Bundee A…
## $ trimestre_defensores_batidos <dbl> 4, 4, 2, 4, 2, 1, 4, 3, 3, 2, 2, 2, 4, 4,…
## $ defensores_batidos           <dbl> 40, 33, 30, 27, 25, 24, 23, 22, 22, 21, 2…
## $ jogador_assistencias         <chr> "Cam Roigard", "Garry Ringrose", "Richie …
## $ trimestre_assistencias       <dbl> 4, 1, 2, 2, 3, 4, 4, 1, 4, 4, 2, 3, 3, 1,…
## $ assistencias                 <dbl> 6, 6, 5, 5, 5, 5, 4, 4, 4, 4, 4, 3, 3, 3,…
## $ jogador_tackles_perdidos     <chr> "Adrian Moțoc", "Tiaan Swanepoel", "Marco…
## $ trimestre_tackles_perdidos   <dbl> 3, 2, 3, 4, 1, 2, 4, 2, 4, 1, 3, 3, 3, 3,…
## $ tackles_perdidos             <dbl> 17, 17, 17, 14, 14, 14, 14, 13, 13, 13, 1…
## $ jogador_tackles_dominantes   <chr> "Damian De Allende", "Siya Kolisi", "Marc…
## $ trimestre_tackles_dominantes <dbl> 4, 2, 3, 2, 4, 1, 4, 4, 4, 1, 3, 4, 2, 1,…
## $ tackles_dominantes           <dbl> 11, 10, 9, 9, 8, 8, 8, 8, 8, 8, 7, 7, 6, …
## $ jogador_turnovers_ganhos     <chr> "Sam Cane", "Will Rowlands", "Scott Cummi…
## $ trimestre_turnovers_ganhos   <dbl> 1, 3, 4, 4, 4, 4, 1, 3, 4, 1, 2, 3, 3, 2,…
## $ turnovers_ganhos             <dbl> 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 2,…
## $ jogador_lineouts_ganhos      <chr> "Codie Taylor", "Jamie George", "Julián M…
## $ trimestre_lineouts_ganhos    <dbl> 1, 4, 4, 1, 1, 1, 1, 4, 1, 1, 1, 4, 3, 3,…
## $ lineouts_ganhos              <dbl> 53, 52, 48, 45, 44, 43, 34, 34, 28, 28, 2…

6 Convert ‘trimestre’ to factor

## Rows: 50
## Columns: 43
## $ `#`                          <dbl> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13…
## $ jogador_tries                <chr> "Will Jordan", "Damian Penaud", "Bundee A…
## $ trimestre_tries              <fct> 1, 3, 2, 4, 2, 1, 4, 2, 4, 2, 1, 1, 4, 4,…
## $ tries                        <dbl> 8, 6, 5, 5, 5, 5, 5, 5, 4, 4, 4, 3, 3, 3,…
## $ jogador_tackles_completos    <chr> "Marcos Kremer", "Ben Earl", "Franco Most…
## $ trimestre_tackles_completos  <fct> 3, 1, 4, 1, 3, 3, 1, 4, 1, 2, 4, 4, 4, 4,…
## $ tackles_completos            <dbl> 92, 80, 73, 67, 66, 65, 63, 62, 61, 61, 6…
## $ jogador_chutes               <chr> "Alex Mitchell", "Beauden Barrett", "Sant…
## $ trimestre_chutes             <fct> 2, 2, 1, 2, 1, 4, 3, 1, 4, 2, 3, 3, 2, 3,…
## $ chutes                       <dbl> 64, 60, 53, 49, 46, 45, 44, 36, 36, 34, 3…
## $ jogador_pontos               <chr> "Owen Farrell", "Thomas Ramos", "Emiliano…
## $ trimestre_pontos             <fct> 3, 3, 1, 3, 2, 2, 2, 2, 1, 1, 4, 2, 1, 2,…
## $ pontos                       <dbl> 75, 74, 67, 58, 56, 53, 46, 45, 41, 40, 3…
## $ jogador_carregadas           <chr> "Ardie Savea", "Bundee Aki", "Beauden Bar…
## $ trimestre_carregadas         <fct> 4, 2, 2, 3, 1, 1, 3, 1, 2, 4, 2, 1, 1, 4,…
## $ carregadas                   <dbl> 82, 81, 72, 67, 64, 63, 59, 59, 59, 56, 5…
## $ jogador_metros_carregados    <chr> "Will Jordan", "Beauden Barrett", "Bundee…
## $ trimestre_metros_carregados  <fct> 1, 2, 2, 3, 2, 4, 1, 2, 3, 4, 4, 2, 2, 3,…
## $ metros_carregados            <dbl> 494, 493, 446, 425, 419, 392, 390, 389, 3…
## $ jogador_quebras_linha        <chr> "Damian Penaud", "Will Jordan", "Louis Bi…
## $ trimestre_quebras_linha      <fct> 3, 1, 2, 2, 2, 4, 4, 4, 3, 1, 1, 1, 1, 4,…
## $ quebras_linha                <dbl> 13, 12, 10, 10, 9, 8, 8, 8, 8, 7, 7, 7, 7…
## $ jogador_offloads             <chr> "Antoine Dupont", "Charles Piutau", "Ardi…
## $ trimestre_offloads           <fct> 4, 4, 4, 3, 1, 4, 4, 3, 4, 3, 1, 4, 2, 3,…
## $ offloads                     <dbl> 10, 10, 9, 8, 8, 8, 7, 7, 7, 6, 6, 6, 6, …
## $ jogador_defensores_batidos   <chr> "Mark Telea", "Mateo Carreras", "Bundee A…
## $ trimestre_defensores_batidos <fct> 4, 4, 2, 4, 2, 1, 4, 3, 3, 2, 2, 2, 4, 4,…
## $ defensores_batidos           <dbl> 40, 33, 30, 27, 25, 24, 23, 22, 22, 21, 2…
## $ jogador_assistencias         <chr> "Cam Roigard", "Garry Ringrose", "Richie …
## $ trimestre_assistencias       <fct> 4, 1, 2, 2, 3, 4, 4, 1, 4, 4, 2, 3, 3, 1,…
## $ assistencias                 <dbl> 6, 6, 5, 5, 5, 5, 4, 4, 4, 4, 4, 3, 3, 3,…
## $ jogador_tackles_perdidos     <chr> "Adrian Moțoc", "Tiaan Swanepoel", "Marco…
## $ trimestre_tackles_perdidos   <fct> 3, 2, 3, 4, 1, 2, 4, 2, 4, 1, 3, 3, 3, 3,…
## $ tackles_perdidos             <dbl> 17, 17, 17, 14, 14, 14, 14, 13, 13, 13, 1…
## $ jogador_tackles_dominantes   <chr> "Damian De Allende", "Siya Kolisi", "Marc…
## $ trimestre_tackles_dominantes <fct> 4, 2, 3, 2, 4, 1, 4, 4, 4, 1, 3, 4, 2, 1,…
## $ tackles_dominantes           <dbl> 11, 10, 9, 9, 8, 8, 8, 8, 8, 8, 7, 7, 6, …
## $ jogador_turnovers_ganhos     <chr> "Sam Cane", "Will Rowlands", "Scott Cummi…
## $ trimestre_turnovers_ganhos   <fct> 1, 3, 4, 4, 4, 4, 1, 3, 4, 1, 2, 3, 3, 2,…
## $ turnovers_ganhos             <dbl> 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 2,…
## $ jogador_lineouts_ganhos      <chr> "Codie Taylor", "Jamie George", "Julián M…
## $ trimestre_lineouts_ganhos    <fct> 1, 4, 4, 1, 1, 1, 1, 4, 1, 1, 1, 4, 3, 3,…
## $ lineouts_ganhos              <dbl> 53, 52, 48, 45, 44, 43, 34, 34, 28, 28, 2…

7 Plot data - “tries”

## [1] "Shapiro - Wilk's test for normality of residuals:"
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(anv_tries)
## W = 0.8167, p-value = 2.174e-06
## [1] "Levene's test for homogeneity of variances:"
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.5869 0.6267
##       46

## [1] "Assumptions violated: Running Welch's ANOVA"
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  tries and trimestre_tries
## F = 0.32138, num df = 3.000, denom df = 21.837, p-value = 0.8098
## [1] "ANOVA de Welch demonstra que não houve diferença estatística no numero de 'tries' entre cada trimestre de nascimento."

8 Plot data - “tackles_completos”

## [1] "Shapiro - Wilk's test for normality of residuals:"
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(anv_tackles_completos)
## W = 0.83864, p-value = 7.728e-06
## [1] "Levene's test for homogeneity of variances:"
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.5933 0.6225
##       46

## [1] "Assumptions violated: Running Welch's ANOVA"
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  tackles_completos and trimestre_tackles_completos
## F = 0.67698, num df = 3.000, denom df = 23.279, p-value = 0.5749
## [1] "ANOVA de Welch demonstra que não houve diferença estatística no numero de 'tackles_completos' entre cada trimestre de nascimento."

9 Plot data - “chutes”

## [1] "Shapiro - Wilk's test for normality of residuals:"
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(anv_chutes)
## W = 0.87729, p-value = 9.27e-05
## [1] "Levene's test for homogeneity of variances:"
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  1.1297 0.3469
##       46

## [1] "Assumptions violated: Running Welch's ANOVA"
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  chutes and trimestre_chutes
## F = 0.49753, num df = 3.000, denom df = 24.638, p-value = 0.6874
## [1] "ANOVA de Welch demonstra que não houve diferença estatística no numero de 'chutes' entre cada trimestre de nascimento."

10 Plot data - “pontos”

## [1] "Shapiro - Wilk's test for normality of residuals:"
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(anv_pontos)
## W = 0.90945, p-value = 0.001001
## [1] "Levene's test for homogeneity of variances:"
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  2.1033 0.1128
##       46

## [1] "Assumptions violated: Running Welch's ANOVA"
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  pontos and trimestre_pontos
## F = 3.6886, num df = 3.000, denom df = 20.174, p-value = 0.02892
Análise post-hoc usando Games-Howell

ANOVA de Welch demonstra que HOUVE diferença estatística no numero de ‘pontos’ entre cada trimestre de nascimento F~3, ~20,1 = 3,7; p = 0,02, onde o número de pontos daqueles nascidos no 4º trimestre foi menor que aqueles nascidos no 3º trimestre (p=0,031)

11 Plot data - “carregadas”

## [1] "Shapiro - Wilk's test for normality of residuals:"
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(anv_carregadas)
## W = 0.85851, p-value = 2.651e-05
## [1] "Levene's test for homogeneity of variances:"
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.4249 0.7361
##       46

## [1] "Assumptions violated: Running Welch's ANOVA"
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  carregadas and trimestre_carregadas
## F = 0.33849, num df = 3.000, denom df = 24.836, p-value = 0.7976
## [1] "ANOVA de Welch demonstra que não houve diferença estatística no numero de 'carregadas' entre cada trimestre de nascimento."

12 Plot data - “metros_carregados”

## [1] "Shapiro - Wilk's test for normality of residuals:"
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(anv_metros_carregados)
## W = 0.95819, p-value = 0.07468
## [1] "Levene's test for homogeneity of variances:"
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.7731  0.515
##       46

## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  metros_carregados and trimestre_metros_carregados
## F = 0.42278, num df = 3.000, denom df = 24.526, p-value = 0.7383
## [1] "ANOVA de Welch demonstra que não houve diferença estatística no numero de 'metros_carregados' entre cada trimestre de nascimento."

13 Plot data - “quebras_linha”

## [1] "Shapiro - Wilk's test for normality of residuals:"
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(anv_quebras_linha)
## W = 0.85299, p-value = 1.866e-05
## [1] "Levene's test for homogeneity of variances:"
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.6897  0.563
##       46

## [1] "Assumptions violated: Running Welch's ANOVA"
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  quebras_linha and trimestre_quebras_linha
## F = 0.21667, num df = 3.000, denom df = 14.766, p-value = 0.8833
## [1] "ANOVA de Welch demonstra que não houve diferença estatística no numero de 'quebras_linha' entre cada trimestre de nascimento."

14 Plot data - “offloads”

## [1] "Shapiro - Wilk's test for normality of residuals:"
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(anv_offloads)
## W = 0.95307, p-value = 0.04568
## [1] "Levene's test for homogeneity of variances:"
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value  Pr(>F)   
## group  3  4.6126 0.00665 **
##       46                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

## [1] "Assumptions violated: Running Welch's ANOVA"
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  offloads and trimestre_offloads
## F = 2.1797, num df = 3.000, denom df = 24.174, p-value = 0.1164
## [1] "ANOVA de Welch demonstra que não houve diferença estatística no numero de 'offloads' entre cada trimestre de nascimento."

15 Plot data - “defensores_batidos”

## [1] "Shapiro - Wilk's test for normality of residuals:"
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(anv_defensores_batidos)
## W = 0.87333, p-value = 7.062e-05
## [1] "Levene's test for homogeneity of variances:"
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  2.0272 0.1232
##       46

## [1] "Assumptions violated: Running Welch's ANOVA"
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  defensores_batidos and trimestre_defensores_batidos
## F = 1.9092, num df = 3.000, denom df = 18.129, p-value = 0.164
## [1] "ANOVA de Welch demonstra que não houve diferença estatística no numero de 'defensores_batidos' entre cada trimestre de nascimento."

16 Plot data - “assistencias”

## [1] "Shapiro - Wilk's test for normality of residuals:"
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(anv_assistencias)
## W = 0.8789, p-value = 0.0001037
## [1] "Levene's test for homogeneity of variances:"
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  1.5019 0.2266
##       46

## [1] "Assumptions violated: Running Welch's ANOVA"
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  assistencias and trimestre_assistencias
## F = 0.884, num df = 3.000, denom df = 23.935, p-value = 0.4634
## [1] "ANOVA de Welch demonstra que não houve diferença estatística no numero de 'assistencias' entre cada trimestre de nascimento."

17 Plot data - “tackles_perdidos”

## [1] "Shapiro - Wilk's test for normality of residuals:"
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(anv_tackles_perdidos)
## W = 0.86756, p-value = 4.791e-05
## [1] "Levene's test for homogeneity of variances:"
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.4044 0.7506
##       46

## [1] "Assumptions violated: Running Welch's ANOVA"
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  tackles_perdidos and trimestre_tackles_perdidos
## F = 0.79649, num df = 3.000, denom df = 20.068, p-value = 0.5102
## [1] "ANOVA de Welch demonstra que não houve diferença estatística no numero de 'tackles_perdidos' entre cada trimestre de nascimento."

18 Plot data - “tackles_dominantes”

## [1] "Shapiro - Wilk's test for normality of residuals:"
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(anv_tackles_dominantes)
## W = 0.89503, p-value = 0.0003306
## [1] "Levene's test for homogeneity of variances:"
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  1.6209 0.1975
##       46

## [1] "Assumptions violated: Running Welch's ANOVA"
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  tackles_dominantes and trimestre_tackles_dominantes
## F = 0.57045, num df = 3.000, denom df = 25.244, p-value = 0.6396
## [1] "ANOVA de Welch demonstra que não houve diferença estatística no numero de 'tackles_dominantes' entre cada trimestre de nascimento."

19 Plot data - “turnovers_ganhos”

## [1] "Shapiro - Wilk's test for normality of residuals:"
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(anv_turnovers_ganhos)
## W = 0.72433, p-value = 2.324e-08
## [1] "Levene's test for homogeneity of variances:"
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.8974 0.4497
##       46

## [1] "Assumptions violated: Running Welch's ANOVA"
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  turnovers_ganhos and trimestre_turnovers_ganhos
## F = 1.3404, num df = 3.000, denom df = 24.105, p-value = 0.2846
## [1] "ANOVA de Welch demonstra que não houve diferença estatística no numero de 'turnovers_ganhos' entre cada trimestre de nascimento."

20 Plot data - “lineouts_ganhos”

## [1] "Shapiro - Wilk's test for normality of residuals:"
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(anv_lineouts_ganhos)
## W = 0.95011, p-value = 0.03449
## [1] "Levene's test for homogeneity of variances:"
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value  Pr(>F)  
## group  3  2.9948 0.04031 *
##       46                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

## [1] "Assumptions violated: Running Welch's ANOVA"
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  lineouts_ganhos and trimestre_lineouts_ganhos
## F = 4.4369, num df = 3.000, denom df = 22.891, p-value = 0.01341
Análise post-hoc Games-Howell
## [1] "ANOVA de Welch demonstra que houve diferença estatística no numero de 'lineouts_ganhos' entre cada trimestre de nascimento."