class: center, middle, inverse, title-slide .title[ # Análise de Dados no Futebol: ] .subtitle[ ## Como a ciência de dados está Transformando o Esporte. ] .author[ ### Analista e Cientista de Dados. ] .author[ ### Aldrei Peralta ] .date[ ### 2024-02-08 ] --- ## Introdução A Estatística é uma ferramenta única que possui varias distribuições de amostras que estabelecem conexão entre a natureza e a matemática. A correlação entre esses dois tópicos é fundamental para estabelecer evolução e certezas. A maioria dos eventos hoje ocorrem de forma diferentes e subjetivas, dada que a falta de dados coletados pode gerar imprecisão e divergência de ideias, as principais ideias são enraizadas em conhecimento empírico ou senso comum, a ciência de dados vem para lapidar essa aleatoriedade e buscando padrões que possam ser significativos para o cotidiano. No Futebol o processo de coleta de dados é avaliado de acordo com a capacidade analítica de uma API, seja por meio de GPS ou monitoramento específicos que geram indicadores e variáveis como Velocidade, Passe, Defesa, Ataque, intensidade, precisão, condicionamento físico e entre outros. A análise de dados precisa fazer ponto com todas as áreas de um clube, seja para contratar atletas, prevenir lesões, tomar decisões na hora da escalação ou na variação tática. Não existe limite para explorar técnicas e ferramentas, o que pode limitar é apenas a quantidade de amostragem. --- name: colors ## Cultura e Filosofia Implementar um sistema específico como uma coordenação ou um departamento de futebol com infraestrutura robusta em dados pode ser uma tarefa difícil se não houver um planejamento significativo para um clube de futebol, existem vários planejamentos de experimentos para serem organizados e seguidos. O Time possui uma cultura e filosofia própria como abordagem em contratação, esquema de jogo, departamento de saúde tem suas próprias métricas a serem seguidas, o papel em cada setor deste analista é entender como esses profissionais trabalham e tentar conectar a tais departamentos. --- ## Conectando departamentos. Departamento Técnico/Treinadores: O analista de dados colabora estreitamente com os treinadores para fornecer insights baseados em dados sobre o desempenho dos jogadores durante treinos e jogos. Utilizando estatísticas e análises, eles identificam áreas de melhoria individuais e coletivas, ajustam estratégias táticas e acompanham o progresso dos jogadores ao longo do tempo. Essa colaboração resulta em tomadas de decisão mais informadas, melhorando a eficácia dos treinamentos e maximizando o desempenho da equipe no campo. **Objetivo:** Este é um banco de dados de futebol que possui 1025 observações com as posições de atletas em campo com 11 jogadores.São eles: Goleiro, zagueiro, lateral, meia e atacante. Cada atleta possui características únicas a serem avaliadas e observadas. O principal fator é análise reativa dos atletas buscando observar e compreender as características de desempenho dos mesmos, sendo assim podendo criar relatórios amostrais dos mesmos. --- ## Banco de dados. Como já citado o banco de dados é sobre futebol e além disso, será feita uma análise descritiva das variáveis em análises para que possa categorizar e interpretar. São procedimentos obrigatórios do pesquisador científico realizar a análise exploratória de dados. <img src="apresentação---analista-de-dados_files/figure-html/plot1-example-1.png" width="100%" /> --- class: inverse center middle # Aplicando análise de dados em Treino. --- ## **Análise Descritiva do Atleta.** Nome: Adryan Costa Posição: Meia <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> Variavel </th> <th style="text-align:right;"> Min. </th> <th style="text-align:right;"> 1st Qu. </th> <th style="text-align:right;"> Median </th> <th style="text-align:right;"> Mean </th> <th style="text-align:right;"> 3rd Qu. </th> <th style="text-align:right;"> Max. </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> Velocity B7+ Average Effort Distance (Gen2) </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 1.268125 </td> <td style="text-align:right;"> 0.00000 </td> <td style="text-align:right;"> 23.773 </td> </tr> <tr> <td style="text-align:left;"> Velocity B6+ Average Effort Distance (Gen2) </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 1.914172 </td> <td style="text-align:right;"> 0.00000 </td> <td style="text-align:right;"> 28.191 </td> </tr> <tr> <td style="text-align:left;"> Velocity B5+ Average Effort Distance (Gen2) </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 3.186406 </td> <td style="text-align:right;"> 0.97525 </td> <td style="text-align:right;"> 29.323 </td> </tr> <tr> <td style="text-align:left;"> Velocity B3+ Average Effort Distance (Gen2) </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 6.2745 </td> <td style="text-align:right;"> 9.5805 </td> <td style="text-align:right;"> 10.548625 </td> <td style="text-align:right;"> 13.61550 </td> <td style="text-align:right;"> 34.014 </td> </tr> <tr> <td style="text-align:left;"> Velocity B2+ Average Effort Distance (Gen2) </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 13.585984 </td> <td style="text-align:right;"> 2.39800 </td> <td style="text-align:right;"> 248.329 </td> </tr> </tbody> </table> --- ## Análise Gráfica da variavel: Velocidade Isso pode ajudar a entender a distribuição da velocidade. Pode revelar se há uma velocidade média consistente ou se existem variações significativas. <img src="apresentação---analista-de-dados_files/figure-html/plot2-example-1.png" width="100%" /> --- # **Desempenho** - **Variação de Intensidade** <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> Variavel </th> <th style="text-align:right;"> Min. </th> <th style="text-align:right;"> 1st Qu. </th> <th style="text-align:right;"> Median </th> <th style="text-align:right;"> Mean </th> <th style="text-align:right;"> 3rd Qu. </th> <th style="text-align:right;"> Max. </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> Profile Max Velocity </td> <td style="text-align:right;"> 32.04 </td> <td style="text-align:right;"> 32.04 </td> <td style="text-align:right;"> 32.040 </td> <td style="text-align:right;"> 32.040000 </td> <td style="text-align:right;"> 32.0400 </td> <td style="text-align:right;"> 32.04 </td> </tr> <tr> <td style="text-align:left;"> Standing (m) </td> <td style="text-align:right;"> 0.00 </td> <td style="text-align:right;"> 0.06 </td> <td style="text-align:right;"> 0.330 </td> <td style="text-align:right;"> 1.319219 </td> <td style="text-align:right;"> 0.9325 </td> <td style="text-align:right;"> 28.14 </td> </tr> <tr> <td style="text-align:left;"> Jogging (m) </td> <td style="text-align:right;"> 0.00 </td> <td style="text-align:right;"> 9.41 </td> <td style="text-align:right;"> 27.245 </td> <td style="text-align:right;"> 60.710625 </td> <td style="text-align:right;"> 37.0925 </td> <td style="text-align:right;"> 1298.09 </td> </tr> <tr> <td style="text-align:left;"> Medium-intensity running (m) </td> <td style="text-align:right;"> 0.00 </td> <td style="text-align:right;"> 0.00 </td> <td style="text-align:right;"> 6.665 </td> <td style="text-align:right;"> 20.202969 </td> <td style="text-align:right;"> 13.2875 </td> <td style="text-align:right;"> 432.93 </td> </tr> <tr> <td style="text-align:left;"> Sprinting (m) </td> <td style="text-align:right;"> 0.00 </td> <td style="text-align:right;"> 0.00 </td> <td style="text-align:right;"> 0.000 </td> <td style="text-align:right;"> 2.192188 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 46.77 </td> </tr> </tbody> </table> --- - **Gráfico de Variação de Intensidade** <img src="apresentação---analista-de-dados_files/figure-html/plot3-example-1.png" width="100%" /> --- # **Aceleração** <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> Variavel </th> <th style="text-align:right;"> Min. </th> <th style="text-align:right;"> 1st Qu. </th> <th style="text-align:right;"> Median </th> <th style="text-align:right;"> Mean </th> <th style="text-align:right;"> 3rd Qu. </th> <th style="text-align:right;"> Max. </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> Acceleration B2-3 Distance (Gen 2) </td> <td style="text-align:right;"> 0.000 </td> <td style="text-align:right;"> 0.00000 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 0.7110937 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 15.170 </td> </tr> <tr> <td style="text-align:left;"> Acceleration B2-3 Total Efforts (Gen 2) </td> <td style="text-align:right;"> 0.000 </td> <td style="text-align:right;"> 0.00000 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 0.0937500 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 2.000 </td> </tr> <tr> <td style="text-align:left;"> Deceleration B2-3 Distance (Gen 2) </td> <td style="text-align:right;"> 0.000 </td> <td style="text-align:right;"> 0.00000 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 0.6732813 </td> <td style="text-align:right;"> 0.9175 </td> <td style="text-align:right;"> 14.360 </td> </tr> <tr> <td style="text-align:left;"> Deceleration B2-3 Total Efforts (Gen 2) </td> <td style="text-align:right;"> 0.000 </td> <td style="text-align:right;"> 0.00000 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 0.5468750 </td> <td style="text-align:right;"> 1.0000 </td> <td style="text-align:right;"> 12.000 </td> </tr> <tr> <td style="text-align:left;"> Acceleration Density Index </td> <td style="text-align:right;"> 1.317 </td> <td style="text-align:right;"> 2.97450 </td> <td style="text-align:right;"> 3.3080 </td> <td style="text-align:right;"> 3.8116562 </td> <td style="text-align:right;"> 4.4540 </td> <td style="text-align:right;"> 9.949 </td> </tr> <tr> <td style="text-align:left;"> Max Acceleration </td> <td style="text-align:right;"> 0.000 </td> <td style="text-align:right;"> 1.63425 </td> <td style="text-align:right;"> 2.2525 </td> <td style="text-align:right;"> 1.9978750 </td> <td style="text-align:right;"> 2.5775 </td> <td style="text-align:right;"> 3.981 </td> </tr> </tbody> </table> --- - **Gráfico de Variação de Aceleração e Desaceleração** <img src="apresentação---analista-de-dados_files/figure-html/plot10-example-1.png" width="100%" /> --- # **Player Load Band de 1 a 5 Distance** <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> Variavel </th> <th style="text-align:right;"> Min. </th> <th style="text-align:right;"> 1st Qu. </th> <th style="text-align:right;"> Median </th> <th style="text-align:right;"> Mean </th> <th style="text-align:right;"> 3rd Qu. </th> <th style="text-align:right;"> Max. </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> Player Load Band 1 Distance % </td> <td style="text-align:right;"> 8.444 </td> <td style="text-align:right;"> 34.85300 </td> <td style="text-align:right;"> 46.3445 </td> <td style="text-align:right;"> 49.2674063 </td> <td style="text-align:right;"> 64.18075 </td> <td style="text-align:right;"> 99.275 </td> </tr> <tr> <td style="text-align:left;"> Player Load Band 2 Distance % </td> <td style="text-align:right;"> 0.000 </td> <td style="text-align:right;"> 27.79075 </td> <td style="text-align:right;"> 36.8445 </td> <td style="text-align:right;"> 35.9769062 </td> <td style="text-align:right;"> 48.48475 </td> <td style="text-align:right;"> 72.778 </td> </tr> <tr> <td style="text-align:left;"> Player Load Band 3 Distance % </td> <td style="text-align:right;"> 0.000 </td> <td style="text-align:right;"> 3.76650 </td> <td style="text-align:right;"> 7.8775 </td> <td style="text-align:right;"> 10.1543281 </td> <td style="text-align:right;"> 15.10250 </td> <td style="text-align:right;"> 55.369 </td> </tr> <tr> <td style="text-align:left;"> Player Load Band 4 Distance % </td> <td style="text-align:right;"> 0.000 </td> <td style="text-align:right;"> 0.00000 </td> <td style="text-align:right;"> 0.8710 </td> <td style="text-align:right;"> 3.1060781 </td> <td style="text-align:right;"> 3.26650 </td> <td style="text-align:right;"> 26.841 </td> </tr> <tr> <td style="text-align:left;"> Player Load Band 5 Distance % </td> <td style="text-align:right;"> 0.000 </td> <td style="text-align:right;"> 0.00000 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 0.9570156 </td> <td style="text-align:right;"> 0.00000 </td> <td style="text-align:right;"> 20.418 </td> </tr> </tbody> </table> --- - **Gráfico Player Load Band de 1 a 5 Distance** <img src="apresentação---analista-de-dados_files/figure-html/plot5-example-1.png" width="100%" /> --- # **Departamento de Scouting/Recrutamento:** - O analista de dados desempenha um papel fundamental na identificação de talentos promissores por meio da análise detalhada de estatísticas e desempenho em jogos. Eles fornecem relatórios abrangentes sobre jogadores potenciais, destacando suas habilidades e pontos fortes, o que facilita o processo de recrutamento e a tomada de decisões sobre transferências. Essa abordagem baseada em dados ajuda o clube a identificar e adquirir jogadores que se encaixam no estilo de jogo da equipe e nas necessidades específicas de cada posição. - ## **Central do Mercado:** - Um clube que tem uma folha salarial enxuta e quer se manter competitivo precisa saber o equilibro em ir ao mercado e não acumular dividas. Existem inumeros processos de escolha de uma atleta como **Carta Controle** que visa ter um padrão de caracteristicas de um jogador seja ele alto, forte, velho, novo, velocista, tecnico e etc. Neste controle estatistico de qualidade precisa conter processos importantes como Média e Variancia. Que representa 50% das preposições ou semelhanças deste atleta. Um exemplo desse fator seria ele não ter um comportamento tão disperso em campo ou com irregularidade tão evidente. Acertar em uma contratação pode depender exclusivamente da coleta de dados de um atleta, porém deve ter uma margem para erros, seja com um **Intervalo de Confiança** para que o metodo seja validado. --- # **Diagrama de Ishikawa:** - O **diagrama de Ishikawa**, também conhecido como diagrama de espinha de peixe ou diagrama de causa e efeito, é uma ferramenta de qualidade que ajuda a identificar e analisar as possíveis causas de um problema específico. No contexto da contratação de atletas de futebol, você pode usar o diagrama de Ishikawa para identificar as principais áreas que influenciam o sucesso ou fracasso na contratação de novos jogadores. Aqui está um exemplo de como você pode estruturar o diagrama: - Para criar o diagrama de Ishikawa, podemos começar identificando a causa principal (contratação de atletas de futebol) e, em seguida, listar as categorias de causas que podem influenciar o processo de contratação. Dentro de cada categoria, você pode identificar as causas específicas que contribuem para o sucesso ou fracasso na contratação de novos jogadores. Essas causas podem ser analisadas mais detalhadamente para identificar áreas de melhoria e implementar ações corretivas ou preventivas. --- ## **Causa Principal: Contratação de Atletas de Futebol** - Categorias de Causas: - **Pessoal:** - Recrutadores - Scouts - Gestão de Recursos Humanos - **Processo:** - Método de Recrutamento - Avaliação de Desempenho - Testes Físicos e Técnicos - Processo de Contratação - **Política:** - Orçamento para Contratação - Estratégia de Recrutamento - Política de Contratação da Equipe -**Recursos:** - Orçamento Disponível - Rede de Contatos - Tecnologia e Ferramentas de Avaliação --- - **Produto:** - Perfil do Jogador Desejado - Necessidades da Equipe - Atributos Físicos e Técnicos - **Ambiente:** - Competitividade do Mercado de Jogadores - Clima Organizacional - Cultura do Clube <img src="apresentação---analista-de-dados_files/figure-html/plot4-example-1.png" width="100%" /> --- ## **A análise de dados no futebol também contribui:** - Para a identificação de pontos fortes e fracos do adversário. Através da análise de estatísticas, é possível identificar quais são as jogadas mais utilizadas pelo time adversário, quais jogadores são mais perigosos em determinadas situações e quais são as áreas do campo onde a equipe adversária é mais vulnerável. Essas informações permitem que os treinadores elaborem estratégias mais eficientes para neutralizar o adversário e aumentar as chances de sucesso. <img src="apresentação---analista-de-dados_files/figure-html/plot7-example-1.png" width="100%" /> --- # **Modelagem para Jogador** - Equipe: Arsenal - Jogador: Declan Rice - Volante <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> Variavel </th> <th style="text-align:right;"> Min. </th> <th style="text-align:right;"> 1st Qu. </th> <th style="text-align:right;"> Median </th> <th style="text-align:right;"> Mean </th> <th style="text-align:right;"> 3rd Qu. </th> <th style="text-align:right;"> Max. </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> Pos. </td> <td style="text-align:right;"> 15 </td> <td style="text-align:right;"> 54 </td> <td style="text-align:right;"> 65 </td> <td style="text-align:right;"> 67.4482759 </td> <td style="text-align:right;"> 79 </td> <td style="text-align:right;"> 114 </td> </tr> <tr> <td style="text-align:left;"> Min. </td> <td style="text-align:right;"> 755 </td> <td style="text-align:right;"> 877 </td> <td style="text-align:right;"> 905 </td> <td style="text-align:right;"> 900.0689655 </td> <td style="text-align:right;"> 931 </td> <td style="text-align:right;"> 972 </td> </tr> <tr> <td style="text-align:left;"> xAG </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 7.4827586 </td> <td style="text-align:right;"> 10 </td> <td style="text-align:right;"> 16 </td> </tr> <tr> <td style="text-align:left;"> xA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0.7586207 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 3 </td> </tr> </tbody> </table> --- # **Aplicando um Modelo.** - Para modelar um jogador semelhante a Declan Rice, podemos seguir estas etapas: 1. **Avalie as habilidades de Declan Rice**: Estude as principais habilidades e características de Declan Rice como jogador de futebol. Isso pode incluir sua posição principal, atributos físicos, técnicos e mentais. 2. **Identifique a posição principal**: Declan Rice é conhecido principalmente como um volante defensivo, capaz de proteger a defesa, interceptar passes e iniciar jogadas de ataque. Portanto, você pode começar modelando um jogador nessa posição. 3. **Atributos físicos**: Rice é conhecido por sua boa estatura e força física, o que o torna capaz de disputar bolas aéreas e ganhar duelos físicos no meio-campo. Certifique-se de atribuir atributos físicos semelhantes ao jogador que você está modelando. 4. **Habilidades técnicas**: Rice é um jogador habilidoso com a bola nos pés, capaz de fazer passes precisos e desarmes oportunos. Seu controle de bola e capacidade de distribuição são aspectos importantes a serem considerados ao modelar um jogador semelhante. 5. **Inteligência tática**: Rice é elogiado por sua inteligência tática e capacidade de ler o jogo. Ele sabe quando pressionar o adversário, quando recuar para proteger a defesa e quando se envolver na construção de jogadas. Portanto, atribuir uma boa inteligência tática ao jogador que você está modelando é crucial. --- <img src="apresentação---analista-de-dados_files/figure-html/unnamed-chunk-8-1.png" width="100%" /> - **Personalidade e mentalidade**: Além das habilidades técnicas e físicas, a mentalidade de um jogador é crucial. Rice é conhecido por sua determinação e ética de trabalho. Ele demonstra liderança em campo e é conhecido por sua maturidade, apesar de sua idade relativamente jovem. Considere esses aspectos ao modelar o jogador e exposição a diferentes situações de jogo. - **Treinamento e desenvolvimento**: Uma vez que você tenha um jogador modelado com base nas características de Declan Rice, você pode focar em seu treinamento e desenvolvimento dentro do contexto do jogo em que ele vai ser usado. Isso pode incluir o desenvolvimento de atributos específicos, treinamento tático. --- - Ao seguir essas etapas e considerar as características-chave de Declan Rice, você pode modelar um jogador semelhante em um jogo de futebol ou simulador de gerenciamento esportivo. # Dados de Declan Rice fornecidos no Fbrcharts --- ### **Modelo Estatístico:** - Vamos construir um modelo simples de regressão linear para prever o número de desarmes com base no número de jogos e na precisão dos passes: ``` ## ## Call: ## lm(formula = desarmes ~ jogos + precisao_passes, data = dados) ## ## Residuals: ## Min 1Q Median 3Q Max ## -20.319 -3.480 -1.111 3.192 16.427 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 79.8775 77.4476 1.031 0.337 ## jogos -0.4178 0.6907 -0.605 0.564 ## precisao_passes -0.1808 0.9298 -0.194 0.851 ## ## Residual standard error: 11.49 on 7 degrees of freedom ## Multiple R-squared: 0.05994, Adjusted R-squared: -0.2086 ## F-statistic: 0.2232 on 2 and 7 DF, p-value: 0.8055 ``` --- <img src="apresentação---analista-de-dados_files/figure-html/plot9-example-1.png" width="100%" /> - Este modelo tenta prever o número de desarmes com base no número de jogos jogados na temporada e na precisão dos passes do jogador. Você pode interpretar os coeficientes para entender como cada variável está relacionada ao número de desarmes. --- ### **Departamento Médico/Fisiologia:** - O analista de dados colabora com profissionais médicos e especialistas em fisiologia para monitorar o condicionamento físico dos jogadores e prevenir lesões. Eles analisam dados de desempenho e fisiológicos para identificar padrões que indiquem risco de lesão e recomendam medidas preventivas. Essa abordagem proativa baseada em dados ajuda a minimizar o tempo de inatividade dos jogadores devido a lesões, garantindo que a equipe esteja sempre em sua melhor forma física para competir. #### **Protocolo FIFA 11+** - O Protocolo FIFA 11+ é um programa de exercícios projetado para prevenir lesões no futebol. Ele inclui uma série de exercícios de aquecimento, fortalecimento e estabilidade que são realizados antes dos treinos e jogos para reduzir o risco de lesões musculoesqueléticas. - O Protocolo FIFA 11+ consiste em três partes principais: Parte de aquecimento: Inclui atividades de corrida leve, exercícios de mobilidade articular e alongamentos dinâmicos para preparar os músculos e articulações para a atividade física. Parte de fortalecimento: Envolve uma série de exercícios para fortalecer os músculos das pernas, quadris, core e tronco, visando melhorar a estabilidade e prevenir lesões. Parte de exercícios de propriocepção e equilíbrio: Inclui atividades que desafiam a propriocepção e o equilíbrio, como exercícios em uma perna só, para melhorar a consciência corporal e reduzir o risco de lesões. Esses componentes são adaptáveis e podem ser ajustados de acordo com as necessidades específicas de cada equipe ou jogador --- #### **Modelos estatísticos** - Existem vários **modelos estatísticos** que podem ser usados para prever lesões no esporte. Alguns dos modelos mais comuns incluem - 1 - **Modelos de Regressão Logística:** Este tipo de modelo é frequentemente usado para prever a probabilidade de ocorrência de um evento binário, como uma lesão. Os preditores incluídos no modelo podem ser variáveis como idade, histórico de lesões anteriores, carga de treinamento, entre outros. - 2 - **Árvores de Decisão e Florestas Aleatórias:** Esses modelos são utilizados para dividir os dados em diferentes grupos com base em variáveis específicas e criar regras de decisão para prever se um jogador está em risco de lesão. - 3 - **Redes Neurais Artificiais:** As redes neurais podem ser usadas para aprender padrões complexos nos dados de lesões, levando em consideração uma ampla gama de variáveis. - 4 - **Análise de Sobrevivência:** Este tipo de modelo é comumente usado para analisar o tempo até a ocorrência de um evento, como uma lesão. Pode levar em conta o tempo até a lesão, bem como variáveis que influenciam a probabilidade de lesão ao longo do tempo. Cada modelo tem suas vantagens e desvantagens, e a escolha do modelo depende da natureza dos dados disponíveis e do objetivo da análise. Além disso, é importante considerar fatores contextuais e clínicos ao desenvolver e interpretar modelos para prever lesões esportivas. --- - ## **Análise de Sobrevivência:** - A **análise de sobrevivência** é uma técnica estatística usada para analisar o tempo até a ocorrência de um evento, como a falha de um equipamento, a recuperação de uma doença ou, no caso do esporte, a ocorrência de uma lesão. É particularmente útil quando os dados incluem observações censuradas, ou seja, quando não se sabe o tempo exato de ocorrência do evento para todas as observações. Na **análise de sobrevivência**, o tempo até o evento é chamado de tempo de sobrevivência e pode ser medido em unidades como dias, semanas, meses ou anos. O objetivo é modelar a função de sobrevivência, que descreve a probabilidade de uma unidade sobreviver além de um determinado tempo, e/ou a função de risco instantâneo, que descreve a taxa instantânea de falha em um determinado ponto no tempo.Existem várias técnicas para realizar uma análise de sobrevivência, incluindo o **modelo de Kaplan-Meier** para estimar a função de sobrevivência não paramétrica, regressão de Cox para análise de sobrevivência com covariáveis, e modelos paramétricos como o modelo de Weibull ou o modelo de log-logístico.Na análise de lesões esportivas, a análise de sobrevivência pode ser usada para prever o tempo até a ocorrência de uma lesão com base em fatores como idade, histórico de lesões anteriores, carga de treinamento, entre outros. Isso permite identificar fatores de risco e desenvolver estratégias para prevenção de lesões. --- #### Neste exemplo Foi usado o pacote "survival" para realizar a análise de sobrevivência. ``` ## Call: ## coxph(formula = Surv(time, status) ~ age + sex + ph.ecog, data = lung) ## ## n= 227, number of events= 164 ## (1 observation deleted due to missingness) ## ## coef exp(coef) se(coef) z Pr(>|z|) ## age 0.011067 1.011128 0.009267 1.194 0.232416 ## sex -0.552612 0.575445 0.167739 -3.294 0.000986 *** ## ph.ecog 0.463728 1.589991 0.113577 4.083 4.45e-05 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## exp(coef) exp(-coef) lower .95 upper .95 ## age 1.0111 0.9890 0.9929 1.0297 ## sex 0.5754 1.7378 0.4142 0.7994 ## ph.ecog 1.5900 0.6289 1.2727 1.9864 ## ## Concordance= 0.637 (se = 0.025 ) ## Likelihood ratio test= 30.5 on 3 df, p=1e-06 ## Wald test = 29.93 on 3 df, p=1e-06 ## Score (logrank) test = 30.5 on 3 df, p=1e-06 ``` --- ### **Conclusão** Se você não tem um departamento de Análise de Dados em um Clube você está atrasado 10 anos nesse mercado. A ciência em dados pode gerar inúmeros benficios seja financeiro, tempo e resultado. A melhora constante e o trabalho diario de um estatistico pode alavanca o que demoraria anos em meses. A importancia de colher os frutos de um trabalho de modelagem estatistica é impresendivel no dia a dia para tornar competitivo. Além disso, pode-se dizer que uma colocação em campeonato tenha objetivo e retorno com base no planejamento e análise correta. Basta saber estimar corretamente tais informações!