Proposta - Relatório Final

Importação da base de dados:

Escolhemos e importamos a base de dados sobre “Saúde dos Alunos e Desempenho Acadêmico” do site “Kaggle”.

library(readr)
UC <- read_csv("C:/Users/ACER/Desktop/Luisa Calcagni/Faculdade adm/Impacto do Uso do Celular.csv")

## Rows: 100 Columns: 20
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (20): Names, Age, Gender, Mobile Phone, Mobile Operating System, Mobile ...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

head(UC)

## # A tibble: 6 × 20
##   Names    Age   Gender `Mobile Phone` `Mobile Operating System`
##   <chr>    <chr> <chr>  <chr>          <chr>                    
## 1 Ali      21-25 Male   Yes            Android                  
## 2 Bilal    21-25 Male   Yes            Android                  
## 3 Hammad   21-25 Male   Yes            IOS                      
## 4 Abdullah 21-25 Male   Yes            Android                  
## 5 Waqar    21-25 Male   Yes            IOS                      
## 6 Aammar   21-25 Male   Yes            Android                  
## # ℹ 15 more variables: `Mobile phone use for education` <chr>,
## #   `Mobile phone activities` <chr>, `Helpful for studying` <chr>,
## #   `Educational Apps` <chr>, `Daily usages` <chr>, `Performance impact` <chr>,
## #   `Usage distraction` <chr>, `Attention span` <chr>, `Useful features` <chr>,
## #   `Health Risks` <chr>, `Beneficial subject` <chr>, `Usage symptoms` <chr>,
## #   `Symptom frequency` <chr>, `Health precautions` <chr>,
## #   `Health rating` <chr>

# traduzindo a categoria
UC$Gender = gsub('Male','Masculino',UC$Gender)
UC$Gender = gsub('Female','Feminino',UC$Gender)
UC$`Mobile Phone` = gsub('Yes','Sim',UC$`Mobile Phone`)
UC$`Mobile phone use for education` = gsub('Sometimes','Às vezes',UC$`Mobile phone use for education`)
UC$`Mobile phone use for education` = gsub('Frequently','Frequentemente',UC$`Mobile phone use for education`)
UC$`Mobile phone use for education` = gsub('Rarely','Raramente',UC$`Mobile phone use for education`)
UC$`Mobile phone activities` = gsub('Social Media','Mídias Sociais',UC$`Mobile phone activities`)
UC$`Mobile phone activities` = gsub('All of these','Todos estes',UC$`Mobile phone activities`)
UC$`Mobile phone activities` = gsub('Web-browsing','Pesquisa online',UC$`Mobile phone activities`)
UC$`Mobile phone activities` = gsub('Messaging','E-mail',UC$`Mobile phone activities`)
UC$`Helpful for studying` = gsub('Yes','Sim',UC$`Helpful for studying`)
UC$`Helpful for studying` = gsub('No','Não',UC$`Helpful for studying`)
UC$`Educational Apps` = gsub('Educational Videos','Vídeos Educacionais',UC$`Educational Apps`)
UC$`Educational Apps` = gsub('Study Planner','Planejador de Estudos',UC$`Educational Apps`)
UC$`Educational Apps` = gsub('Productivity Tools','Ferramentas de produtividade',UC$`Educational Apps`)
UC$`Educational Apps` = gsub('Language','Linguagem',UC$`Educational Apps`)
UC$`Daily usages` = gsub('hours','horas',UC$`Daily usages`)
UC$`Performance impact` = gsub('Agree','Concordo',UC$`Performance impact`)
UC$`Performance impact` = gsub('Strongly agree','Concordo totalmente',UC$`Performance impact`)
UC$`Performance impact` = gsub('Strongly disagree','Discordo totalmente',UC$`Performance impact`)
UC$`Performance impact` = gsub('Neutral','Neutro',UC$`Performance impact`)
UC$`Usage distraction` = gsub('During Exams','Durante os exames',UC$`Usage distraction`)
UC$`Usage distraction` = gsub('Not Distracting','Não distrai',UC$`Usage distraction`)
UC$`Usage distraction` = gsub('During Class Lectures','Durante as aulas',UC$`Usage distraction`)
UC$`Usage distraction` = gsub('While Studying','Enquanto estuda',UC$`Usage distraction`)
UC$`Attention span` = gsub('Yes','Sim',UC$`Attention span`)
UC$`Attention span` = gsub('No','Não',UC$`Attention span`)
UC$`Useful features` = gsub('Camera','Câmera',UC$`Useful features`)
UC$`Useful features` = gsub('Notes Taking App','Bloco de Notas',UC$`Useful features`)
UC$`Useful features` = gsub('Internet Access','Acesso à Internet',UC$`Useful features`)
UC$`Useful features` = gsub('Calculator','Calculadora',UC$`Useful features`)
UC$`Health Risks` = gsub('Yes','Sim',UC$`Health Risks`)
UC$`Health Risks` = gsub('No','Não',UC$`Health Risks`)
UC$`Health Risks` = gsub('Only Partially','Apenas parcialmente',UC$`Health Risks`)
UC$`Beneficial subject` = gsub('Accounting','Contabilidade',UC$`Beneficial subject`)
UC$`Beneficial subject` = gsub('Browsing Material','Navegação em material',UC$`Beneficial subject`)
UC$`Beneficial subject` = gsub('Reasarch','Pesquisa',UC$`Beneficial subject`)
UC$`Usage symptoms` = gsub('Headache','Dor de cabeça',UC$`Usage symptoms`)
UC$`Usage symptoms` = gsub('Anxiety or Stress','Ansiedade ou estresse',UC$`Usage symptoms`)
UC$`Usage symptoms` = gsub('Sleep disturbance','Distúrbios do sono',UC$`Usage symptoms`)
UC$`Usage symptoms` = gsub('All of these','Todos esses',UC$`Usage symptoms`)
UC$`Symptom frequency` = gsub('Sometimes','Às vezes',UC$`Symptom frequency`)
UC$`Symptom frequency` = gsub('Frequently','Frequentemente',UC$`Symptom frequency`)
UC$`Symptom frequency` = gsub('Never','Nunca',UC$`Symptom frequency`)
UC$`Symptom frequency` = gsub('Rarely','Raramente',UC$`Symptom frequency`)
UC$`Health precautions` = gsub('Using Blue light filter','Usar filtro de luz azul',UC$`Health precautions`)
UC$`Health precautions` = gsub('Taking Break during prolonged use','Pausa durante o uso prolongado',UC$`Health precautions`)
UC$`Health precautions` = gsub('None of Above','Nenhum',UC$`Health precautions`)
UC$`Health precautions` = gsub('Limiting Screen Time','Limitar o tempo de tela',UC$`Health precautions`)
UC$`Health rating` = gsub('Excellent','Excelente',UC$`Health rating`)
UC$`Health rating` = gsub('Good','Bom',UC$`Health rating`)
UC$`Health rating` = gsub('Fair','Regular',UC$`Health rating`)
UC$`Health rating` = gsub('Poor','Ruim',UC$`Health rating`)

# retirar NA
library(tidyr)
UC = UC %>% drop_na (`Mobile phone use for education`)
UC = UC %>% drop_na (`Mobile phone activities`)
UC = UC %>% drop_na (`Helpful for studying`)
UC = UC %>% drop_na (`Educational Apps`)
UC = UC %>% drop_na (`Daily usages`)
UC = UC %>% drop_na (`Performance impact`)
UC = UC %>% drop_na (`Usage distraction`)
UC = UC %>% drop_na (`Attention span`)
UC = UC %>% drop_na (`Useful features`)
UC = UC %>% drop_na (`Health Risks`)
UC = UC %>% drop_na (`Beneficial subject`)
UC = UC %>% drop_na (`Usage symptoms`)

# traduzindo o nome da variavel
library(dplyr)

## 
## Anexando pacote: 'dplyr'
## 
## Os seguintes objetos são mascarados por 'package:stats':
## 
##     filter, lag
## 
## Os seguintes objetos são mascarados por 'package:base':
## 
##     intersect, setdiff, setequal, union

UC = UC %>% rename(Genero=Gender)
UC = UC %>% rename(Celular=`Mobile Phone`)
UC = UC %>% rename(Nomes=Names)
UC = UC %>% rename(Idade=Age)
UC = UC %>% rename('Sistema Operacional'=`Mobile Operating System`)
UC = UC %>% rename('Atividades de celular'=`Mobile phone activities`)
UC = UC %>% rename('Uso do telefone celular para fins educacionais'=`Mobile phone use for education`)
UC = UC %>% rename('Útil para estudar'=`Helpful for studying`)
UC = UC %>% rename('Aplicativos educacionais'=`Educational Apps`)
UC = UC %>% rename('Usos diários'=`Daily usages`)
UC = UC %>% rename('Impacto no desempenho'=`Performance impact`)
UC = UC %>% rename('Distração de uso'=`Usage distraction`)
UC = UC %>% rename('Período de atenção'=`Attention span`)
UC = UC %>% rename('Recursos úteis'=`Useful features`)
UC = UC %>% rename('Riscos para a saúde'=`Health Risks`)
UC = UC %>% rename('Disciplina benéfica'=`Beneficial subject`)
UC = UC %>% rename('Sintomas de uso'=`Usage symptoms`)

UC = UC %>% rename(`Frequência dos sintomas`=`Symptom frequency`)
UC = UC %>% rename(`Precauções de saúde`=`Health precautions`)
UC = UC %>% rename(`Classificação de saúde`=`Health rating`)

Breve declaração dos objetivos e hipóteses:

O objetivo da nossa pesquisa é estudar o impacto do uso do celular na sáude e no desempenho acadêmico dos alunos. Nós formulamos 5 hipóteses para o estudo dessa pesquisa. Segue as hipóteses abaixo:

Hipótese 1: Qual sistema operacional é mais viciante (horas de uso)?

Hipótese 2: O impacto no desempenho tem relação com a distração de uso?

Hipótese 3: O uso diário do celular está associado a distração de uso?

Hipótese 4: A frequência dos sintomas está relacionada ao nível de saúde?

Hipótese 5: Uso frequente de apps educacionais está ligado à percepção positiva do celular como ferramenta de estudo?

Fonte dos dados:

A base de dados sobre “Saúde dos Alunos e Desempenho Acadêmico” foi importada do site “Kaggle”, no dia 09/08 e atualizada no mês 06/2024. A base explora a relação entre a saúde dos alunos e seu desempenho acadêmico. Nela, contém várias linhas de dados, cada uma representando um aluno, e várias colunas, com diversas variáveis.

https://www.kaggle.com/datasets/innocentmfa/students-health-and-academic-performance?resource=download

Descrição detalhada do conjunto de dados (dicionário de dados - codebook).

A base de dados possui 20 colunas, contendo as demais informações:

library(readxl)
library(flextable)
D <- read_excel("C:/Users/ACER/Desktop/Luisa Calcagni/Faculdade adm/Descrição conjunto de dados - Relatório final.xlsx")
D %>% flextable() %>% theme_vader() %>% width(width = 3.5)

Item por coluna	Descrição
4.1 Nomes	Nomes dos alunos
4.2 Idade	Idade dos alunos (em anos)
4.3 Gênero	Masculino / Feminino
4.4 Celular (o aluno tem celular?)	Sim / Não
4.5 Sistema operacional móvel	Android / IOS
4.6 Uso do celular para fins educacionais	Às vezes / Frequentemente / Raramente
4.7 Atividades de celular	Mídias sociais / Todos esses / Pesquisa on-line / Aplicativos educacionais / E-mail / Plataformas de aprendizagem on-line
4.8 Útil para estudar	Sim / Não
4.9 Aplicativos educacionais	Vídeos Educacionais / Planejador de Estudos
4.10 Usos diários (para fins educacionais)	Tempo médio diário em horas.
4.11 Impacto no desempenho	Concordo / Neutro / Concordo totalmente
4.12 Distração de uso	Durante os exames / Não distrai / Durante as aulas / Enquanto estuda
4.13 Período de atenção	Sim / Não
4.14 Recursos úteis	Acesso à Internet / Câmera / Calculadora / Bloco de notas
4.15 Riscos para a saúde	Sim / Não / Apenas parcialmente
4.16 Disciplina benéfica	Contabilidade / Navegação em material / Pesquisa
4.17 Sintomas de uso	Distúrbios do sono / Dores de cabeça / Ansiedade ou estresse / Todos esses
4.18 Frequência dos sintomas	Às vezes / Nunca / Raramente / Frequentemente
4.19 Precauções de saúde	Pausa durante o uso prolongado / Usar filtro de luz azul / Limitar o tempo de tela / Nenhum
4.20 Classificação de saúde	Excelente / Bom / Regular / Ruim

Número de observações (número de linhas do banco de dados).

A base de dados possui 100 observações (linhas), ou seja, 100 alunos responderam a pesquisa que compõe a base de dados, porém, após retirar o NA, a base de dados ficou com 91 linhas. Em resumo, a base de dados é composta por 100 anos, mas, 9 alunos não responderam todas as perguntas do formulário.

Proposta - Relatório Final

Clara Cabral, Kamila Kotsimbós, Luísa Calcagni e Nicole Neubauer.

2024-08-09