Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas
DISCIPLINA DE PROBABILIDADE E ESTATÍSTICA
Bem-vindo
Este dashboard apresenta visualizações estatísticas desenvolvidas para a disciplina de Probabilidade e Estatística. Aqui são exibidos gráficos e análises relacionadas ao dataset "Employee Satisfaction Survey Data", selecionado na plataforma Kaggle. O objetivo é explorar e compreender os dados de satisfação de funcionários de uma determinada empresa, utilizando técnicas estatísticas para identificar padrões, tendências e insights.
Selecione uma categoria no menu lateral para visualizar os gráficos.
Distribuição dos níveis de satisfação
Explicação
A variável nível de satisfação foi operacionalizada como uma variável qualitativa ordinal, uma vez que representa percepções subjetivas organizadas em uma ordem lógica de intensidade. Para possibilitar a análise estatística e a visualização gráfica dos dados, os valores observados foram agrupados em cinco categorias interpretativas: muito insatisfeito, insatisfeito, neutro, satisfeito e muito satisfeito.
A definição dessas categorias seguiu o princípio de estratificação ordinal por intervalos equivalentes, amplamente utilizado em estudos de percepção e satisfação, especialmente em escalas do tipo Likert. Nesse procedimento, o intervalo total da variável é dividido em partes de amplitude semelhante, permitindo classificar os níveis de satisfação de forma progressiva e comparável.
Esse tipo de categorização apresenta três vantagens metodológicas principais:
- Preservação da ordem semântica dos níveis de satisfação, garantindo que as categorias reflitam diferentes graus de avaliação do fenômeno estudado.
- Padronização da interpretação dos dados, permitindo a comparação entre diferentes observações dentro da mesma escala.
- Facilidade de comunicação e interpretação dos resultados, especialmente em análises descritivas e representações gráficas.
Dessa forma, os recortes adotados não são arbitrários, mas seguem uma lógica de gradação ordinal baseada em intervalos equivalentes, o que permite transformar valores numéricos ou escalas originais em categorias analíticas interpretáveis.
Distribuição dos níveis salariais
Explicação
O segundo gráfico apresenta a distribuição das opiniões sobre os salários percebidos pelos funcionários. A variável salary foi tratada como uma variável qualitativa ordinal, pois representa categorias que possuem uma ordem natural de intensidade em relação ao nível de remuneração.
No conjunto de dados analisado, os salários são classificados em três níveis: low, medium e high. Essas categorias foram interpretadas como baixo, médio e alto, representando diferentes faixas de remuneração dentro da organização. A ordenação dessas categorias permite observar como os funcionários se distribuem em relação ao nível salarial percebido.
A utilização dessa classificação apresenta algumas vantagens para a análise dos dados:
- Permite identificar a distribuição dos funcionários entre diferentes níveis de remuneração.
- Facilita a comparação entre as categorias salariais existentes no conjunto de dados
- Torna a visualização gráfica mais clara, possibilitando compreender rapidamente qual faixa salarial concentra maior número de funcionários.
Assim, o gráfico de barras possibilita uma representação simples e intuitiva das categorias salariais presentes no conjunto de dados, evidenciando como os funcionários se distribuem entre os diferentes níveis de remuneração.
Distribuição de funcionários por departamento
Explicação
O terceiro gráfico apresenta a distribuição dos funcionários por departamento dentro da organização. A variável dept foi tratada como uma variável qualitativa nominal, pois representa categorias distintas que não possuem uma ordem natural entre si.
No conjunto de dados analisado, os departamentos incluem áreas como Vendas, Contabilidade, Recursos Humanos, Técnico, Suporte, Gestão, Tecnologia da Informação (TI), Produto, Marketing e Pesquisa e Desenvolvimento (P&D). Essas categorias representam diferentes setores organizacionais, cada um com funções específicas dentro da empresa.
A utilização dessa variável permite compreender como os funcionários estão distribuídos entre os diversos departamentos, sem estabelecer qualquer hierarquia entre eles.
A análise dessa distribuição apresenta algumas vantagens importantes:
- Permite identificar quais departamentos concentram maior número de funcionários.
- Auxilia na compreensão da estrutura organizacional da empresa.
- Facilita a identificação de áreas operacionais mais robustas em comparação com setores mais estratégicos.
Assim, o gráfico de barras possibilita uma visualização clara e objetiva da distribuição dos funcionários por departamento, evidenciando como a força de trabalho está organizada entre os diferentes setores da empresa.
Distribuição do número de projetos por colaborador
Explicação
variável número de projetos trabalhados por colaborador foi operacionalizada como uma variável quantitativa discreta, uma vez que representa uma contagem direta de participações em projetos ao longo do tempo. Seus valores são expressos exclusivamente por números inteiros não negativos (0, 1, 2, 3...), não sendo possível a ocorrência de valores fracionários, o que caracteriza sua natureza discreta.
Para fins de análise estatística e visualização gráfica, os dados foram organizados por meio de uma distribuição de frequências, representada em um gráfico de barras. Nesse tipo de representação, cada valor inteiro da variável corresponde a uma categoria no eixo horizontal, enquanto a altura das barras indica o número de colaboradores associados a cada quantidade de projetos.
A adoção dessa abordagem segue o princípio de representação direta de dados discretos, amplamente utilizado em estatística descritiva para variáveis baseadas em contagem. Diferentemente das variáveis contínuas, não há necessidade de agrupamento em intervalos, pois cada valor já possui significado interpretativo próprio e independente.
Esse tipo de representação apresenta três vantagens metodológicas principais:
Preservação da precisão dos dados, mantendo a correspondência exata entre cada valor observado e sua frequência, sem perda de informação decorrente de agrupamentos artificiais.
Identificação clara de padrões de distribuição, permitindo observar a concentração de colaboradores em determinados níveis de participação (por exemplo, poucos projetos versus muitos projetos), o que pode indicar diferentes perfis de carga de trabalho e engajamento.
Facilidade de interpretação e comunicação dos resultados, uma vez que o gráfico de barras possibilita comparações diretas entre categorias, sendo especialmente eficaz em análises exploratórias e apresentações descritivas.
Dessa forma, a estrutura adotada respeita a natureza discreta da variável e possibilita uma análise clara, fiel e interpretável da distribuição do número de projetos entre os colaboradores, contribuindo para a compreensão dos padrões organizacionais de alocação e participação em atividades.
Distribuição das horas mensais trabalhadas
Explicação
A variável average_montly_hours foi representada por meio de um histograma, técnica amplamente utilizada para variáveis quantitativas contínuas. Nesse tipo de gráfico, os valores são agrupados em intervalos de amplitude semelhante, e a altura de cada barra indica a frequência de observações dentro de cada faixa.
O histograma permite visualizar a forma da distribuição — se é simétrica, assimétrica, unimodal ou bimodal —, identificar onde os dados estão concentrados e detectar possíveis outliers, ou seja, valores extremos que se distanciam significativamente dos demais.
No caso das horas mensais trabalhadas, o gráfico revela como a jornada está distribuída entre os colaboradores, possibilitando identificar se há concentração em torno de uma faixa típica ou grande variabilidade na carga horária dentro da organização.