INTRODUÇÃO
Neste trabalho temos o objetivo de traçar o perfil dos funcionários da secretária de turismo de sergipe. Na seção 2 descrevemos o universo de estudo e a forma como foram obtidos os dados. Na seção 3 apresentamos uma análise descritiva dos dados coletados e, por fim, na seção 4 e durante o decorrer do relátoiro tecemos e mostramos nossas conclusões sobre o problema abordado.
2-Materiais e métodos O universo de estudo é composto pelos funcionãrios da secretária de turismo da cidade, oferecida pela prefeitura. Foi aplicado uma pequena pesquisa durante um tempo e a aplicação possibilitou a obtenção de informações referentes às seguintes variáveis: 1-sexo 2-carga horaria 3-experiencia(tempo de trabalho) 4-remuneração Essas variáveis foram apresentadas através de tabelas e gráficos e avaliadas comrelação à medidas descritivas, tais como média, mediana,desvio padrão, coeficiente devariação, etc… com o objetivo de traçar o perfil dos funcionários.
3-Análise descritiva dos dados O conjunto de dados analisados consiste de informações de 40 funcionários obtidas da aplicação das pesquisas.nessa parte da análise veremos as Distribuições de frequência e gráficos das distribuições de frequencia das quatro variáveis selecionadas: Sexo: variável qualitativa nominal. Carga_horaria: variável qualitativa ordinal. Anos_completos: variável quantitativa discreta. Remuneracao: variável quantitativa contínua.
FREQUÊNCIA ABSOLUTA EM RELAÇÃO AO SEXO
table(dados$ Sexo) # FREQUÊNCIA ABSOLUTA EM RELAÇÃO AO SEXO DOS FUNCIONÁRIOS
##
## F M
## 27 13
FREQUÊNCIA RELATIVA EM RELAÇÃO AO SEXO
table (dados$Sexo)/sum(table(dados$Sexo)) ## FREQUÊNCIA RELATIVA EM RELAÇÃO AO SEXO DOS FUNCIONÁRIOS
##
## F M
## 0.675 0.325
GRAFICO
pie(table(dados$Sexo),col=c("pink","blue")) #grafico de setores
COM A AJUDA DO GRÁFICO E TODAS AS DEMONSTRAÇÕES, PERCEBEMOS A EXPRESSIVA PARTICIPAÇÃO FEMININA NO QUADRO DE FUNCIONÁRIOS ATIVOS aproximadamnete(68%).
FREQUÊNCIA ABSOLUTA EM RELAÇÃO A CARGA HORÁRIA
table(dados$Carga_horaria)#tabela de carga horaria
##
## 30 HORAS SEMANAIS 40 HORAS SEMANAIS
## 15 25
FREQUÊNCIA RELATIVA
table (dados$Carga_horaria)/sum(table(dados$Carga_horaria)) ## FREQUÊNCIA RELATIVA EM RELAÇÃO A CARGA HORÁRIA DOS FUNCIONÁRIOS
##
## 30 HORAS SEMANAIS 40 HORAS SEMANAIS
## 0.375 0.625
GRAFICO
pie(table(dados$Carga_horaria)) #grafico
QUANDO ANALISAMOS A CARGA HORÁRIA DOS FUNCIONÁRIOS, PERCEBEMOS EXPRESSIVAPARTICIPAÇÃO DO REGIME DE TRABALHO DE 40 HORAS.(62.5%).
FREQUÊNCIA RELATIVA EM RELAÇÃO AO TEMPO DE TRABALHO
table (dados$Anos_completos)/sum(table(dados$Anos_completos)) #frequência relativa em relação ao tempo de trabalho
##
## 0 1 2 3 4
## 0.325 0.375 0.175 0.075 0.050
GRAFICO E FREQUENCIA ABSOLUTA
table(dados$Anos_completos) # tempo experiencia dos funcionarios
##
## 0 1 2 3 4
## 13 15 7 3 2
barplot(table(dados$Anos_completos),xlab="Anos completos",ylab="Frequencia") # grafico de barras
QUANDO ANALISAMOS O TEMPO DE TRABALHO DO FUNCIONÁRIO NA EMPRESA, PERCEBE-SE A PREDOMINÃNCIA DE COLABORADORES COM ATÉ 1 ANO DE SERVIÇOS PRESTADOS NO CARGO(71%).E OBTEMOS A INFORMAÇÃO QUE O TRABALHADOR COM MAIOR TEMPO DE CARGO É 4 ANOS.
FREQUÊNCIAS EM RELAÇÃO A REMUNERAÇÃO
limites=c(0,1000,2000,3000,4000,5000,6000) # limites das classes
distfreq=cbind(table(cut(dados$Remuneracao,limites,right=T))) # frequencias absolutas
print(distfreq) # limites das classes em notacao cientifica
## [,1]
## (0,1e+03] 6
## (1e+03,2e+03] 12
## (2e+03,3e+03] 4
## (3e+03,4e+03] 8
## (4e+03,5e+03] 3
## (5e+03,6e+03] 7
hist(dados$Remuneracao,xlab="Remuneração R$",ylab="Frequencia",main="") # histograma
MEDIA,MEDIANA,REMUNERAÇÃO MAXIMA E MININA
mean(dados$Remuneracao)#MEDIA
## [1] 2802.751
median(dados$Remuneracao)#MEDIANA
## [1] 2913.375
max(dados$Remuneracao)#REMUNERAÇÃO MAX
## [1] 5999.98
min(dados$Remuneracao)#REMUNERAÇÃO MIN
## [1] 415
Remuneração média igual a R$ 2802,75.
quantile(dados$Remuneracao,0.25)
## 25%
## 1489.18
quantile(dados$Remuneracao,0.75)
## 75%
## 3809.245
Metade dos servidores recebe remuneração entre R$ 1489,18 e R$3809,25
var(dados$Remuneracao)#VARIANCIA REMUNERAÇÃO
## [1] 2889757
library(e1071)
skewness(dados$Remuneracao) # analise do coeficiente de assimetria em relação a remuneração
## [1] 0.1994568
kurtosis(dados$Remuneracao) # analise coeficiente de curtose em relação a remuneração
## [1] -1.224255
Análise Exploratória de Dados - Boxplot EM RELAÇÃO A REMUNERAÇÃO
boxplot(dados$Remuneracao,ylab="R$")
Análise bivariada - Tabela de contingencia EM RELAÇÃO A CARGA HORÁRIA
table(dados$Sexo,dados$Carga_horaria)
##
## 30 HORAS SEMANAIS 40 HORAS SEMANAIS
## F 13 14
## M 2 11
Análise bivariada - Boxplots EM RELAÇÃO A REMUNERAÇÃO-SEXO E REMUNERAÇÃO - CARGA HORÁRIA
boxplot(dados$Remuneracao~dados$Sexo)
boxplot(dados$Remuneracao~dados$Carga_horaria)
#PRINCIPAIS CONCLUSÕES EM RELAÇÃO AOS PERFIS DOS SERVIDORES DA SECRETÁRIA DE TURISMO.
Expressiva participação feminina no quadro de funcionários ativos APROXIMADAMENTE(68%).
Expressiva participação do regime de trabalho de 40 horas (62,5%).
Predominância de funcionários com até 1 ano de experiência no cargo (70%). e que o maior tempo no cargo é de 4 anos.
Remuneração média igual a R$ 2802,75 e máxima igual a R$ 6000,00. e Metade dos servidores recebe remuneração entre R$ 1489,18 e R$ 3809,25.
“Baixa” dispersão das remunerações e tempos no cargo,e Fraca associação entre a remuneração e o tempo no cargo (correlação 0,29)
Boxplots indicam que não há discrepâncias entre as remunerações de homens e mulheres.
Boxplots indicam que as remunerações no regime de 40 horas semanais são significativamente superiores.
#PROBLEMAS INTERVALO DE CONFIANÇA
Os horarios semanais de uma semana de trabalho de 40 funcionários aleatórios foram registradas: 40, 35, 40, 35, 30, 25, 25, 25, 30, 40, 35, 35 , 35, 40, 20, 25, 25, 30, 40, 30, 20, 40, 35, 40, 25, 30, 40, 20, 15, 40, 10, 45 e 35. A população dessas pontuações é acredita-se que seja normalmente distribuído com desvio padrão de 6,8. Determine e interprete o intervalo de confiança de 95% e 99% da média da população.A partir dos dados, obtemos as seguintes informações:o tamanho da amostra é superior a 30 e o desvio padrão da população é conhecido. Portanto, o teste apropriado é o teste z. E a função a ser usada é z.test, isto é:
scores <- c(40, 35, 40, 35, 30, 25, 25, 25, 30, 40, 35, 35 , 35, 40, 20, 25, 25, 30, 40, 30, 20, 40, 35, 40, 25, 30, 40, 20, 15, 40, 10, 45,35)
BSDA::z.test(scores, sigma.x = 6.8)
##
## One-sample z-Test
##
## data: scores
## z = 26.496, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 29.04357 33.68370
## sample estimates:
## mean of x
## 31.36364
BSDA::z.test(scores, sigma.x = 6.8, conf.level = 0.99)
##
## One-sample z-Test
##
## data: scores
## z = 26.496, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 99 percent confidence interval:
## 28.31455 34.41272
## sample estimates:
## mean of x
## 31.36364
INTERPRETAÇÃO
Estamos 95% confiantes de que a média real de todas as pontuações na avaliação está entre 29.04357 e 33.68370. E estamos 99% confiantes de que a média real de todas as pontuações está entre 29.52668 e 35.62484.Além do intervalo de confiança, a função retorna também as estatísticas z computadas com valor p e também a estimativa pontual da média.
funcionários da contabilidade da secretária afirmam que a média dos salários dos contadores é menor que a de seu concorrente, que é $ 45000. Uma amostra aleatória de 30 contadores da firma mostrou que a média dos salários é de $43500. Sabe–se, de estudos anteriores, que o desvio padrão dos salários é $5200. Teste a afirmação dos funcionários ao nível de 5% de significância.
xbar<-45000
Mi<-43500
sigma<-5200
n<-30
zobs<-(xbar-Mi)/(sigma/sqrt(n))
zobs
## [1] 1.579969
A partir da tabela da Normal padrão, buscamos o valor crítico correspondente ao nivel de confiança de 95% (dado 5% de significância )
Logo, aceitamos H0, ou seja, ao nível de significância de 5%, não há evidências de que o salário seja inferior a $45000.