Introdução🚀

Oportunidades de Emprego em T.I.

No contexto atual, a tecnologia da informação (T.I.) é um setor crucial que impulsiona a inovação e a competitividade em diversas indústrias. Com o avanço tecnológico e a digitalização global, a demanda por profissionais de T.I. tem crescido significativamente em todo o mundo. No entanto, entender como essas oportunidades de emprego estão distribuídas geograficamente, quais habilidades são mais requisitadas, e como o mercado está estruturado em termos de modalidades de trabalho e níveis de senioridade, são questões essenciais tanto para profissionais da área quanto para empregadores que buscam atrair os melhores talentos. Este projeto tem como objetivo filtrar e analisar as ofertas de emprego de T.I. a partir de um dataset abrangente de 1,3 milhões de vagas do LinkedIn, proporcionando uma visão detalhada do mercado de T.I. nos Estados Unidos, Austrália, Canadá e Reino Unido.

Abordagem Metodológica

Para abordar a declaração do problema, utilizaremos o dataset Kaggle - 1.3M LinkedIn Jobs & Skills (2024). O primeiro passo será consolidar os dados dispersos em três arquivos distintos, que incluem informações sobre habilidades, resumos de empregos e publicações de vagas, em um único dataset. Em seguida, filtraremos as vagas especificamente relacionadas à área de T.I. e procederemos com a análise das mesmas para entender as demandas do mercado.

Abordagem Proposta

A técnica adotada para abordar este problema inclui a união dos três datasets usando a chave job_link, que permite associar cada vaga às suas respectivas habilidades e resumos. Após a consolidação, utilizaremos uma lista de títulos de trabalho comumente associados à T.I. para filtrar as vagas relevantes. Este filtro é essencial para isolar as oportunidades que de fato pertencem ao setor de T.I., mesmo que o termo “T.I.” não esteja explicitamente mencionado na descrição do cargo.

Benefícios da Análise

A análise resultante deste projeto fornecerá aos potenciais clientes, como profissionais de T.I. e empresas de recrutamento, uma visão clara das tendências de emprego no setor de T.I. em diferentes regiões. Será possível identificar quais habilidades são mais demandadas, as modalidades de trabalho (presencial, híbrido, remoto) mais comuns, e os níveis de senioridade mais frequentes nas ofertas de emprego. Essas informações são valiosas para tomada de decisões estratégicas, tanto para profissionais em busca de carreira quanto para empresas ajustarem suas estratégias de recrutamento.

Pacotes Utilizados📦

Os seguintes pacotes são necessários:

Pacote	Função Principal
`ggplot2`	Criação de gráficos e visualizações
`stringr`	Manipulação de strings e textos
`dplyr`	Manipulação e transformação de dados
`knitr`	Renderização de gráficos e tabelas no relatório
`rmdformats`	Estilização do documento com tema ‘material’

Tratamento de Dados🔧

Fonte dos Dados

Os dados utilizados neste projeto são provenientes de um abrangente dataset do LinkedIn, que reúne informações detalhadas sobre 1,3 milhões de vagas de emprego. Este conjunto de dados inclui variáveis essenciais, como habilidades exigidas, cargos ofertados, localizações (cidade e país), nível de senioridade dos empregos e o modelo de trabalho (presencial, remoto ou híbrido).

Link para o dataset: Kaggle - 1.3M LinkedIn Jobs & Skills (2024)

O objetivo original desse dataset era oferecer uma visão abrangente das oportunidades de emprego disponíveis globalmente, facilitando uma análise detalhada das tendências no mercado de trabalho.

Coletado em 2024, o dataset abrange várias variáveis-chave, como o título do trabalho (search_position), cidade (search_city), país (search_country), nível de senioridade (job_level) e tipo de emprego (job_type). Uma característica notável dos dados de origem é a presença de caracteres especiais, que requerem um tratamento cuidadoso para garantir a integridade e a precisão das análises subsequentes.

Explicação do Tratamento de Dados

O dataset original era composto por três arquivos separados: jobSkills.csv, linkedin_job_postings.csv, e job_summary.csv. A primeira etapa foi unir esses três arquivos em um único dataset usando a coluna job_link como chave estrangeira. Isso nos permitiu consolidar todas as informações relevantes em um único dataframe, facilitando o processamento subsequente.

# Carregar os datasets
jobSkills <- read.csv("C:/Users/Niciu/Downloads/Datasets/job_skills.csv")
linkedin <- read.csv("C:/Users/Niciu/Downloads/Datasets/linkedin_job_postings.csv")
summary <- read.csv("C:/Users/Niciu/Downloads/Datasets/job_summary.csv")

# Mesclar jobSkills e linkedin com base na coluna "job_link"
merged_data <- merge(jobSkills, linkedin, by = "job_link")

# Mesclar o resultado anterior com summary com base na coluna "job_link"
final_data <- merge(merged_data, summary, by = "job_link")

# Salvar o dataset final em um arquivo CSV
write.csv(final_data, "C:/Users/Niciu/Downloads/Datasets/dataset.csv", row.names = FALSE)

Filtragem das Vagas de T.I.

Após a consolidação, foi realizada uma filtragem específica para isolar as vagas de emprego relacionadas ao setor de T.I. Essa filtragem foi baseada em uma lista pré-definida de títulos de trabalho que comumente pertencem à área de T.I. O dataset resultante foi então salvo como it_jobs.csv para análise posterior.

# Carregar o dataset consolidado
dataset <- read.csv("C:/Users/Niciu/Downloads/Datasets/dataset.csv")

# Verificar todas as posições de trabalho (search_position) que existem no dataset
unique_positions <- unique(dataset$search_position)

# Visualizar os valores únicos
print(unique_positions)

# Definir os títulos de trabalho relacionados à I.T.
it_positions <- c("Computer Operator", "Developer", "Programmer-Analyst", "Electronics-Test Engineer",
                  "Data Communications Analyst", "Computer Programmer", "Computer Systems Hardware Analyst",
                  "Technical Support Specialist", "Computer Security Specialist", "Electronics Technician",
                  "Software Engineer", "Systems Analyst", "Information Scientist", "Computer Security Coordinator",
                  "Data Base Administrator", "Electrical Engineer", "Electrical-Design Engineer",
                  "Electrical-Research Engineer", "Electronics Assembler", "Test Technician",
                  "Technical Operator", "Electrical Technician", "Technical Coordinator", 
                  "Field Service Engineer", "Communications Coordinator", "Manufacturing Engineer",
                  "Communications Consultant", "Software Engineer", "Field Engineer Specialist",
                  "Systems Engineer", "Network Engineer")

# Filtrar o dataset para incluir apenas os empregos relacionados à I.T.
it_jobs <- dataset[dataset$search_position %in% it_positions, ]

# Salvar o dataset filtrado em um arquivo CSV chamado it_jobs.csv
write.csv(it_jobs, "C:/Users/Niciu/Downloads/Datasets/it_jobs.csv", row.names = FALSE)

Limpeza de Dados🧹

Para garantir a precisão e a consistência da análise, é crucial realizar uma limpeza minuciosa dos dados. Aqui estão as etapas que foram seguidas:

# Carregar o dataset filtrado
it_jobs <- read.csv("C:/Users/Niciu/Downloads/Datasets/it_jobs.csv", fileEncoding = "UTF-8")

# Substituir caracteres não ASCII por um caractere vazio
it_jobs$search_position <- gsub("[^[:print:]]", "", it_jobs$search_position)
it_jobs$search_city <- gsub("[^[:print:]]", "", it_jobs$search_city)
it_jobs$search_country <- gsub("[^[:print:]]", "", it_jobs$search_country)
it_jobs$job_level <- gsub("[^[:print:]]", "", it_jobs$job_level)
it_jobs$job_type <- gsub("[^[:print:]]", "", it_jobs$job_type)
it_jobs$job_title <- gsub("[^[:print:]]", "", it_jobs$job_title)
it_jobs$job_summary <- gsub("[^[:print:]]", "", it_jobs$job_summary)

Remoção de Caracteres Não ASCII, Muitos dos valores no dataset continham caracteres especiais que não eram suportados ou que poderiam causar problemas na análise posterior. Para lidar com isso, utilizamos a função gsub() para remover esses caracteres não ASCII. Essa etapa foi essencial para padronizar os dados e evitar erros de codificação durante as análises subsequentes.

Conjunto de Dados Final

library(stringr)

# Separar as habilidades da coluna job_skills e criar uma lista
all_skills <- unlist(str_split(it_jobs$job_skills, ",\\s*"))  # Separa por vírgulas e remove espaços desnecessários

# Converter todas as habilidades para letras minúsculas e remover espaços
all_skills <- tolower(trimws(all_skills))

# Agrupar habilidades semelhantes/sinônimos
all_skills <- gsub("problem ?solving", "problem solving", all_skills)
all_skills <- gsub("communication skills|communication expert|communication", "communication", all_skills)
all_skills <- gsub("sql server|sql databases", "sql", all_skills)
all_skills <- gsub("aws|amazon aws|amazon web services", "aws", all_skills)
all_skills <- gsub("microsoft azure", "azure", all_skills)
all_skills <- gsub("c\\+\\+", "c++", all_skills)
all_skills <- gsub("python programming", "python", all_skills)
all_skills <- gsub("leadership skills|team leadership", "leadership", all_skills)
all_skills <- gsub("project management|project managing", "project management", all_skills)
all_skills <- gsub("cloud computing|cloud services", "cloud", all_skills)

# Aplicar a função unique para obter apenas as habilidades distintas
unique_skills <- unique(all_skills)

# Selecionar as 10 primeiras habilidades únicas
top_10_skills <- head(unique_skills, 10)

# Combinar as 10 primeiras habilidades em uma única linha, separadas por vírgula
skill_list <- paste(top_10_skills, collapse = ", ")

a seguir segue alguns dos valores únicos das colunas mais relevantes, que fornecem uma visão condensada das categorias de dados disponíveis:

Variável	Valores Únicos
search_country	United States, Australia, Canada, United Kingdom
search_position	Electronics-Test Engineer, Computer Operator, Developer, Programmer-Analyst, Data Communications Analyst, Computer Programmer, Communications Consultant, Computer Systems Hardware Analyst, Technical Support Specialist, Computer Security Specialist, Computer Security Coordinator, Systems Analyst, Electrical Technician, Electrical Engineer, Data Base Administrator, Technical Operator, Electrical-Research Engineer, Field Engineer Specialist, Manufacturing Engineer, Software Engineer, Technical Coordinator, Electrical-Design Engineer, Electronics Assembler, Test Technician, Field Service Engineer, Electronics Technician, Information Scientist, Communications Coordinator
job_level	Associate, Mid senior
job_type	Onsite
job_skills	software testing, manual testing, automated testing, python, typescript, documentation, user manuals, api documentation, release notes, quality assurance

Esses valores únicos mostram as diferentes categorias e níveis que estão disponíveis no dataset, ajudando a entender a variedade e a abrangência dos dados.

Informações Resumidas das Variáveis de Interesse

Abaixo, segue um resumo das principais variáveis no dataset:

Variável	Descrição
search_position	Esta variável representa o cargo do trabalho.
search_city	Indica a cidade onde a vaga está localizada. As cidades mais frequentes no dataset incluem grandes centros urbanos focados em tecnologia.
search_country	O país onde a vaga está disponível. A maioria das vagas está concentrada nos Estados Unidos, seguido por países como Reino Unido e Canadá.
job_level	Reflete o nível de senioridade do trabalho (e.g., Mid-senior, Associate). Essencial para entender a demanda por diferentes níveis de experiência.
job_type	Indica o tipo de emprego, como “OnSite”, “Remote”, “Hybrid”, etc. Esta variável ajuda a compreender as preferências contratuais no mercado de trabalho de T.I.
job_skills	Contém uma lista de habilidades requisitadas para o trabalho. Inclui competências técnicas como linguagens de programação e soft skills, como comunicação e liderança.

Essas variáveis oferecem uma visão clara sobre o panorama das vagas de emprego em T.I., permitindo uma análise detalhada das tendências do mercado de trabalho global.

Análise do Dataset🌎

Visão da Distribuição de Vagas por País

library(ggplot2)

# Calcular a distribuição por país
country_distribution <- as.data.frame(table(it_jobs$search_country))

# Calcular as porcentagens
country_distribution$Percentage <- round(country_distribution$Freq / sum(country_distribution$Freq) * 100, 1)

# Criar um rótulo que combina o nome do país, a porcentagem e o número de vagas
country_distribution$Label <- paste0(country_distribution$Var1, " (", country_distribution$Freq, " vagas, ", country_distribution$Percentage, "%)")

# Criar o gráfico de pizza com porcentagens e quantidades nos rótulos da legenda
ggplot(country_distribution, aes(x = "", y = Freq, fill = Label)) +
  geom_bar(width = 1, stat = "identity") +
  coord_polar("y") +
  labs(title = "Distribuição das Vagas por País (search_country)",
       fill = "País") +
  theme_void() + # Remove o plano de fundo e os eixos para um gráfico de pizza puro
  theme(legend.title = element_blank()) # Remove o título da legenda para clareza

Com base no gráfico de pizza gerado, que ilustra a distribuição das vagas de emprego no setor de T.I. em diferentes países, podemos observar alguns insights significativos.

O gráfico revela que a grande maioria das vagas de emprego está concentrada nos Estados Unidos, representando 82.8% do total. Essa predominância é consistente com a posição dos Estados Unidos como líder global em tecnologia, abrigando inúmeras empresas de tecnologia de ponta, desde startups até gigantes do setor. Esse volume expressivo de vagas sugere que o mercado norte-americano continua sendo uma referência central para profissionais de T.I. em busca de oportunidades.

Em segundo lugar, mas com uma proporção significativamente menor, está o Reino Unido, que responde por 9.8% das vagas. O Reino Unido é outro polo importante de inovação tecnológica. Essa participação, embora menor em comparação com os Estados Unidos, ainda destaca a relevância do mercado britânico no cenário global de T.I.

O Canadá vem logo atrás com 5.1% das vagas. O Canadá tem se consolidado como um destino atrativo para empresas de tecnologia, tanto por seu ambiente regulatório favorável quanto por sua força de trabalho altamente qualificada. A presença significativa de vagas no Canadá indica um mercado em crescimento.

Por último, a Austrália representa uma pequena parcela das vagas de emprego no setor de T.I., com 2.3% do total. Embora essa participação seja modesta em comparação com outros países como os Estados Unidos e o Reino Unido, ela sugere que há uma presença de oportunidades de trabalho em T.I. no país.

Análise da Distribuição das Vagas por Posição

# Instalar e carregar o pacote ggplot2 se ainda não estiver instalado
library(ggplot2)

# Calcular a distribuição por posição
position_distribution <- as.data.frame(table(it_jobs$search_position))

# Ordenar os dados pela frequência para melhor visualização
position_distribution <- position_distribution[order(-position_distribution$Freq), ]

# Criar o gráfico de barras
ggplot(position_distribution, aes(x = reorder(Var1, -Freq), y = Freq, fill = Var1)) +
  geom_bar(stat = "identity") +
  labs(title = "Distribuição das Vagas por Posição (search_position)",
       x = "Posição",
       y = "Frequência") +
  theme_minimal() + # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 45, hjust = 1), # Rotaciona os labels do eixo X para melhor legibilidade
        legend.position = "none") # Remove a legenda para focar nos labels das barras

Com base no gráfico de barras que mostra a distribuição das vagas por posição no dataset de empregos de T.I., podemos extrair algumas observações importantes.

Predominância de Cargos de Operação e Programação de Computadores:
- As posições de “Computer Operator” e “Programmer” destacam-se significativamente em termos de frequência. O cargo de “Computer Operator” é o mais comum, com mais de 4.000 vagas, seguido de perto por “Programmer” com um número um pouco menor.
- Isso sugere que há uma alta demanda por profissionais que possuem habilidades operacionais e de programação. Tais posições são cruciais para o funcionamento e desenvolvimento de sistemas de software, indicando que as empresas estão fortemente focadas em garantir que suas operações e desenvolvimentos de software sejam bem mantidos e aprimorados.
Diversidade de Posições Técnicas:
- Além das posições principais, outras posições técnicas como “Data Communications Analyst”, “Computer Systems Hardware Analyst”, e “Technical Support Specialist” também aparecem com frequências elevadas, o que indica uma necessidade por uma variedade de habilidades técnicas especializadas.
- Essas funções são fundamentais para a gestão da infraestrutura de TI e para o suporte ao usuário final, o que é essencial em qualquer organização que depende fortemente da tecnologia.
Presença Notável de Engenheiros de Hardware e Software:
- Posições como “Electronics Engineer”, “Software Engineer”, e “Electrical-Design Engineer” também têm uma presença significativa. Isso reflete a demanda contínua por engenheiros que possam projetar, desenvolver, e manter sistemas de hardware e software.
- A presença de engenheiros eletrônicos e de design elétrico destaca o papel da engenharia de hardware, especialmente em setores onde o desenvolvimento de dispositivos eletrônicos e sistemas embutidos é crítico.
Distribuição Relativamente Menor para Funções de Coordenação e Suporte:
- Posições como “Technical Coordinator”, “Field Service Engineer”, e “Communications Coordinator” aparecem com frequências menores, o que pode indicar que essas funções, embora importantes, são menos numerosas ou talvez estejam centralizadas em menos vagas que exigem habilidades mais generalistas ou de suporte técnico em campo.
- Isso pode sugerir que tais funções são mais especializadas e, portanto, menos comuns em comparação com as posições que requerem habilidades técnicas e operacionais mais amplas.

Conclusão

O gráfico de barras ilustra uma clara predominância de posições operacionais e de programação no setor de T.I., com uma forte presença de vagas para operadores de computador e programadores. A diversidade de posições técnicas reflete a ampla gama de habilidades necessárias para sustentar a infraestrutura tecnológica em organizações de todos os tamanhos.

Para profissionais de T.I., esse gráfico oferece uma visão sobre quais posições estão mais em demanda, o que pode ajudar na decisão sobre quais habilidades desenvolver ou em quais áreas focar. Para as empresas, entender essa distribuição pode ser útil na estratégia de recrutamento, permitindo-lhes alinhar suas ofertas de emprego com as tendências do mercado e as necessidades organizacionais.

Análise dos Principais Cargos com Vagas Disponíveis

# Instalar e carregar o pacote ggplot2 se ainda não estiver instalado
if(!require(ggplot2)) install.packages("ggplot2")
library(ggplot2)

# Calcular a distribuição de vagas por título de trabalho (job_title)
job_title_distribution <- as.data.frame(table(it_jobs$job_title))

# Renomear as colunas para facilitar o uso
colnames(job_title_distribution) <- c("Job_Title", "Freq")

# Ordenar os títulos de trabalho pela quantidade de vagas em ordem decrescente
job_title_distribution <- job_title_distribution[order(-job_title_distribution$Freq), ]

# Filtrar os 20 principais títulos de trabalho
top_20_job_titles <- head(job_title_distribution, 20)

# Criar o gráfico de barras
ggplot(top_20_job_titles, aes(x = reorder(Job_Title, -Freq), y = Freq, fill = Job_Title)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) + # Adiciona os números acima das barras
  labs(title = "Top 20 Cargos com Mais Vagas",
       x = "Cargo",
       y = "Número de Vagas") +
  theme_minimal() + # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 7), # Rotaciona os rótulos para facilitar a leitura
        legend.position = "none") # Remove a legenda

Com base no gráfico de barras gerado, que apresenta os 20 principais cargos com mais vagas no setor de T.I., podemos identificar algumas tendências e observações importantes.

O título de Senior Software Engineer lidera com 402 vagas, o que reflete a alta demanda por profissionais experientes em desenvolvimento de software. A posição de engenheiro de software sênior é amplamente procurada em diversas empresas de tecnologia, tanto para a manutenção quanto para a criação de soluções complexas.

Logo em seguida, encontramos o cargo de Senior Data Engineer, com 203 vagas, seguido de Windows Engineer com 202 vagas. Isso sugere uma alta procura por profissionais com habilidades em gerenciamento de dados e infraestrutura, particularmente na área de sistemas Windows, que ainda é amplamente utilizada no ambiente corporativo.

Senior Systems Engineer também aparece com 193 vagas, reforçando a tendência de demanda por profissionais sêniores que tenham experiência na concepção, implementação e gerenciamento de sistemas complexos. Outros cargos de engenharia, como Software Engineer, Electrical Engineer, e Senior Backend Engineer, também estão em destaque, com vagas variando entre 163 e 123.

Além dos cargos relacionados a engenharia de software e sistemas, há uma demanda considerável por analistas, como o Intelligence Analyst, que conta com 35 vagas. Esse papel reflete a crescente importância de análise de dados e inteligência de negócios nas organizações modernas.

Os cargos relacionados a engenharia elétrica e embarcada, como Senior Electrical Engineer e Senior Embedded Software Engineer, também estão presentes, com 104 e 96 vagas, respectivamente, demonstrando a relevância dessas áreas no mercado de trabalho atual.

Por fim, há também uma presença notável de cargos voltados para suporte técnico, como Service Technician com 90 vagas, e posições administrativas, como Part-Time Assistant Manager - Level 2 com 85 vagas, indicando que, além das funções altamente técnicas, ainda há espaço para profissionais de suporte e gerenciamento.

Conclusão

O mercado de T.I. está claramente voltado para a busca de profissionais seniores e especializados em engenharia de software, sistemas e dados. A demanda por esses cargos reflete o cenário atual, onde a capacidade de lidar com grandes volumes de dados e a criação de soluções tecnológicas robustas são cruciais para o sucesso das organizações.

Visão Sobre as Empresas Contratantes

# Instalar e carregar o pacote ggplot2 se ainda não estiver instalado
if(!require(ggplot2)) install.packages("ggplot2")
library(ggplot2)

# Calcular a distribuição de vagas por empresa
company_distribution <- as.data.frame(table(it_jobs$company))

# Renomear as colunas para facilitar o uso
colnames(company_distribution) <- c("Company", "Freq")

# Ordenar as empresas pela quantidade de vagas em ordem decrescente
company_distribution <- company_distribution[order(-company_distribution$Freq), ]

# Filtrar as 100 principais empresas
top_100_companies <- head(company_distribution, 20)

# Criar o gráfico de barras com os números nas barras
ggplot(top_100_companies, aes(x = reorder(Company, -Freq), y = Freq, fill = Company)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) + # Adiciona os números acima das barras
  labs(title = "Top 20 Empresas com Mais Vagas de Emprego",
       x = "Empresa",
       y = "Número de Vagas") +
  theme_minimal() + # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 90, hjust = 1, size = 7), # Rotaciona e ajusta o tamanho dos rótulos para facilitar a leitura
        legend.position = "none") # Remove a legenda, pois as empresas estão identificadas no eixo X

O dataset apresenta 9276 empresas distintas que possuem vagas em aberto na área de T.I. De acordo com o gráfico que exibe as 20 empresas com o maior número de vagas, Jobs for Humanity lidera com 1385 vagas, seguida por Recruiting from Scratch com 881 vagas e ClearanceJobs com 764 vagas.

Essas três empresas somam uma quantidade significativa das vagas disponíveis, indicando que uma pequena parcela das empresas concentra uma alta demanda por profissionais de T.I. Além disso, empresas como Epic com 732 vagas, Energy Jobline com 300 vagas, e ClickJobs.io com 298 vagas também apresentam uma quantidade relevante de vagas.

As demais empresas no gráfico, como HDR com 189 vagas, Northrop Grumman com 180 vagas, e CyberCoders com 176 vagas, possuem um volume moderado de vagas. Esse cenário indica que, apesar da diversidade de empresas contratantes, uma minoria delas concentra a maior parte das vagas disponíveis.

Análise das Habilidades mais Requisitadas no Mercado de T.I.

library(stringr)

# Separar as habilidades da coluna job_skills e criar uma lista
all_skills <- unlist(str_split(it_jobs$job_skills, ",\\s*"))  # Separa por vírgulas e remove espaços desnecessários

# Converter todas as habilidades para letras minúsculas e remover espaços
all_skills <- tolower(trimws(all_skills))

# Agrupar habilidades semelhantes/sinônimos
all_skills <- gsub("problem ?solving", "problem solving", all_skills)  # Agrupa 'problem solving' com e sem espaço
all_skills <- gsub("communication skills|communication expert|communication", "communication", all_skills)
all_skills <- gsub("sql server|sql databases", "sql", all_skills)
all_skills <- gsub("aws|amazon aws|amazon web services", "aws", all_skills)
all_skills <- gsub("microsoft azure", "azure", all_skills)
all_skills <- gsub("c\\+\\+", "c++", all_skills)
all_skills <- gsub("python programming", "python", all_skills)
all_skills <- gsub("leadership skills|team leadership", "leadership", all_skills)
all_skills <- gsub("project management|project managing", "project management", all_skills)
all_skills <- gsub("cloud computing|cloud services", "cloud", all_skills)

# Criar uma tabela de frequências para as habilidades
skills_distribution <- as.data.frame(table(all_skills))

# Renomear as colunas para facilitar o uso
colnames(skills_distribution) <- c("Skill", "Freq")

# Ordenar as habilidades pela frequência em ordem decrescente
skills_distribution <- skills_distribution[order(-skills_distribution$Freq), ]

# Filtrar as 20 principais habilidades
top_20_skills <- head(skills_distribution, 20)

# Criar o gráfico de barras
library(ggplot2)
ggplot(top_20_skills, aes(x = reorder(Skill, -Freq), y = Freq, fill = Skill)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) +  # Adiciona os números acima das barras
  labs(title = "Top 20 Habilidades mais Requisitadas (Agrupadas)",
       x = "Habilidade",
       y = "Número de Ocorrências") +
  theme_minimal() +  # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 7),  # Rotaciona os rótulos para facilitar a leitura
        legend.position = "none")  # Remove a legenda

Com base no gráfico gerado, que exibe as 20 habilidades mais requisitadas no mercado de trabalho de T.I. após o agrupamento de sinônimos e abreviações, podemos observar algumas tendências importantes sobre as competências mais procuradas.

A habilidade Communication lidera o gráfico, com 9559 ocorrências. Isso destaca a importância das soft skills, como a comunicação, que continua sendo um fator chave, mesmo em um setor altamente técnico como o de T.I. A capacidade de colaborar de forma eficaz com equipes e de interagir com stakeholders é essencial para o sucesso em qualquer projeto de tecnologia.

Logo após, temos SQL, com 6591 ocorrências, e Python, com 6204 ocorrências. Isso reforça a demanda por linguagens de programação e gestão de bancos de dados. SQL continua sendo a linguagem padrão para manipulação de dados em grande escala, e Python é amplamente utilizado para desenvolvimento de software, automação e ciência de dados.

Habilidades como Problem Solving, com 5847 ocorrências, e Java, com 4424 ocorrências, também aparecem em destaque, mostrando a necessidade de desenvolvedores que possuam não apenas proficiência técnica, mas também habilidades para resolver problemas complexos.

Outra habilidade relevante é Project Management, com 4264 ocorrências. Isso sugere que, além das habilidades técnicas, há uma demanda por profissionais que saibam gerenciar projetos, garantindo que os processos sejam organizados e entregues no prazo. Além disso, vemos um interesse significativo em tecnologias de cloud computing, como AWS com 3331 ocorrências e Azure com 2501 ocorrências, o que indica a crescente adoção de soluções baseadas em nuvem no mercado.

Também notamos a importância do trabalho em equipe (teamwork), com 3327 ocorrências, e Leadership, com 2932 ocorrências. Isso demonstra que, além das habilidades técnicas, empregadores também valorizam a capacidade de liderar equipes e trabalhar colaborativamente.

No que diz respeito a metodologias de desenvolvimento, Agile com 2475 ocorrências e Software Development com 2570 ocorrências também indicam que as empresas estão em busca de profissionais que possam aplicar metodologias ágeis e trabalhar em projetos de desenvolvimento de software.

Por fim, habilidades relacionadas à ciência da computação (Computer Science) com 2508 ocorrências e à orquestração de containers (Kubernetes) com 2252 ocorrências, continuam a ser fundamentais para a infraestrutura de TI moderna.

Conclusão O gráfico revela que há um equilíbrio entre habilidades técnicas e habilidades interpessoais no mercado de T.I. Habilidades como Communication, SQL, Python e Project Management são altamente requisitadas, enquanto o domínio de tecnologias em nuvem como AWS e Azure se mantém essencial. A demanda por Agile, Leadership, e Problem Solving evidencia que as empresas estão em busca de profissionais versáteis, capazes de atuar tanto na parte técnica quanto na gestão e organização de projetos.

Análise do EUA🦅

Análise de Vagas por Cidade (Estados Unidos)

# Carregar pacotes necessários
library(ggplot2)

# Filtrar o dataset para incluir apenas vagas dos Estados Unidos
us_jobs <- subset(it_jobs, search_country == "United States")

# Calcular a distribuição por cidade
city_distribution <- as.data.frame(table(us_jobs$search_city))

# Ordenar a distribuição em ordem decrescente
city_distribution <- city_distribution[order(-city_distribution$Freq), ]

# Selecionar as 10 cidades com maior número de vagas
top_10_cities <- head(city_distribution, 10)

# Criar o gráfico de barras com os números das vagas nas barras
ggplot(top_10_cities, aes(x = reorder(Var1, -Freq), y = Freq, fill = Var1)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) +  # Adiciona os números acima das barras
  labs(title = "Top 10 Cidades com Mais Vagas (Estados Unidos)",
       x = "Cidade",
       y = "Número de Vagas") +
  theme_minimal() + 
  theme(axis.text.x = element_text(angle = 45, hjust = 1),  # Rotaciona os labels do eixo X para facilitar leitura
        legend.position = "none")  # Remove a legenda

Com base nos dados fornecidos pelo gráfico, observa-se que a cidade de Austin lidera em número de vagas de emprego na área de TI, com 350 vagas. Santa Clara segue em segundo lugar, com 326 vagas, e Atlanta está em terceiro lugar com 285 vagas.

As cidades de Baytown e Chicago apresentam 261 e 257 vagas, respectivamente. Norristown possui 256 vagas, seguida de Garland e North Carolina, ambas com 252 vagas.

Por fim, as cidades de Indiana e Aurora fecham o top 10, com 251 e 247 vagas, respectivamente.

A análise mostra que Austin se destaca como o principal polo de vagas de TI, enquanto as demais cidades apresentam uma distribuição mais equilibrada, especialmente entre a quarta e a décima posição.

Análise da Distribuição das Vagas por Posição (Estados Unidos)

# Carregar o pacote ggplot2
library(ggplot2)

# Filtrar os dados para vagas nos Estados Unidos
us_jobs <- subset(it_jobs, search_country == "United States")

# Calcular a distribuição por posição
position_distribution <- as.data.frame(table(us_jobs$search_position))

# Ordenar os dados pela frequência para melhor visualização
position_distribution <- position_distribution[order(-position_distribution$Freq), ]

# Criar o gráfico de barras com os números das vagas nas barras
ggplot(position_distribution, aes(x = reorder(Var1, -Freq), y = Freq, fill = Var1)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) +  # Adiciona os números acima das barras
  labs(title = "Distribuição das Vagas por Posição nos Estados Unidos",
       x = "Posição",
       y = "Frequência") +
  theme_minimal() +  # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 45, hjust = 1),  # Rotaciona os labels do eixo X para melhor legibilidade
        legend.position = "none")  # Remove a legenda para focar nos labels das barras

Com base no gráfico de barras que mostra a distribuição das vagas por posição nos Estados Unidos, percebe-se uma clara predominância de vagas para o cargo de Computer Operator, com 3.670 vagas, destacando-se como a posição mais demandada. Em seguida, o cargo de Programmer apresenta 2.689 vagas, e Developer segue com 2.404 oportunidades de emprego.

Além disso, cargos relacionados à análise de sistemas, como Data Communications Analyst e Computer Systems Hardware Analyst, também se destacam, com 2.132 e 1.848 vagas, respectivamente. Outras funções de suporte técnico, como Technical Support Specialist, somam 1.486 vagas, refletindo a demanda por profissionais que atuem diretamente no suporte de TI.

Os cargos de engenharia, como Electronics Engineer e Software Engineer, apresentam uma demanda significativa, com 1.394 e 1.160 vagas, respectivamente. Já funções mais especializadas, como Electrical Design Engineer e Field Service Engineer, apresentam um número menor de vagas, mas ainda assim ocupam um papel importante no mercado de trabalho de TI nos Estados Unidos.

A análise também revela que as posições de coordenação e suporte, como Technical Coordinator e Communications Coordinator, têm um número relativamente menor de vagas, indicando que a maioria das oportunidades está focada em cargos técnicos e operacionais.

De modo geral, o gráfico ilustra uma forte demanda por profissionais de operações de computador e programação, reforçando a importância dessas áreas no mercado de TI nos Estados Unidos.

Análise dos Principais Cargos com Vagas Disponíveis (Estados Unidos)

# Carregar o pacote ggplot2
library(ggplot2)

# Calcular a distribuição de vagas por título de trabalho nos Estados Unidos
job_title_distribution <- as.data.frame(table(us_jobs$job_title))

# Renomear as colunas para facilitar o uso
colnames(job_title_distribution) <- c("Job_Title", "Freq")

# Ordenar os títulos de trabalho pela quantidade de vagas em ordem decrescente
job_title_distribution <- job_title_distribution[order(-job_title_distribution$Freq), ]

# Filtrar os 20 principais títulos de trabalho
top_20_job_titles <- head(job_title_distribution, 20)

# Criar o gráfico de barras
ggplot(top_20_job_titles, aes(x = reorder(Job_Title, -Freq), y = Freq, fill = Job_Title)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) + # Adiciona os números acima das barras
  labs(title = "Top 20 Cargos com Mais Vagas (Estados Unidos)",
       x = "Cargo",
       y = "Número de Vagas") +
  theme_minimal() + # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 7), # Rotaciona os rótulos para facilitar a leitura
        legend.position = "none") # Remove a legenda

Com base no gráfico de barras que mostra os 20 cargos com mais vagas nos Estados Unidos, percebe-se que o cargo de Senior Software Engineer lidera com 311 vagas, destacando-se como o mais demandado no setor de TI. Em segundo lugar, Windows Engineer aparece com 202 vagas, seguido por Senior Systems Engineer, que apresenta 157 oportunidades.

Outras posições relacionadas à engenharia, como Senior Data Engineer e Electrical Engineer, também se destacam, com 152 e 136 vagas, respectivamente. O cargo de Software Engineer aparece com 127 vagas, demonstrando a constante necessidade de profissionais especializados em desenvolvimento de software.

Cargos de análise de dados e inteligência, como Intelligence Analyst e Senior Backend Engineer, possuem 134 e 117 vagas, respectivamente, refletindo a demanda crescente por profissionais que possam lidar com grandes volumes de dados e gerar insights valiosos para as empresas.

Posições técnicas, como Service Technician e Senior Electrical Engineer, apresentam entre 90 e 85 vagas, reforçando a importância do suporte técnico e da engenharia elétrica no mercado de trabalho de TI.

Por fim, cargos como Lead Data Engineer, Data Engineer, e Senior PHP Developer completam a lista com vagas variando entre 73 e 68, indicando a demanda por profissionais experientes em gerenciamento de dados e desenvolvimento web.

A análise mostra uma concentração de oportunidades para engenheiros sêniores, especialmente nas áreas de software e sistemas, além de uma alta demanda por profissionais capazes de gerenciar infraestrutura tecnológica e manipular grandes volumes de dados.

Visão Sobre as Empresas Contratantes (Estados Unidos)

# Calcular a distribuição de vagas por empresa nos Estados Unidos
company_distribution <- as.data.frame(table(us_jobs$company))

# Renomear as colunas para facilitar o uso
colnames(company_distribution) <- c("Company", "Freq")

# Ordenar as empresas pela quantidade de vagas em ordem decrescente
company_distribution <- company_distribution[order(-company_distribution$Freq), ]

# Filtrar as 20 principais empresas
top_20_companies <- head(company_distribution, 20)

# Criar o gráfico de barras com os números nas barras
ggplot(top_20_companies, aes(x = reorder(Company, -Freq), y = Freq, fill = Company)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) + # Adiciona os números acima das barras
  labs(title = "Top 20 Empresas com Mais Vagas de Emprego (Estados Unidos)",
       x = "Empresa",
       y = "Número de Vagas") +
  theme_minimal() + # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 90, hjust = 1, size = 7), # Rotaciona e ajusta o tamanho dos rótulos para facilitar a leitura
        legend.position = "none") # Remove a legenda, pois as empresas estão identificadas no eixo X

Com base no gráfico que mostra as 20 empresas com mais vagas de emprego nos Estados Unidos, percebe-se que a empresa Jobs for Humanity lidera com uma ampla vantagem, totalizando 1.364 vagas, demonstrando sua forte demanda por profissionais de TI. Em segundo lugar, a empresa Recruiting from Scratch apresenta 863 vagas, seguida de ClearanceJobs, que oferece 764 oportunidades de emprego.

A empresa Epic também se destaca com 732 vagas, seguida por ClickJobs.io com 252 vagas, demonstrando que essas empresas possuem uma presença significativa no mercado de recrutamento de TI nos Estados Unidos.

Empresas como Dice e HDR aparecem logo atrás, com 233 e 187 vagas, respectivamente. A Northrop Grumman e CyberCoders também ocupam uma posição relevante, oferecendo 180 e 175 vagas cada uma, refletindo sua forte atuação no mercado.

Outras empresas, como Latitude Inc. com 153 vagas e Army National Guard com 128 vagas, mostram que, embora estejam em posições mais baixas, ainda possuem uma quantidade considerável de oportunidades.

Empresas como Walmart com 125 vagas e Energy Jobline com 123 vagas completam o top 10, enquanto empresas como Tesla, Lockheed Martin, e Intellect Inc. oferecem entre 102 e 105 vagas cada uma.

A análise demonstra que a maior parte das vagas está concentrada em algumas grandes empresas de recrutamento e tecnologia, enquanto uma variedade de outras empresas também apresentam uma demanda consistente por profissionais de TI.

Análise das Habilidades mais Requisitadas no Mercado de T.I. (Estados Unidos)

library(stringr)

# Separar as habilidades da coluna job_skills e criar uma lista
all_skills <- unlist(str_split(us_jobs$job_skills, ",\\s*"))  # Separa por vírgulas e remove espaços desnecessários

# Converter todas as habilidades para letras minúsculas e remover espaços
all_skills <- tolower(trimws(all_skills))

# Agrupar habilidades semelhantes/sinônimos
all_skills <- gsub("problem ?solving", "problem solving", all_skills)
all_skills <- gsub("communication skills|communication expert|communication", "communication", all_skills)
all_skills <- gsub("sql server|sql databases", "sql", all_skills)
all_skills <- gsub("aws|amazon aws|amazon web services", "aws", all_skills)
all_skills <- gsub("microsoft azure", "azure", all_skills)
all_skills <- gsub("c\\+\\+", "c++", all_skills)
all_skills <- gsub("python programming", "python", all_skills)
all_skills <- gsub("leadership skills|team leadership", "leadership", all_skills)
all_skills <- gsub("project management|project managing", "project management", all_skills)
all_skills <- gsub("cloud computing|cloud services", "cloud", all_skills)

# Criar uma tabela de frequências para as habilidades
skills_distribution <- as.data.frame(table(all_skills))

# Renomear as colunas para facilitar o uso
colnames(skills_distribution) <- c("Skill", "Freq")

# Ordenar as habilidades pela frequência em ordem decrescente
skills_distribution <- skills_distribution[order(-skills_distribution$Freq), ]

# Filtrar as 20 principais habilidades
top_20_skills <- head(skills_distribution, 20)

# Criar o gráfico de barras
ggplot(top_20_skills, aes(x = reorder(Skill, -Freq), y = Freq, fill = Skill)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) +  # Adiciona os números acima das barras
  labs(title = "Top 20 Habilidades mais Requisitadas nos Estados Unidos (Agrupadas)",
       x = "Habilidade",
       y = "Número de Ocorrências") +
  theme_minimal() +  # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 7),  # Rotaciona os rótulos para facilitar a leitura
        legend.position = "none")  # Remove a legenda

Com base no gráfico que mostra as 20 habilidades mais requisitadas nos Estados Unidos, é evidente que a habilidade de communication lidera com 7.697 ocorrências, indicando que, apesar do setor ser altamente técnico, habilidades interpessoais e de comunicação continuam sendo extremamente valorizadas. A segunda habilidade mais requisitada é SQL, com 5.675 ocorrências, refletindo a alta demanda por profissionais com expertise em bancos de dados.

Python segue com 5.402 ocorrências, sendo uma linguagem de programação amplamente utilizada em diversas áreas da tecnologia, como desenvolvimento de software e ciência de dados. Problem Solving também aparece com destaque, contabilizando 4.719 ocorrências, reforçando a importância de habilidades analíticas para resolução de problemas complexos no ambiente de TI.

Habilidades técnicas como Java (3.873) e AWS (3.352) também são muito requisitadas, refletindo a crescente necessidade de profissionais com domínio de linguagens de programação e plataformas de computação em nuvem. A gestão de projetos é igualmente importante, com Project Management aparecendo com 3.669 ocorrências.

Outras habilidades como JavaScript, Teamwork, e Data Analysis mostram-se igualmente relevantes, com ocorrências variando de 2.802 a 2.636, evidenciando a importância de trabalho em equipe e análise de dados no contexto atual do mercado de TI.

As habilidades de liderança (Leadership) e engenharia de software (Software Engineering) também se destacam com mais de 2.300 ocorrências cada uma, demonstrando a necessidade de profissionais que possam não apenas desenvolver soluções técnicas, mas também liderar equipes e projetos.

Por fim, habilidades relacionadas a plataformas específicas, como Azure e Cloud, além de metodologias como Agile, também são altamente valorizadas, com ocorrências variando entre 2.150 e 2.099.

Esse panorama revela um equilíbrio entre habilidades técnicas e habilidades interpessoais no mercado de TI, com uma ênfase crescente em comunicação, gestão de dados e liderança.

Análise do Canadá🍁

Análise de Vagas por Cidade (Canadá)

# Carregar pacotes necessários
library(ggplot2)

# Filtrar o dataset para incluir apenas vagas do Canadá
canada_jobs <- subset(it_jobs, search_country == "Canada")

# Calcular a distribuição por cidade
city_distribution <- as.data.frame(table(canada_jobs$search_city))

# Ordenar a distribuição em ordem decrescente
city_distribution <- city_distribution[order(-city_distribution$Freq), ]

# Selecionar as 10 cidades com maior número de vagas
top_10_cities <- head(city_distribution, 10)

# Criar o gráfico de barras com os números das vagas nas barras
ggplot(top_10_cities, aes(x = reorder(Var1, -Freq), y = Freq, fill = Var1)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) +  # Adiciona os números acima das barras
  labs(title = "Top 10 Cidades com Mais Vagas (Canadá)",
       x = "Cidade",
       y = "Número de Vagas") +
  theme_minimal() + 
  theme(axis.text.x = element_text(angle = 45, hjust = 1),  # Rotaciona os labels do eixo X para facilitar leitura
        legend.position = "none")  # Remove a legenda

Com base no gráfico que mostra as 10 cidades com mais vagas de TI no Canadá, observa-se que Sarnia-Clearwater lidera com 231 vagas, destacando-se como a cidade com o maior número de oportunidades de emprego no setor. Côte-Saint-Luc aparece em segundo lugar, com 157 vagas, seguida de Etobicoke com 153 vagas.

A cidade de New Westminster ocupa a quarta posição, com 149 vagas, seguida por Ottawa, a capital canadense, que conta com 97 vagas disponíveis. Burlington apresenta 89 vagas, refletindo uma demanda considerável por profissionais de TI na região.

Alberta, tradicionalmente conhecida por seu setor de recursos naturais, aparece com 63 vagas, mostrando uma crescente diversificação na economia. As cidades de Oshawa e Calgary seguem com 49 e 45 vagas, respectivamente, enquanto Chambly fecha a lista com 41 vagas.

Essa distribuição mostra uma concentração significativa de oportunidades nas cidades de Sarnia-Clearwater e Côte-Saint-Luc, com as demais cidades apresentando uma distribuição mais equilibrada entre 40 e 150 vagas.

Análise dos Principais Cargos com Vagas Disponíveis (Canadá)

# Carregar o pacote ggplot2
library(ggplot2)

# Calcular a distribuição de vagas por título de trabalho no Canadá
job_title_distribution <- as.data.frame(table(canada_jobs$job_title))

# Renomear as colunas para facilitar o uso
colnames(job_title_distribution) <- c("Job_Title", "Freq")

# Ordenar os títulos de trabalho pela quantidade de vagas em ordem decrescente
job_title_distribution <- job_title_distribution[order(-job_title_distribution$Freq), ]

# Filtrar os 20 principais títulos de trabalho
top_20_job_titles <- head(job_title_distribution, 20)

# Criar o gráfico de barras
ggplot(top_20_job_titles, aes(x = reorder(Job_Title, -Freq), y = Freq, fill = Job_Title)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) + # Adiciona os números acima das barras
  labs(title = "Top 20 Cargos com Mais Vagas (Canadá)",
       x = "Cargo",
       y = "Número de Vagas") +
  theme_minimal() + # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 7), # Rotaciona os rótulos para facilitar a leitura
        legend.position = "none") # Remove a legenda

Com base no gráfico que mostra os 20 cargos com mais vagas no Canadá, observa-se que o cargo de Electronics Technologist lidera com 21 vagas, indicando uma forte demanda por profissionais qualificados nessa área técnica. Logo em seguida, os cargos de Senior Data Engineer e Senior Infrastructure Engineer ocupam as segunda e terceira posições, com 17 vagas cada, destacando a importância das funções relacionadas à infraestrutura e análise de dados.

O cargo de Senior Security Engineer aparece com 14 vagas, refletindo a crescente necessidade de profissionais especializados em segurança da informação. Senior Software Engineer segue com 12 vagas, demonstrando a continuidade da alta demanda por desenvolvedores de software experientes.

Outras posições, como Business Intelligence Analyst e Part-Time Assistant Manager - Level 2, apresentam 9 vagas cada, sugerindo a necessidade de profissionais que atuem tanto na análise de dados quanto em funções de gerenciamento.

A demanda por especialistas em áreas técnicas é reforçada pelos cargos de Electrician e Senior Geochemical Engineer, que aparecem com 8 e 7 vagas, respectivamente. Business Systems Analyst e Full-Time Assistant Manager também aparecem com 7 vagas cada, evidenciando uma diversificação nas funções requisitadas.

Outros cargos, como Data Engineer, Electrical Technologist, e Firmware Design Engineer, apresentam 5 vagas cada, destacando a relevância de profissionais que possam atuar tanto no desenvolvimento de software quanto na engenharia elétrica e firmware.

Em resumo, a análise mostra uma predominância de cargos técnicos e de engenharia, com uma demanda significativa por profissionais em áreas de tecnologia da informação, engenharia de sistemas e análise de dados no mercado de TI no Canadá.

Visão Sobre as Empresas Contratantes (Canadá)

# Calcular a distribuição de vagas por empresa no Canadá
company_distribution <- as.data.frame(table(canada_jobs$company))

# Renomear as colunas para facilitar o uso
colnames(company_distribution) <- c("Company", "Freq")

# Ordenar as empresas pela quantidade de vagas em ordem decrescente
company_distribution <- company_distribution[order(-company_distribution$Freq), ]

# Filtrar as 20 principais empresas
top_20_companies <- head(company_distribution, 20)

# Criar o gráfico de barras com os números nas barras
ggplot(top_20_companies, aes(x = reorder(Company, -Freq), y = Freq, fill = Company)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) + # Adiciona os números acima das barras
  labs(title = "Top 20 Empresas com Mais Vagas de Emprego (Canadá)",
       x = "Empresa",
       y = "Número de Vagas") +
  theme_minimal() + # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 90, hjust = 1, size = 7), # Rotaciona e ajusta o tamanho dos rótulos para facilitar a leitura
        legend.position = "none") # Remove a legenda, pois as empresas estão identificadas no eixo X

Com base no gráfico que mostra as 20 empresas com mais vagas de emprego no Canadá, a empresa TEHORA Inc. lidera com 55 vagas, seguida de perto por Stantec, que oferece 54 vagas no setor de TI. Synopsys Inc. e Zortech Solutions ocupam a terceira posição, cada uma com 41 vagas disponíveis, evidenciando uma forte demanda por profissionais de tecnologia nessas empresas.

ClickJobs.io também se destaca, oferecendo 32 vagas, enquanto a Canadian Armed Forces | Forces armées canadiennes possui 30 oportunidades, refletindo a presença do setor governamental e militar no recrutamento de profissionais de TI.

Empresas como CareerBeacon e AMD também aparecem entre as principais contratantes, com 24 e 19 vagas, respectivamente, destacando a importância dessas organizações no mercado de trabalho de TI canadense.

Outras empresas como Recruiting from Scratch, Hot Topic, Jobs for Humanity, e Lyft oferecem entre 17 e 16 vagas cada uma, evidenciando uma participação considerável no recrutamento de talentos tecnológicos.

TV2 Consulting, Randstad Canada, EY, e Huawei Technologies Canada Co. Ltd. seguem com 13 vagas cada, enquanto Tata Consultancy Services, Energy Jobline, Agoda, e Nutrien completam a lista com vagas variando entre 12 e 11.

A análise demonstra que o mercado de trabalho de TI no Canadá é dominado por grandes empresas de consultoria, tecnologia e serviços, com destaque para TEHORA Inc. e Stantec, que lideram a lista em termos de oportunidades de emprego.

Análise das Habilidades mais Requisitadas no Mercado de T.I. (Canadá)

library(stringr)

# Separar as habilidades da coluna job_skills e criar uma lista
all_skills <- unlist(str_split(canada_jobs$job_skills, ",\\s*"))  # Separa por vírgulas e remove espaços desnecessários

# Converter todas as habilidades para letras minúsculas e remover espaços
all_skills <- tolower(trimws(all_skills))

# Agrupar habilidades semelhantes/sinônimos
all_skills <- gsub("problem ?solving", "problem solving", all_skills)
all_skills <- gsub("communication skills|communication expert|communication", "communication", all_skills)
all_skills <- gsub("sql server|sql databases", "sql", all_skills)
all_skills <- gsub("aws|amazon aws|amazon web services", "aws", all_skills)
all_skills <- gsub("microsoft azure", "azure", all_skills)
all_skills <- gsub("c\\+\\+", "c++", all_skills)
all_skills <- gsub("python programming", "python", all_skills)
all_skills <- gsub("leadership skills|team leadership", "leadership", all_skills)
all_skills <- gsub("project management|project managing", "project management", all_skills)
all_skills <- gsub("cloud computing|cloud services", "cloud", all_skills)

# Criar uma tabela de frequências para as habilidades
skills_distribution <- as.data.frame(table(all_skills))

# Renomear as colunas para facilitar o uso
colnames(skills_distribution) <- c("Skill", "Freq")

# Ordenar as habilidades pela frequência em ordem decrescente
skills_distribution <- skills_distribution[order(-skills_distribution$Freq), ]

# Filtrar as 20 principais habilidades
top_20_skills <- head(skills_distribution, 20)

# Criar o gráfico de barras
ggplot(top_20_skills, aes(x = reorder(Skill, -Freq), y = Freq, fill = Skill)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) +  # Adiciona os números acima das barras
  labs(title = "Top 20 Habilidades mais Requisitadas no Canadá (Agrupadas)",
       x = "Habilidade",
       y = "Número de Ocorrências") +
  theme_minimal() +  # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 7),  # Rotaciona os rótulos para facilitar a leitura
        legend.position = "none")  # Remove a legenda

Com base no gráfico que mostra as 20 habilidades mais requisitadas no Canadá, observa-se que a habilidade de communication lidera com 575 ocorrências, indicando que, mesmo em um setor altamente técnico como o de TI, as habilidades de comunicação são fundamentais para o sucesso profissional.

A segunda habilidade mais requisitada é problem solving, com 405 ocorrências, destacando a importância de profissionais que possam lidar com desafios complexos e encontrar soluções inovadoras. SQL aparece logo em seguida com 335 ocorrências, evidenciando a necessidade contínua de expertise em bancos de dados.

Python também é uma das habilidades mais procuradas, com 322 ocorrências, refletindo sua popularidade no desenvolvimento de software e análise de dados. Project management, com 251 ocorrências, mostra que, além das habilidades técnicas, a gestão de projetos é uma competência crucial para a entrega eficaz de soluções tecnológicas.

Troubleshooting e teamwork aparecem com 237 e 232 ocorrências, respectivamente, enfatizando a demanda por profissionais capazes de resolver problemas técnicos rapidamente e trabalhar de forma colaborativa. Java e leadership também figuram entre as habilidades mais procuradas, com 229 e 183 ocorrências, demonstrando a importância de liderança e proficiência em linguagens de programação.

Outras habilidades como AWS (175), JavaScript (165), data analysis (154), e dev-ops (135) também são altamente requisitadas, refletindo a crescente demanda por profissionais que possam gerenciar sistemas em nuvem, desenvolver aplicações e analisar grandes volumes de dados.

Por fim, habilidades relacionadas a metodologias ágeis, como agile (134) e tecnologias específicas como git, azure, e cloud, cada uma com 126 ocorrências, indicam a relevância dessas competências no mercado de trabalho canadense.

Em resumo, a análise revela um equilíbrio entre habilidades técnicas e habilidades interpessoais no mercado de TI no Canadá, com ênfase em comunicação, solução de problemas, gestão de projetos e proficiência em ferramentas tecnológicas essenciais.

Análise do Reino Unido👑

Análise de Vagas por Cidade (Reino Unido)

# Carregar pacotes necessários
library(ggplot2)

# Filtrar o dataset para incluir apenas vagas do Reino Unido
uk_jobs <- subset(it_jobs, search_country == "United Kingdom")

# Calcular a distribuição por cidade
city_distribution <- as.data.frame(table(uk_jobs$search_city))

# Ordenar a distribuição em ordem decrescente
city_distribution <- city_distribution[order(-city_distribution$Freq), ]

# Selecionar as 10 cidades com maior número de vagas
top_10_cities <- head(city_distribution, 10)

# Criar o gráfico de barras com os números das vagas nas barras
ggplot(top_10_cities, aes(x = reorder(Var1, -Freq), y = Freq, fill = Var1)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) +  # Adiciona os números acima das barras
  labs(title = "Top 10 Cidades com Mais Vagas (Reino Unido)",
       x = "Cidade",
       y = "Número de Vagas") +
  theme_minimal() + 
  theme(axis.text.x = element_text(angle = 45, hjust = 1),  # Rotaciona os labels do eixo X para facilitar leitura
        legend.position = "none")  # Remove a legenda

Com base no gráfico que apresenta as 10 cidades com mais vagas de TI no Reino Unido, observa-se que Greater London lidera com uma margem significativa, oferecendo 375 vagas de emprego, destacando-se como o principal centro de oportunidades na área de tecnologia.

Slough ocupa a segunda posição com 207 vagas, seguido por High Wycombe, que apresenta 187 vagas. Essas cidades próximas a Londres têm uma demanda considerável por profissionais de TI, refletindo sua importância como polos de desenvolvimento tecnológico no país.

Blackburn surge em quarto lugar, com 150 vagas, seguido por York e South Hampshire, que oferecem 119 e 114 vagas, respectivamente. Isso sugere que há uma distribuição equilibrada de oportunidades de emprego em TI em diferentes regiões do Reino Unido, além dos grandes centros urbanos.

Cidades como Worcester com 111 vagas, e Basildon com 100 vagas, também mostram uma demanda sólida por profissionais de tecnologia. Edinburgh, a capital da Escócia, aparece com 95 vagas, enquanto Newport completa a lista com 91 vagas.

Essa análise indica que, embora Londres continue sendo o maior centro de empregos de TI, outras cidades no Reino Unido também estão apresentando um crescimento significativo em termos de oferta de oportunidades de trabalho no setor.

Análise dos Principais Cargos com Vagas Disponíveis (Reino Unido)

# Carregar o pacote ggplot2
library(ggplot2)

# Calcular a distribuição de vagas por título de trabalho no Reino Unido
job_title_distribution <- as.data.frame(table(uk_jobs$job_title))

# Renomear as colunas para facilitar o uso
colnames(job_title_distribution) <- c("Job_Title", "Freq")

# Ordenar os títulos de trabalho pela quantidade de vagas em ordem decrescente
job_title_distribution <- job_title_distribution[order(-job_title_distribution$Freq), ]

# Filtrar os 20 principais títulos de trabalho
top_20_job_titles <- head(job_title_distribution, 20)

# Criar o gráfico de barras
ggplot(top_20_job_titles, aes(x = reorder(Job_Title, -Freq), y = Freq, fill = Job_Title)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) + # Adiciona os números acima das barras
  labs(title = "Top 20 Cargos com Mais Vagas (Reino Unido)",
       x = "Cargo",
       y = "Número de Vagas") +
  theme_minimal() + # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 7), # Rotaciona os rótulos para facilitar a leitura
        legend.position = "none") # Remove a legenda

Com base no gráfico que apresenta os 20 cargos com mais vagas de emprego no Reino Unido, o cargo de Production Operative lidera com 63 vagas, evidenciando uma alta demanda por profissionais que possam atuar na linha de produção em áreas de TI e tecnologia.

Em seguida, o cargo de Senior Software Engineer aparece com 50 vagas, indicando uma grande demanda por profissionais de software com experiência avançada. Senior Systems Engineer e Technical Manager aparecem em terceiro lugar com 30 vagas cada, destacando a importância de cargos de liderança e gestão técnica no mercado de trabalho.

Cargos relacionados à engenharia, como Senior Mechanical Design Engineer com 28 vagas e Senior Data Engineer com 25 vagas, refletem a demanda contínua por profissionais especializados em design e análise de dados.

Communications Manager e Software Developer também são posições de destaque, com 24 e 21 vagas, respectivamente, ressaltando a necessidade de profissionais que possam gerenciar comunicações internas e externas, além de desenvolvedores de software capacitados.

Outros cargos técnicos, como Data Engineer e Senior Electrical Design Engineer, apresentam 17 e 15 vagas, respectivamente, reforçando a busca por profissionais que possam lidar com infraestrutura de dados e design elétrico.

Cargos como Principal Biostatistician, Junior Coder, e Senior Data Engineer variam entre 14 e 10 vagas, refletindo uma diversificação nas funções especializadas.

De modo geral, a análise mostra uma forte demanda por cargos técnicos e de liderança no Reino Unido, com destaque para posições sêniores em engenharia de software, sistemas e design.

Visão Sobre as Empresas Contratantes (Reino Unido)

# Calcular a distribuição de vagas por empresa no Reino Unido
company_distribution <- as.data.frame(table(uk_jobs$company))

# Renomear as colunas para facilitar o uso
colnames(company_distribution) <- c("Company", "Freq")

# Ordenar as empresas pela quantidade de vagas em ordem decrescente
company_distribution <- company_distribution[order(-company_distribution$Freq), ]

# Filtrar as 20 principais empresas
top_20_companies <- head(company_distribution, 20)

# Criar o gráfico de barras com os números nas barras
ggplot(top_20_companies, aes(x = reorder(Company, -Freq), y = Freq, fill = Company)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) + # Adiciona os números acima das barras
  labs(title = "Top 20 Empresas com Mais Vagas de Emprego (Reino Unido)",
       x = "Empresa",
       y = "Número de Vagas") +
  theme_minimal() + # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 90, hjust = 1, size = 7), # Rotaciona e ajusta o tamanho dos rótulos para facilitar a leitura
        legend.position = "none") # Remove a legenda

Com base no gráfico que apresenta as 20 empresas com mais vagas de emprego no Reino Unido, observa-se que a Energy Jobline se destaca com uma grande margem em relação às demais empresas, oferecendo 164 vagas de emprego. Essa concentração significativa sugere que a empresa possui uma demanda elevada por profissionais de TI, em comparação com as demais.

Na segunda posição, encontra-se a Nigel Frank International com 45 vagas, seguida por ecoegene, que oferece 35 oportunidades. Essas empresas demonstram uma presença forte no mercado de TI, recrutando um número considerável de profissionais.

Outras empresas, como Michael Page e Digital Waffle, oferecem 29 e 28 vagas, respectivamente, mostrando uma demanda razoável por talentos no setor de TI. Além disso, Recruitment Software & Services e Leonardo aparecem com 27 e 25 vagas cada uma, destacando-se entre as empresas mais ativas no recrutamento.

Empresas como Matchtech e Jefferson Frank seguem com 23 e 22 vagas, respectivamente, enquanto empresas como Gradfuel, Hannah, e Hays oferecem 18 e 19 vagas cada uma, evidenciando um mercado competitivo de recrutamento de profissionais de TI.

As demais empresas, como Platform Recruitment, Eden Brown Built Environment, e Ernest Gordon Recruitment, apresentam uma oferta de 16 vagas cada uma, completando o grupo das principais empresas contratantes no setor. Empresas como ClickJobs.io e e-Careers fecham a lista, com 14 vagas disponíveis.

Em síntese, o mercado de trabalho de TI no Reino Unido é dominado por algumas grandes empresas, como a Energy Jobline, que detém a maior fatia de oportunidades, enquanto as demais empresas possuem uma distribuição mais equilibrada de vagas.

Análise das Habilidades mais Requisitadas no Mercado de T.I. (Reino Unido)

library(stringr)

# Separar as habilidades da coluna job_skills e criar uma lista
all_skills <- unlist(str_split(uk_jobs$job_skills, ",\\s*"))  # Separa por vírgulas e remove espaços desnecessários

# Converter todas as habilidades para letras minúsculas e remover espaços
all_skills <- tolower(trimws(all_skills))

# Agrupar habilidades semelhantes/sinônimos
all_skills <- gsub("problem ?solving", "problem solving", all_skills)
all_skills <- gsub("communication skills|communication expert|communication", "communication", all_skills)
all_skills <- gsub("sql server|sql databases", "sql", all_skills)
all_skills <- gsub("aws|amazon aws|amazon web services", "aws", all_skills)
all_skills <- gsub("microsoft azure", "azure", all_skills)
all_skills <- gsub("c\\+\\+", "c++", all_skills)
all_skills <- gsub("python programming", "python", all_skills)
all_skills <- gsub("leadership skills|team leadership", "leadership", all_skills)
all_skills <- gsub("project management|project managing", "project management", all_skills)
all_skills <- gsub("cloud computing|cloud services", "cloud", all_skills)

# Criar uma tabela de frequências para as habilidades
skills_distribution <- as.data.frame(table(all_skills))

# Renomear as colunas para facilitar o uso
colnames(skills_distribution) <- c("Skill", "Freq")

# Ordenar as habilidades pela frequência em ordem decrescente
skills_distribution <- skills_distribution[order(-skills_distribution$Freq), ]

# Filtrar as 20 principais habilidades
top_20_skills <- head(skills_distribution, 20)

# Criar o gráfico de barras
ggplot(top_20_skills, aes(x = reorder(Skill, -Freq), y = Freq, fill = Skill)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) +  # Adiciona os números acima das barras
  labs(title = "Top 20 Habilidades mais Requisitadas no Reino Unido (Agrupadas)",
       x = "Habilidade",
       y = "Número de Ocorrências") +
  theme_minimal() +  # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 7),  # Rotaciona os rótulos para facilitar a leitura
        legend.position = "none")  # Remove a legenda

Com base no gráfico que apresenta as 20 habilidades mais requisitadas no Reino Unido, a habilidade de communication lidera com uma grande margem, registrando 1.037 ocorrências. Isso demonstra que, apesar do setor de tecnologia ser altamente técnico, as habilidades de comunicação continuam sendo essenciais, especialmente para funções que requerem colaboração e interação com diferentes equipes.

A habilidade de problem solving aparece em segundo lugar, com 562 ocorrências, destacando a demanda por profissionais que possam resolver problemas complexos e encontrar soluções inovadoras. Project management também figura em uma posição de destaque, com 471 ocorrências, refletindo a necessidade de gerenciar projetos eficazmente em um ambiente tecnológico.

SQL e Python seguem com 432 e 376 ocorrências, respectivamente, evidenciando que habilidades de gerenciamento de bancos de dados e linguagens de programação continuam sendo altamente valorizadas no mercado de TI do Reino Unido.

Teamwork e leadership também estão entre as habilidades mais procuradas, com 372 e 322 ocorrências, respectivamente, mostrando a importância de trabalhar em equipe e liderar projetos em um setor que muitas vezes exige a colaboração entre diferentes áreas.

Outras habilidades técnicas como JavaScript (268), AWS (260), e troubleshooting (241) reforçam a necessidade de profissionais que dominem ferramentas e plataformas essenciais para o desenvolvimento de software e a resolução de problemas técnicos.

Além disso, data analysis e attention to detail aparecem com 233 e 236 ocorrências, destacando a crescente demanda por profissionais que possam trabalhar com grandes volumes de dados e garantir a precisão no desenvolvimento de projetos.

Habilidades específicas como C# e Azure também são destacadas, com 231 e 227 ocorrências, respectivamente, indicando uma alta demanda por conhecimentos em linguagens de programação e computação em nuvem.

Por fim, agile e mentoring são habilidades importantes, com 193 e 189 ocorrências, demonstrando a relevância de metodologias ágeis e a capacidade de orientar e liderar equipes em um ambiente de rápido desenvolvimento tecnológico.

Em resumo, o mercado de trabalho no Reino Unido valoriza um equilíbrio entre habilidades técnicas e interpessoais, com ênfase em comunicação, gestão de projetos, programação e liderança, refletindo as necessidades do setor de TI em um cenário cada vez mais colaborativo e dinâmico.

Análise da Austrália🦘

Análise de Vagas por Cidade (Austrália)

# Carregar pacotes necessários
library(ggplot2)

# Filtrar o dataset para incluir apenas vagas da Austrália
australia_jobs <- subset(it_jobs, search_country == "Australia")

# Calcular a distribuição por cidade
city_distribution <- as.data.frame(table(australia_jobs$search_city))

# Ordenar a distribuição em ordem decrescente
city_distribution <- city_distribution[order(-city_distribution$Freq), ]

# Selecionar as 10 cidades com maior número de vagas
top_10_cities <- head(city_distribution, 10)

# Criar o gráfico de barras com os números das vagas nas barras
ggplot(top_10_cities, aes(x = reorder(Var1, -Freq), y = Freq, fill = Var1)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) +  # Adiciona os números acima das barras
  labs(title = "Top 10 Cidades com Mais Vagas (Austrália)",
       x = "Cidade",
       y = "Número de Vagas") +
  theme_minimal() + 
  theme(axis.text.x = element_text(angle = 45, hjust = 1),  # Rotaciona os labels do eixo X para facilitar leitura
        legend.position = "none")  # Remove a legenda

O gráfico acima mostra as 10 cidades com mais vagas de TI na Austrália. Observa-se que New South Wales lidera com 132 vagas, seguida de perto por Victoria, que oferece 130 vagas. Essas duas regiões dominam o mercado de trabalho de TI, representando uma parte significativa das oportunidades.

Redcliffe aparece em terceiro lugar, com 110 vagas, destacando-se como outro importante centro de empregos no setor. A seguir, Deception Bay e Parramatta apresentam 57 e 56 vagas, respectivamente, indicando uma boa demanda por profissionais de tecnologia nessas áreas.

Outras cidades importantes incluem Perth, com 53 vagas, e Sydney, um grande centro urbano, com 48 vagas, o que sugere que, embora Sydney seja uma cidade tecnológica de destaque, outras regiões estão apresentando uma maior concentração de oportunidades no momento.

Canberra, a capital da Austrália, oferece 42 vagas, enquanto Melbourne, outro polo significativo, apresenta 26 vagas. Sunbury completa a lista com 16 vagas.

A análise revela que, embora cidades grandes como Sydney e Melbourne estejam na lista, há uma diversificação na oferta de vagas, com outras cidades e regiões ganhando destaque no mercado de TI na Austrália, especialmente New South Wales e Victoria.

Análise dos Principais Cargos com Vagas Disponíveis (Austrália)

# Calcular a distribuição de vagas por título de trabalho na Austrália
job_title_distribution <- as.data.frame(table(australia_jobs$job_title))

# Renomear as colunas para facilitar o uso
colnames(job_title_distribution) <- c("Job_Title", "Freq")

# Ordenar os títulos de trabalho pela quantidade de vagas em ordem decrescente
job_title_distribution <- job_title_distribution[order(-job_title_distribution$Freq), ]

# Filtrar os 20 principais títulos de trabalho
top_20_job_titles <- head(job_title_distribution, 20)

# Criar o gráfico de barras
ggplot(top_20_job_titles, aes(x = reorder(Job_Title, -Freq), y = Freq, fill = Job_Title)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) + # Adiciona os números acima das barras
  labs(title = "Top 20 Cargos com Mais Vagas (Austrália)",
       x = "Cargo",
       y = "Número de Vagas") +
  theme_minimal() + # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 7), # Rotaciona os rótulos para facilitar a leitura
        legend.position = "none") # Remove a legenda

O gráfico mostra os 20 cargos com mais vagas de TI na Austrália, com destaque para o cargo de Software Engineer, que lidera com 27 vagas, indicando uma forte demanda por desenvolvedores de software no mercado de TI australiano.

Logo em seguida, o cargo de Senior Data Engineer aparece com 19 vagas, mostrando que a análise e gerenciamento de dados também é uma área de grande importância no país. O cargo de Database Administrator ocupa a terceira posição, com 6 vagas, reforçando a relevância de profissionais especializados na administração e manutenção de bancos de dados.

Outros cargos, como Senior IT Systems Analyst e Senior Electrical Engineer, possuem 5 vagas cada, refletindo a necessidade de profissionais capacitados para gerenciar sistemas de TI e infraestrutura técnica.

Diversos outros cargos técnicos, como Systems Support Analyst, Data Analyst, Senior Developer e Senior DevOps Engineer, apresentam 4 vagas cada, mostrando uma distribuição relativamente uniforme de oportunidades para diversas áreas de especialização.

De modo geral, a análise revela que a Austrália tem uma demanda considerável por profissionais de software, dados, e infraestrutura, com oportunidades distribuídas por uma variedade de cargos técnicos, embora com uma concentração mais significativa em engenharia de software e análise de dados.

Visão Sobre as Empresas Contratantes (Austrália)

# Calcular a distribuição de vagas por empresa na Austrália
company_distribution <- as.data.frame(table(australia_jobs$company))

# Renomear as colunas para facilitar o uso
colnames(company_distribution) <- c("Company", "Freq")

# Ordenar as empresas pela quantidade de vagas em ordem decrescente
company_distribution <- company_distribution[order(-company_distribution$Freq), ]

# Filtrar as 20 principais empresas
top_20_companies <- head(company_distribution, 20)

# Criar o gráfico de barras com os números nas barras
ggplot(top_20_companies, aes(x = reorder(Company, -Freq), y = Freq, fill = Company)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) + # Adiciona os números acima das barras
  labs(title = "Top 20 Empresas com Mais Vagas de Emprego (Austrália)",
       x = "Empresa",
       y = "Número de Vagas") +
  theme_minimal() + # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 90, hjust = 1, size = 7), # Rotaciona e ajusta o tamanho dos rótulos para facilitar a leitura
        legend.position = "none") # Remove a legenda

O gráfico apresenta as 20 empresas com mais vagas de emprego na Austrália, mostrando a liderança da Workforce Australia for Individuals, com 18 vagas disponíveis. A empresa se destaca significativamente em comparação às demais, sugerindo uma forte demanda por profissionais de TI.

Talent e Accenture Australia ocupam a segunda e terceira posições, com 15 e 14 vagas, respectivamente, evidenciando a importância dessas empresas no setor de tecnologia da informação. Softtest Pays também se destaca, empatando com 14 vagas, enquanto Agoda aparece com 12 oportunidades.

FIS e Michael Page seguem com 9 vagas cada uma, reforçando sua presença no mercado australiano de TI. Outras empresas, como CareCone Group, GOSOL, OpenText, REA Group, e Robert Walters, apresentam 7 vagas cada, indicando uma demanda mais distribuída entre empresas de médio porte.

Além disso, empresas como Auto & General Australia, Comparethemarket.com.au, e FireSoft People oferecem 6 vagas cada, enquanto Zip Co, Atlassian, Intro Recruitment Solutions, e Jobs via eFinancialCareers completam o gráfico com 5 vagas cada.

De maneira geral, o gráfico revela uma concentração de vagas em algumas grandes empresas de recrutamento, consultoria e tecnologia, ao mesmo tempo que diversas outras empresas menores também apresentam uma quantidade considerável de oportunidades. Isso reflete um mercado de TI ativo e diversificado na Austrália.

Análise das Habilidades mais Requisitadas no Mercado de T.I. (Austrália)

library(stringr)

# Separar as habilidades da coluna job_skills e criar uma lista
all_skills <- unlist(str_split(australia_jobs$job_skills, ",\\s*"))  # Separa por vírgulas e remove espaços desnecessários

# Converter todas as habilidades para letras minúsculas e remover espaços
all_skills <- tolower(trimws(all_skills))

# Agrupar habilidades semelhantes/sinônimos
all_skills <- gsub("problem ?solving", "problem solving", all_skills)
all_skills <- gsub("communication skills|communication expert|communication", "communication", all_skills)
all_skills <- gsub("sql server|sql databases", "sql", all_skills)
all_skills <- gsub("aws|amazon aws|amazon web services", "aws", all_skills)
all_skills <- gsub("microsoft azure", "azure", all_skills)
all_skills <- gsub("c\\+\\+", "c++", all_skills)
all_skills <- gsub("python programming", "python", all_skills)
all_skills <- gsub("leadership skills|team leadership", "leadership", all_skills)
all_skills <- gsub("project management|project managing", "project management", all_skills)
all_skills <- gsub("cloud computing|cloud services", "cloud", all_skills)

# Criar uma tabela de frequências para as habilidades
skills_distribution <- as.data.frame(table(all_skills))

# Renomear as colunas para facilitar o uso
colnames(skills_distribution) <- c("Skill", "Freq")

# Ordenar as habilidades pela frequência em ordem decrescente
skills_distribution <- skills_distribution[order(-skills_distribution$Freq), ]

# Filtrar as 20 principais habilidades
top_20_skills <- head(skills_distribution, 20)

# Criar o gráfico de barras
ggplot(top_20_skills, aes(x = reorder(Skill, -Freq), y = Freq, fill = Skill)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Freq), vjust = -0.5, size = 3) +  # Adiciona os números acima das barras
  labs(title = "Top 20 Habilidades mais Requisitadas na Austrália (Agrupadas)",
       x = "Habilidade",
       y = "Número de Ocorrências") +
  theme_minimal() +  # Aplica um tema minimalista ao gráfico
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 7),  # Rotaciona os rótulos para facilitar a leitura
        legend.position = "none")  # Remove a legenda

O gráfico apresenta as 20 habilidades mais requisitadas no mercado de TI na Austrália, mostrando que a habilidade de communication lidera com 250 ocorrências, destacando a importância da comunicação em um setor tecnicamente orientado. Isso sugere que, além de conhecimento técnico, as empresas valorizam a capacidade de seus funcionários de se comunicarem de forma eficaz, tanto dentro das equipes quanto com outros stakeholders.

Problem solving é a segunda habilidade mais requisitada, com 161 ocorrências, reforçando a demanda por profissionais capazes de resolver problemas complexos e encontrar soluções criativas para os desafios técnicos. SQL aparece em seguida com 149 ocorrências, refletindo a importância contínua da gestão de bancos de dados no mercado de TI.

Python, uma das linguagens de programação mais populares, tem 104 ocorrências, indicando que o domínio dessa linguagem é altamente valorizado. Project management surge com 97 ocorrências, destacando a importância de gerenciar projetos de TI de maneira eficiente.

Outras habilidades técnicas, como AWS (88), Java (86), e JavaScript (86), também estão em alta demanda, reforçando a necessidade de conhecimento em plataformas de computação em nuvem e linguagens de programação amplamente utilizadas.

Habilidades interpessoais como teamwork (82) e collaboration (80) também são destacadas, mostrando que o trabalho em equipe é essencial em ambientes colaborativos e ágeis. Além disso, habilidades de leadership (76) e troubleshooting (75) sugerem que as empresas estão em busca de profissionais que possam liderar equipes e resolver problemas técnicos de forma rápida e eficiente.

Outras habilidades importantes incluem data analysis (67), Azure (61), e dev-ops (61), que indicam a crescente demanda por análise de dados e expertise em plataformas de computação em nuvem e automação de processos.

Por fim, habilidades como software development, analytical skills, attention to detail, e C# aparecem com entre 55 e 56 ocorrências, mostrando a importância do desenvolvimento de software, análise precisa e o uso de linguagens específicas no mercado de TI australiano.

Em resumo, o gráfico revela um equilíbrio entre habilidades técnicas e interpessoais, com forte ênfase em comunicação, resolução de problemas, programação e liderança, refletindo a natureza diversificada e colaborativa do mercado de TI na Austrália.

Conclusões💭

Conclusão Final

O objetivo desta análise foi entender a distribuição geográfica de vagas de TI, os cargos mais demandados e as habilidades mais requisitadas nos mercados de TI dos Estados Unidos, Austrália, Canadá e Reino Unido. Em um contexto de crescente demanda por profissionais de TI, buscamos fornecer uma visão detalhada de onde estão as principais oportunidades e quais são as qualificações mais exigidas.

Para abordar essa questão, utilizamos o dataset Kaggle - 1.3M LinkedIn Jobs & Skills (2024), consolidando dados sobre vagas, cargos, habilidades e regiões. A metodologia incluiu técnicas de análise de dados para identificar tendências de empregos, focando em cargos relacionados a TI, as principais cidades com vagas, empresas que mais contratam e as habilidades mais valorizadas. A análise envolveu a criação de gráficos e a categorização de grandes volumes de dados não estruturados.

1. Distribuição Geográfica das Vagas

Estados Unidos: Se destacam como o maior mercado de TI, com Austin, Santa Clara e Atlanta liderando em número de vagas. Este cenário reflete a liderança global dos EUA no setor de tecnologia.
Reino Unido: Greater London concentra a maior parte das oportunidades, seguido por cidades como Slough e High Wycombe.
Austrália: As regiões de New South Wales e Victoria dominam o mercado de TI, enquanto outras áreas, como Redcliffe e Deception Bay, também surgem como polos emergentes.
Canadá: Cidades como Sarnia-Clearwater e Côte-Saint-Luc se destacam, enquanto Ottawa e Calgary também mostram uma participação relevante.

2. Cargos Mais Demandados

Engenheiros de Software lideram a demanda nos Estados Unidos, Reino Unido e Austrália, confirmando a importância dessa função globalmente.
No Canadá, há uma ênfase em Electronic Technologists e Data Engineers, refletindo uma maior necessidade de infraestrutura e análise de dados.
O foco em engenharia de dados e infraestrutura é constante nos quatro países, especialmente para posições sêniores, evidenciando a crescente complexidade dos sistemas tecnológicos.

3. Empresas Contratantes

Nos Estados Unidos, grandes empresas de tecnologia, como Jobs for Humanity, Recruiting from Scratch, e ClearanceJobs, dominam o mercado de contratação.
No Reino Unido, empresas como Energy Jobline e Nigel Frank International se destacam.
Na Austrália, Workforce Australia for Individuals é a principal contratante, seguida por Talent e Accenture Australia.
No Canadá, empresas como TEHORA Inc. e Stantec são os maiores empregadores, seguidas por companhias globais como Synopsys.

4. Habilidades mais Requisitadas

Comunicação e resolução de problemas são habilidades amplamente requisitadas em todos os países, refletindo a importância das soft skills no setor de TI.
Habilidades técnicas como SQL, Python, AWS, e Java também são essenciais, com forte demanda por conhecimento em cloud computing e automação de processos (DevOps).
Gerenciamento de projetos é altamente valorizado, demonstrando a necessidade de profissionais que combinem habilidades técnicas e de gestão.

5. Tendências Gerais

As empresas estão buscando profissionais versáteis, capazes de lidar com complexidade técnica e habilidades interpessoais em ambientes colaborativos e ágeis.
Há uma forte demanda por engenheiros de software e engenheiros de sistemas sêniores, especialmente nos Estados Unidos e Reino Unido.
New South Wales (Austrália) e Sarnia-Clearwater (Canadá) estão emergindo como polos tecnológicos, desafiando os centros tradicionais como Sydney e Ottawa.

Implicações para Clientes

Para profissionais de TI, esta análise fornece insights valiosos sobre as regiões com maior concentração de vagas e as habilidades que devem ser priorizadas para se destacar no mercado. Empresas de recrutamento e organizações de TI podem usar essas informações para ajustar suas estratégias de atração de talentos, focando nas regiões e habilidades mais promissoras.

Empresas localizadas em mercados emergentes, como Austrália e certas cidades do Canadá, podem aproveitar esses insights para competir em mercados globais, ajustando suas ofertas e atraindo profissionais qualificados com base nas demandas identificadas.

Limitações e Sugestões para Melhoria

Apesar dos insights fornecidos, esta análise apresenta algumas limitações. O conjunto de dados utilizado é proveniente de uma plataforma específica (LinkedIn), o que pode não refletir completamente as oportunidades de emprego em diferentes setores e regiões. Além disso, o mercado de TI é dinâmico, e as demandas por habilidades e localização podem mudar rapidamente. Uma abordagem para futuras análises incluiria:

Incorporar dados de múltiplas plataformas de emprego para uma visão mais ampla e representativa do mercado.
Realizar análises temporais para identificar tendências ao longo do tempo, como o crescimento de certas habilidades ou o surgimento de novos polos tecnológicos.
Segmentar por indústrias específicas de TI para entender as demandas particulares de cada setor.

Essa análise proporciona uma base sólida para entender o mercado de TI globalmente, mas há potencial para aprimoramentos futuros, que podem trazer insights ainda mais profundos e precisos.

Conclusão Geral

O mercado de TI nos Estados Unidos, Austrália, Canadá e Reino Unido é diversificado e está em constante evolução, com uma forte demanda por habilidades tanto técnicas quanto interpessoais. Os profissionais que investem em programação, cloud computing e análise de dados, além de comunicação e liderança, estarão mais bem preparados para explorar as oportunidades em regiões emergentes e tradicionais. Por outro lado, as empresas devem ajustar suas estratégias de recrutamento para captar os melhores talentos e manter sua competitividade no dinâmico mercado tecnológico.

Referências📚

ggplot2: Utilizado para a criação de gráficos e visualizações.
Hadley Wickham (2016). ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York. Available at: https://ggplot2.tidyverse.org
stringr: Utilizado para a manipulação de strings e textos.
Hadley Wickham (2019). stringr: Simple, Consistent Wrappers for Common String Operations. R package version 1.4.0. Available at: https://stringr.tidyverse.org
dplyr: Empregado na manipulação e transformação de dados.
Hadley Wickham, Romain François, Lionel Henry and Kirill Müller (2020). dplyr: A Grammar of Data Manipulation. R package version 1.0.2. Available at: https://dplyr.tidyverse.org
knitr: Usado para renderizar gráficos e tabelas nos relatórios.
Yihui Xie (2021). knitr: A General-Purpose Package for Dynamic Report Generation in R. R package version 1.33. Available at: https://yihui.org/knitr/
rmdformats: Utilizado para a estilização do documento com o tema ‘material’.
Julien Barnier (2021). rmdformats: HTML Output Formats and Templates for ‘rmarkdown’ Documents. R package version 1.0. Available at: https://github.com/juba/rmdformats
Asaniczka (2024). 1.3M LinkedIn Jobs & Skills (2024). Kaggle. Disponível em: https://www.kaggle.com/datasets/asaniczka/1-3m-linkedin-jobs-and-skills-2024

Análise de Vagas de Emprego em T.I.

Vinícius Nário Vasconcelos

10/09/2024