09 de junho 2022A documentação a seguir é parte do relatório que analisará algumas informações sobre o mercado de trabalho de plataforma. Os dados advieram da base de dados disponibilizada pelo IBGE, cuja pesquisa empírica foi desenvolvida ao longo de 2020; no auge da primeira onda da Sars-Cov-2. A análise inspirou-se na documentação elaborado por Gabriel Assunção, e pode ser acessada a partir do link: < https://rpubs.com/gabriel-assuncao-ibge/covid >.
Utilizaremos os seguintes pacotes para processar o banco de dados online do IBGE
library(COVIDIBGE)
library(survey) ## statistic
library(dplyr) ## general package
library(grid) ## necessary for survey package
library(Matrix) ## necessary for survey package
library(survival) ## necessary for survey package
library(srvyr) ## allow dplyr for survey
library(ggplot2) ## graphs
library(knitr) ## For graphs
Uma vez instalados e carregados os pacotes, é necessário selecionar as variáveis de interesse. Um modo mais fácil de fazê-lo é criar um arquivo com as variáveis de interesse, e então utilizá-lo para os diferentes meses e categorias de interesse, que nesse caso em particular foram motoristas e entregadores. É possível utilizar labels para as variáveis. Importante mencionar também que dos dados devem ser acessados mensalmente. Aparentemente não há forma de obtê-los todos de uma única vez. Maiores detalhes em: help(“get_covid”).
relevante_data <- c("UF", "V1022", "V1023", "A001A", "A001B3", "A003", "A004", "A005", "C007A",
"C007B", "C007C", "C007D", "C008", "C009", "C01012", "C011A",
"C011A11", "C012", "C014", "D0011", "D0013", "D0021", "D0023",
"D0031", "D0033", "D0041", "D0043", "D0051", "D0053", "D0061",
"D0063", "D0071", "D0073", "F001", "F0021", "F0022", "F0061",
"F006")
# Months and categories (drivers and deliveries)
#may
pnadcovid_may <- get_covid(year=2020, month=5, vars=relevante_data, labels=T, design=T, deflator=T)
drivers_may <- subset(pnadcovid_may, C007C %in% "Motorista (de aplicativo, de taxi, de van, de mototáxi, de ônibus)") # only drivers
delivery_may <- subset(pnadcovid_may, C007C %in% "Entregador de mercadorias (de restaurante, de farmácia, de loja, Uber Eats, IFood, Rappy etc.)") # only delivery
#june
pnadcovid_june <- get_covid(year=2020, month=6, vars=relevante_data, labels=T, design=T, deflator=T)
drivers_june <- subset(pnadcovid_june, C007C %in% "Motorista (de aplicativo, de taxi, de van, de mototáxi, de ônibus)" )
delivery_june <- subset(pnadcovid_june, C007C %in% "Entregador de mercadorias (de restaurante, de farmácia, de loja, Uber Eats, IFood, Rappy etc.)") # only delivery
#july
pnadcovid_july <- get_covid(year=2020, month=7, vars=relevante_data, labels=T, design=T, deflator=T)
drivers_july <- subset(pnadcovid_july, C007C %in% "Motorista (de aplicativo, de taxi, de van, de mototáxi, de ônibus)" ) # only drivers
delivery_july <- subset(pnadcovid_july, C007C %in% "Entregador de mercadorias (de restaurante, de farmácia, de loja, Uber Eats, IFood, Rappy etc.)") # only delivery
#august
pnadcovid_aug <- get_covid(year=2020, month=8, vars=relevante_data, labels=T, design=T, deflator=T)
drivers_aug <- subset(pnadcovid_aug, C007C %in% "Motorista (de aplicativo, de taxi, de van, de mototáxi, de ônibus)" ) # only drivers
delivery_aug <- subset(pnadcovid_aug, C007C %in% "Entregador de mercadorias (de restaurante, de farmácia, de loja, Uber Eats, IFood, Rappy etc.)") # only delivery
#sept
pnadcovid_sept <- get_covid(year=2020, month=9, vars=relevante_data, labels=T, design=T, deflator=T)
drivers_sept <- subset(pnadcovid_sept, C007C %in% "Motorista (de aplicativo, de taxi, de van, de mototáxi, de ônibus)" ) # only drivers
delivery_sept <- subset(pnadcovid_sept, C007C %in% "Entregador de mercadorias (de restaurante, de farmácia, de loja, Uber Eats, IFood, Rappy etc.)") # only delivery
#oct
pnadcovid_oct <- get_covid(year=2020, month=10, vars=relevante_data, labels=T, design=T, deflator=T)
drivers_oct <- subset(pnadcovid_oct, C007C %in% "Motorista (de aplicativo, de taxi, de van, de mototáxi, de ônibus)" ) # only drivers
delivery_oct <- subset(pnadcovid_oct, C007C %in% "Entregador de mercadorias (de restaurante, de farmácia, de loja, Uber Eats, IFood, Rappy etc.)") # only delivery
#nov
pnadcovid_nov <- get_covid(year=2020, month=11, vars=relevante_data, labels=T, design=T, deflator=T)
drivers_nov <- subset(pnadcovid_nov, C007C %in% "Motorista (de aplicativo, de taxi, de van, de mototáxi, de ônibus)" ) # only drivers
delivery_nov <- subset(pnadcovid_nov, C007C %in% "Entregador de mercadorias (de restaurante, de farmácia, de loja, Uber Eats, IFood, Rappy etc.)") # only delivery
Um dos interesses no levantamento do banco de dados foi desvelar o contingente de motoristas e entregadores durante o período em questão, e se o número de trabalhadores aumentou durante a pandemia. Os dados são desagragados por ocupação (motoristas ou entregadores), sexo (homens ou mulheres) e mês (maio a novembro).
driver_sexoraca_may <- svytotal(x=~interaction(A003,A004), design=drivers_may, na.rm=TRUE)
write.table(stat(driver_sexoraca_may),file="drivers_sexoraca_may.csv",sep=";")
driver_sexoraca_june <- svytotal(x=~interaction(A003,A004), design=drivers_june, na.rm=TRUE)
write.table(stat(driver_sexoraca_june),file="drivers_sexoraca_june.csv",sep=";")
driver_sexoraca_july <- svytotal(x=~interaction(A003,A004), design=drivers_july, na.rm=TRUE)
write.table(stat(driver_sexoraca_july),file="drivers_sexoraca_july.csv",sep=";")
driver_sexoraca_aug <- svytotal(x=~interaction(A003,A004), design=drivers_aug, na.rm=TRUE)
write.table(stat(driver_sexoraca_aug),file="drivers_sexoraca_aug.csv",sep=";")
driver_sexoraca_sept <- svytotal(x=~interaction(A003,A004), design=drivers_sept, na.rm=TRUE)
write.table(stat(driver_sexoraca_sept),file="drivers_sexoraca_sept.csv",sep=";")
driver_sexoraca_oct <- svytotal(x=~interaction(A003,A004), design=drivers_oct, na.rm=TRUE)
write.table(stat(driver_sexoraca_oct),file="drivers_sexoraca_oct.csv",sep=";")
driver_sexoraca_nov <- svytotal(x=~interaction(A003,A004), design=drivers_nov, na.rm=TRUE)
write.table(stat(driver_sexoraca_nov),file="drivers_sexoraca_nov.csv",sep=";")
# Delivery
delivery_sexoraca_may <- svytotal(x=~interaction(A003,A004), design=delivery_may, na.rm=TRUE)
write.table(stat(delivery_sexoraca_may),file="delivery_sexoraca_may.csv",sep=";")
delivery_sexoraca_june <- svytotal(x=~interaction(A003,A004), design=delivery_june, na.rm=TRUE)
write.table(stat(delivery_sexoraca_june),file="delivery_sexoraca_june.csv",sep=";")
delivery_sexoraca_july <- svytotal(x=~interaction(A003,A004), design=delivery_july, na.rm=TRUE)
write.table(stat(delivery_sexoraca_july),file="delivery_sexoraca_july.csv",sep=";")
delivery_sexoraca_aug <- svytotal(x=~interaction(A003,A004), design=delivery_aug, na.rm=TRUE)
write.table(stat(delivery_sexoraca_aug),file="delivery_sexoraca_aug.csv",sep=";")
delivery_sexoraca_sept <- svytotal(x=~interaction(A003,A004), design=delivery_sept, na.rm=TRUE)
write.table(stat(delivery_sexoraca_sept),file="delivery_sexoraca_sept.csv",sep=";")
delivery_sexoraca_oct <- svytotal(x=~interaction(A003,A004), design=delivery_oct, na.rm=TRUE)
write.table(stat(delivery_sexoraca_oct),file="delivery_sexoraca_oct.csv",sep=";")
delivery_sexoraca_nov <- svytotal(x=~interaction(A003,A004), design=delivery_nov, na.rm=TRUE)
write.table(stat(delivery_sexoraca_nov),file="delivery_sexoraca_nov.csv",sep=";")
Finalmente, é possível realizar uma análise visual de algumas variáveis perscrutadas nesse exercício exploratório do banco de dados da PNAD-Covid-19. Na presente análise, optamos por escolaridade (por categoria), tempo disponível ao trabalho (segmentado por sexo e categoria), renda semanal (também por sexo e categoria) e relação entre tempo disponível ao trabalho e remuneração (segmentado por categoria, apenas). Os resultados podem ser visualizados nas imagens a seguir.
svyhist(formula=~as.numeric(A005), design = drivers_may, main = " ",
ylab="Densidade", ylim=c(0,1), xlab = "Escolaridade",
labels=F, col="aquamarine3")
svyhist(formula=~as.numeric(A005), design = drivers_may, main = " ",
ylab="Densidade", ylim=c(0,1), xlab = "Escolaridade",
labels=F, col="aquamarine3")
svyhist(formula=~as.numeric(A005), design = drivers_june, main = " ",
ylab="Densidade", ylim=c(0,1), xlab = "Escolaridade",
labels=F, col="aquamarine3")
svyhist(formula=~as.numeric(A005), design = drivers_july, main = " ",
ylab="Densidade", ylim=c(0,1), xlab = "Escolaridade",
labels=F, col="aquamarine3")
svyhist(formula=~as.numeric(A005), design = drivers_aug, main = " ",
ylab="Densidade", ylim=c(0,1), xlab = "Escolaridade",
labels=F, col="aquamarine3")
svyhist(formula=~as.numeric(A005), design = drivers_sept, main = " ",
ylab="Densidade", ylim=c(0,1), xlab = "Escolaridade",
labels=F, col="aquamarine3")
svyhist(formula=~as.numeric(A005), design = drivers_oct, main = " ",
ylab="Densidade", ylim=c(0,1), xlab = "Escolaridade",
labels=F, col="aquamarine3")
svyhist(formula=~as.numeric(A005), design = drivers_nov, main = " ",
ylab="Densidade", ylim=c(0,1), xlab = "Escolaridade",
labels=F, col="aquamarine3")
Escolaridade dos motoristas
svyhist(formula=~as.numeric(A005), design = delivery_may, main = " ",
ylab="Densidade", ylim=c(0,1), xlab = "Escolaridade",
labels=F, col="lightgoldenrod")
svyhist(formula=~as.numeric(A005), design = delivery_june, main = " ",
ylab="Densidade", ylim=c(0,1), xlab = "Escolaridade",
labels=F, col="lightgoldenrod")
svyhist(formula=~as.numeric(A005), design = delivery_july, main = " ",
ylab="Densidade", ylim=c(0,1), xlab = "Escolaridade",
labels=F, col="lightgoldenrod")
svyhist(formula=~as.numeric(A005), design = delivery_aug, main = " ",
ylab="Densidade", ylim=c(0,1), xlab = "Escolaridade",
labels=F, col="lightgoldenrod")
svyhist(formula=~as.numeric(A005), design = delivery_sept, main = " ",
ylab="Densidade", ylim=c(0,1), xlab = "Escolaridade",
labels=F, col="lightgoldenrod")
svyhist(formula=~as.numeric(A005), design = delivery_oct, main = " ",
ylab="Densidade", ylim=c(0,1), xlab = "Escolaridade",
labels=F, col="lightgoldenrod")
svyhist(formula=~as.numeric(A005), design = delivery_nov, main = " ",
ylab="Densidade", ylim=c(0,1), xlab = "Escolaridade",
labels=F, col="lightgoldenrod")
Escolaridade dos entregadores
svyboxplot(formula=C008~A003, design=drivers_may, na.rm =T,
ylab= "Tempo disponível ao trabalho (h)", ylim=c(0, 120), col="aquamarine3")
svyboxplot(formula=C008~A003, design=drivers_june, na.rm =T,
ylab= "Tempo disponível ao trabalho (h)", ylim=c(0, 120), col="aquamarine3")
svyboxplot(formula=C008~A003, design=drivers_july, na.rm =T,
ylab= "Tempo disponível ao trabalho (h)", ylim=c(0, 120), col="aquamarine3")
svyboxplot(formula=C008~A003, design=drivers_aug, na.rm =T,
ylab= "Tempo disponível ao trabalho (h)", ylim=c(0, 120), col="aquamarine3")
svyboxplot(formula=C008~A003, design=drivers_sept, na.rm =T,
ylab= "Tempo disponível ao trabalho (h)", ylim=c(0, 120), col="aquamarine3")
svyboxplot(formula=C008~A003, design=drivers_oct, na.rm =T,
ylab= "Tempo disponível ao trabalho (h)", ylim=c(0, 120), col="aquamarine3")
svyboxplot(formula=C008~A003, design=drivers_nov, na.rm =T,
ylab= "Tempo disponível ao trabalho (h)", ylim=c(0, 120), col="aquamarine3")
Tempo disponível ao trabalho por gênero: Motoristas
svyboxplot(formula=C008~A003, design=delivery_may, na.rm =T,
ylab= "Tempo disponível ao trabalho (h)", ylim=c(0, 120), col="lightgoldenrod")
svyboxplot(formula=C008~A003, design=delivery_june, na.rm =T,
ylab= "Tempo disponível ao trabalho (h)", ylim=c(0, 120), col="lightgoldenrod")
svyboxplot(formula=C008~A003, design=delivery_july, na.rm =T,
ylab= "Tempo disponível ao trabalho (h)", ylim=c(0, 120), col="lightgoldenrod")
svyboxplot(formula=C008~A003, design=delivery_aug, na.rm =T,
ylab= "Tempo disponível ao trabalho (h)", ylim=c(0, 120), col="lightgoldenrod")
svyboxplot(formula=C008~A003, design=delivery_sept, na.rm =T,
ylab= "Tempo disponível ao trabalho (h)", ylim=c(0, 120), col="lightgoldenrod")
svyboxplot(formula=C008~A003, design=delivery_oct, na.rm =T,
ylab= "Tempo disponível ao trabalho (h)", ylim=c(0, 120), col="lightgoldenrod")
svyboxplot(formula=C008~A003, design=delivery_nov, na.rm =T,
ylab= "Tempo disponível ao trabalho (h)", ylim=c(0, 120), col="lightgoldenrod")
Tempo disponível ao trabalho por gênero: Entregadores
svyboxplot(formula=C01012~A003, design=drivers_may, na.rm =T,
ylim=c(0, 10000), ylab="Renda semanal (R$)", col="aquamarine3")
svyboxplot(formula=C01012~A003, design=drivers_june, na.rm =T,
ylim=c(0, 10000), ylab="Renda semanal (R$)", col="aquamarine3")
svyboxplot(formula=C01012~A003, design=drivers_july, na.rm =T,
ylim=c(0, 10000), ylab="Renda semanal (R$)", col="aquamarine3")
svyboxplot(formula=C01012~A003, design=drivers_aug, na.rm =T,
ylim=c(0, 10000), ylab="Renda semanal (R$)", col="aquamarine3")
svyboxplot(formula=C01012~A003, design=drivers_sept, na.rm =T,
ylim=c(0, 10000), ylab="Renda semanal (R$)", col="aquamarine3")
svyboxplot(formula=C01012~A003, design=drivers_oct, na.rm =T,
ylim=c(0, 10000), ylab="Renda semanal (R$)", col="aquamarine3")
svyboxplot(formula=C01012~A003, design=drivers_nov, na.rm =T,
ylim=c(0, 10000), ylab="Renda semanal (R$)", col="aquamarine3")
Renda média semanal por gênero: Motoristas
svyboxplot(formula=C01012~A003, design=delivery_may, na.rm =T,
ylim=c(0, 10000), ylab="Renda semanal (R$)", col="lightgoldenrod")
svyboxplot(formula=C01012~A003, design=delivery_june, na.rm =T,
ylim=c(0, 10000), ylab="Renda semanal (R$)", col="lightgoldenrod")
svyboxplot(formula=C01012~A003, design=delivery_july, na.rm =T,
ylim=c(0, 10000), ylab="Renda semanal (R$)", col="lightgoldenrod")
svyboxplot(formula=C01012~A003, design=delivery_aug, na.rm =T,
ylim=c(0, 10000), ylab="Renda semanal (R$)", col="lightgoldenrod")
svyboxplot(formula=C01012~A003, design=delivery_sept, na.rm =T,
ylim=c(0, 10000), ylab="Renda semanal (R$)", col="lightgoldenrod")
svyboxplot(formula=C01012~A003, design=delivery_oct, na.rm =T,
ylim=c(0, 10000), ylab="Renda semanal (R$)", col="lightgoldenrod")
svyboxplot(formula=C01012~A003, design=delivery_nov, na.rm =T,
ylim=c(0, 10000), ylab="Renda semanal (R$)", col="lightgoldenrod")
Renda média semanal por gênero: Entregadores
svyplot(formula=C01012~C008, design=drivers_may, style=("bubble"),
xlab="Horas semanais disponíveis ao trabalho", ylab="Rendimentos motoristas (R$)",
ylim=c(0,200000))
svyplot(formula=C01012~C008, design=drivers_june, style=("bubble"),
xlab="Horas semanais disponíveis ao trabalho", ylab="Rendimentos motoristas (R$)",
ylim=c(0,200000))
svyplot(formula=C01012~C008, design=drivers_july, style=("bubble"),
xlab="Horas semanais disponíveis ao trabalho", ylab="Rendimentos motoristas (R$)",
ylim=c(0,200000))
svyplot(formula=C01012~C008, design=drivers_aug, style=("bubble"),
xlab="Horas semanais disponíveis ao trabalho", ylab="Rendimentos motoristas (R$)",
ylim=c(0,200000))
svyplot(formula=C01012~C008, design=drivers_sept, style=("bubble"),
xlab="Horas semanais disponíveis ao trabalho", ylab="Rendimentos motoristas (R$)",
ylim=c(0,200000))
svyplot(formula=C01012~C008, design=drivers_oct, style=("bubble"),
xlab="Horas semanais disponíveis ao trabalho", ylab="Rendimentos motoristas (R$)",
ylim=c(0,200000))
svyplot(formula=C01012~C008, design=drivers_nov, style=("bubble"),
xlab="Horas semanais disponíveis ao trabalho", ylab="Rendimentos motoristas (R$)",
ylim=c(0,200000))
Remuneração em função das horas disponíveis ao trabalho: Motoristas
svyplot(formula=C01012~C008, design=delivery_may, style=("bubble"),
xlab="Horas semanais disponíveis ao trabalho", ylab="Rendimentos entregadores (R$)",
ylim=c(0,200000))
svyplot(formula=C01012~C008, design=delivery_june, style=("bubble"),
xlab="Horas semanais disponíveis ao trabalho", ylab="Rendimentos entregadores (R$)",
ylim=c(0,200000))
svyplot(formula=C01012~C008, design=delivery_july, style=("bubble"),
xlab="Horas semanais disponíveis ao trabalho", ylab="Rendimentos entregadores (R$)",
ylim=c(0,200000))
svyplot(formula=C01012~C008, design=delivery_aug, style=("bubble"),
xlab="Horas semanais disponíveis ao trabalho", ylab="Rendimentos entregadores (R$)",
ylim=c(0,200000))
svyplot(formula=C01012~C008, design=delivery_sept, style=("bubble"),
xlab="Horas semanais disponíveis ao trabalho", ylab="Rendimentos entregadores (R$)",
ylim=c(0,200000))
svyplot(formula=C01012~C008, design=delivery_oct, style=("bubble"),
xlab="Horas semanais disponíveis ao trabalho", ylab="Rendimentos entregadores (R$)",
ylim=c(0,200000))
svyplot(formula=C01012~C008, design=delivery_nov, style=("bubble"),
xlab="Horas semanais disponíveis ao trabalho", ylab="Rendimentos entregadores (R$)",
ylim=c(0,200000))
Remuneração em função das horas disponíveis ao trabalho: Entregadores