library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.1
library(scales)
## Warning: package 'scales' was built under R version 4.3.1
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.3.1
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.3.1
## Warning: package 'tidyr' was built under R version 4.3.1
## Warning: package 'readr' was built under R version 4.3.1
## Warning: package 'purrr' was built under R version 4.3.1
## Warning: package 'forcats' was built under R version 4.3.1
## Warning: package 'lubridate' was built under R version 4.3.1
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ lubridate 1.9.2 ✔ tibble 3.2.1
## ✔ purrr 1.0.1 ✔ tidyr 1.3.0
## ✔ readr 2.1.4
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ readr::col_factor() masks scales::col_factor()
## ✖ purrr::discard() masks scales::discard()
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(tidyselect)
## Warning: package 'tidyselect' was built under R version 4.3.1
library(epitools)
library(DescTools)
## Warning: package 'DescTools' was built under R version 4.3.1
library(caTools)
## Warning: package 'caTools' was built under R version 4.3.1
library(RVAideMemoire)
## Warning: package 'RVAideMemoire' was built under R version 4.3.1
## *** Package RVAideMemoire v 0.9-83 ***
library(readxl)
PTDLDT <- read_excel("C:/Users/Abc/Downloads/PTDLDT.xlsx")
View(PTDLDT)
PTDLDT
## # A tibble: 607 × 11
## work_year experience_level employment_type job_title salary salary_currency
## <dbl> <chr> <chr> <chr> <dbl> <chr>
## 1 2020 MI FT Data Scien… 7 e4 EUR
## 2 2020 SE FT Machine Le… 2.6 e5 USD
## 3 2020 SE FT Big Data E… 8.5 e4 GBP
## 4 2020 MI FT Product Da… 2 e4 USD
## 5 2020 SE FT Machine Le… 1.5 e5 USD
## 6 2020 EN FT Data Analy… 7.20e4 USD
## 7 2020 SE FT Lead Data … 1.9 e5 USD
## 8 2020 MI FT Data Scien… 1.10e7 HUF
## 9 2020 MI FT Business D… 1.35e5 USD
## 10 2020 SE FT Lead Data … 1.25e5 USD
## # ℹ 597 more rows
## # ℹ 5 more variables: salary_in_usd <dbl>, employee_residence <chr>,
## # remote_ratio <dbl>, company_location <chr>, company_size <chr>
salary_in_usd<-PTDLDT$salary_in_usd
job_title<-PTDLDT$job_title
work_year<-PTDLDT$work_year
experience_level<-PTDLDT$experience_level
employment_type<-PTDLDT$employment_type
company_size<-PTDLDT$company_size
company_location<-PTDLDT$company_location
salary<-PTDLDT$salary
remote_ratio<-PTDLDT$remote_ratio
2.1. Thống kê mô tả cho các biến
2.1.1. Thống kê mô tả cho biến salary_in_usd
# 6 thống kê cơ bản cho biến salary_in_usd
summary(PTDLDT$salary_in_usd)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2859 62726 101570 112298 150000 600000
PTDLDT<-data.frame(salary_in_usd)
PTDLDT
## salary_in_usd
## 1 79833
## 2 260000
## 3 109024
## 4 20000
## 5 150000
## 6 72000
## 7 190000
## 8 35735
## 9 135000
## 10 125000
## 11 51321
## 12 40481
## 13 39916
## 14 87000
## 15 85000
## 16 8000
## 17 41689
## 18 114047
## 19 5707
## 20 56000
## 21 43331
## 22 6072
## 23 47899
## 24 98000
## 25 115000
## 26 325000
## 27 42000
## 28 33511
## 29 100000
## 30 117104
## 31 59303
## 32 70000
## 33 68428
## 34 450000
## 35 46759
## 36 74130
## 37 103000
## 38 250000
## 39 10000
## 40 138000
## 41 45760
## 42 79833
## 43 50180
## 44 106000
## 45 112872
## 46 15966
## 47 76958
## 48 188000
## 49 105000
## 50 70139
## 51 6072
## 52 91000
## 53 45896
## 54 54742
## 55 60000
## 56 148261
## 57 38776
## 58 118000
## 59 120000
## 60 138350
## 61 110000
## 62 130800
## 63 21669
## 64 412000
## 65 45618
## 66 62726
## 67 49268
## 68 190200
## 69 105000
## 70 91237
## 71 62726
## 72 42197
## 73 82528
## 74 150000
## 75 235000
## 76 53192
## 77 100000
## 78 5409
## 79 270000
## 80 80000
## 81 79197
## 82 140000
## 83 54238
## 84 47282
## 85 153667
## 86 28476
## 87 59102
## 88 110000
## 89 170000
## 90 80000
## 91 88654
## 92 76833
## 93 19609
## 94 276000
## 95 29751
## 96 89294
## 97 12000
## 98 450000
## 99 70000
## 100 95746
## 101 75000
## 102 150000
## 103 36259
## 104 62000
## 105 73000
## 106 51519
## 107 187442
## 108 115000
## 109 150000
## 110 30428
## 111 94564
## 112 113476
## 113 103160
## 114 12000
## 115 45391
## 116 225000
## 117 50000
## 118 40189
## 119 90000
## 120 200000
## 121 60000
## 122 200000
## 123 50000
## 124 110037
## 125 10354
## 126 151000
## 127 120000
## 128 9466
## 129 20000
## 130 40570
## 131 100000
## 132 49646
## 133 38400
## 134 24000
## 135 100000
## 136 90000
## 137 63711
## 138 77364
## 139 220000
## 140 80000
## 141 135000
## 142 240000
## 143 150000
## 144 82500
## 145 100000
## 146 82744
## 147 62649
## 148 90000
## 149 153000
## 150 160000
## 151 168000
## 152 150000
## 153 75774
## 154 13400
## 155 144000
## 156 127221
## 157 119059
## 158 423000
## 159 120000
## 160 125000
## 161 230000
## 162 85000
## 163 28369
## 164 63831
## 165 130026
## 166 165000
## 167 80000
## 168 250000
## 169 55000
## 170 150000
## 171 170000
## 172 82528
## 173 60000
## 174 235000
## 175 60757
## 176 174000
## 177 2859
## 178 40038
## 179 81000
## 180 5679
## 181 22611
## 182 90734
## 183 26005
## 184 61896
## 185 12000
## 186 4000
## 187 50000
## 188 69741
## 189 76833
## 190 74000
## 191 152000
## 192 21844
## 193 18000
## 194 174000
## 195 96113
## 196 147000
## 197 9272
## 198 24342
## 199 54094
## 200 90000
## 201 61467
## 202 195000
## 203 37825
## 204 50000
## 205 160000
## 206 12901
## 207 200000
## 208 165000
## 209 20000
## 210 120000
## 211 24823
## 212 56738
## 213 66022
## 214 5882
## 215 24823
## 216 185000
## 217 28609
## 218 90734
## 219 88654
## 220 140000
## 221 46597
## 222 116914
## 223 33808
## 224 56256
## 225 225000
## 226 416000
## 227 87738
## 228 88654
## 229 135000
## 230 71786
## 231 16228
## 232 256000
## 233 200000
## 234 200000
## 235 180000
## 236 110000
## 237 63810
## 238 46809
## 239 4000
## 240 21637
## 241 103691
## 242 80000
## 243 110000
## 244 165000
## 245 18053
## 246 72212
## 247 36643
## 248 12103
## 249 96282
## 250 170000
## 251 115000
## 252 90000
## 253 600000
## 254 28399
## 255 93000
## 256 99703
## 257 200000
## 258 173762
## 259 185000
## 260 141846
## 261 130000
## 262 63831
## 263 16904
## 264 66265
## 265 25532
## 266 160000
## 267 93150
## 268 111775
## 269 28016
## 270 65013
## 271 72500
## 272 18907
## 273 76833
## 274 85000
## 275 77684
## 276 100000
## 277 58000
## 278 55000
## 279 20171
## 280 59102
## 281 112000
## 282 100000
## 283 69741
## 284 105000
## 285 69999
## 286 94665
## 287 102839
## 288 109000
## 289 51064
## 290 135000
## 291 155000
## 292 120600
## 293 130000
## 294 90000
## 295 170000
## 296 150000
## 297 102100
## 298 84900
## 299 136620
## 300 99360
## 301 117789
## 302 104702
## 303 146000
## 304 123000
## 305 52351
## 306 99000
## 307 116000
## 308 106260
## 309 126500
## 310 242000
## 311 200000
## 312 65438
## 313 39263
## 314 78526
## 315 52351
## 316 165220
## 317 45807
## 318 120160
## 319 90320
## 320 181940
## 321 132320
## 322 220110
## 323 160080
## 324 180000
## 325 120000
## 326 124190
## 327 130000
## 328 110000
## 329 170000
## 330 115500
## 331 112900
## 332 90320
## 333 112900
## 334 90320
## 335 165400
## 336 132320
## 337 167000
## 338 243900
## 339 136600
## 340 109280
## 341 128875
## 342 93700
## 343 224000
## 344 167875
## 345 175000
## 346 156600
## 347 108800
## 348 95550
## 349 113000
## 350 135000
## 351 161342
## 352 137141
## 353 167000
## 354 123000
## 355 78526
## 356 65438
## 357 150000
## 358 211500
## 359 192400
## 360 90700
## 361 130000
## 362 61300
## 363 130000
## 364 61300
## 365 160000
## 366 138600
## 367 136000
## 368 58000
## 369 135000
## 370 170000
## 371 123000
## 372 189650
## 373 164996
## 374 54957
## 375 54957
## 376 118187
## 377 132000
## 378 165400
## 379 208775
## 380 147800
## 381 136994
## 382 101570
## 383 128875
## 384 93700
## 385 79039
## 386 132320
## 387 37300
## 388 164000
## 389 155000
## 390 124333
## 391 98158
## 392 120000
## 393 112900
## 394 90320
## 395 145000
## 396 105400
## 397 87932
## 398 117789
## 399 215300
## 400 158200
## 401 209100
## 402 154600
## 403 115934
## 404 81666
## 405 175000
## 406 98158
## 407 58000
## 408 183600
## 409 52351
## 410 180000
## 411 71982
## 412 45807
## 413 65949
## 414 49461
## 415 78526
## 416 58894
## 417 260000
## 418 60000
## 419 63900
## 420 160000
## 421 112300
## 422 241000
## 423 159000
## 424 180000
## 425 80000
## 426 82900
## 427 100800
## 428 49461
## 429 140400
## 430 39263
## 431 43966
## 432 32974
## 433 87932
## 434 76940
## 435 104702
## 436 91614
## 437 65949
## 438 87932
## 439 189650
## 440 164996
## 441 43966
## 442 32974
## 443 98158
## 444 78526
## 445 215300
## 446 76940
## 447 209100
## 448 154600
## 449 180000
## 450 21983
## 451 80000
## 452 78791
## 453 196979
## 454 120000
## 455 125000
## 456 37236
## 457 105000
## 458 87932
## 459 18442
## 460 31615
## 461 58255
## 462 100000
## 463 54957
## 464 18442
## 465 162674
## 466 120000
## 467 144000
## 468 104890
## 469 100000
## 470 140000
## 471 135000
## 472 50000
## 473 220000
## 474 140000
## 475 183228
## 476 91614
## 477 185100
## 478 220000
## 479 200000
## 480 120000
## 481 120000
## 482 65000
## 483 324000
## 484 216000
## 485 210000
## 486 120000
## 487 230000
## 488 100000
## 489 100000
## 490 31875
## 491 200000
## 492 75000
## 493 35590
## 494 78791
## 495 100000
## 496 153000
## 497 58035
## 498 165000
## 499 93427
## 500 52396
## 501 62651
## 502 32974
## 503 40000
## 504 87425
## 505 115000
## 506 86703
## 507 75000
## 508 64849
## 509 120000
## 510 157000
## 511 150000
## 512 70912
## 513 65000
## 514 71444
## 515 20000
## 516 48000
## 517 152500
## 518 68147
## 519 122346
## 520 380000
## 521 69336
## 522 10000
## 523 20000
## 524 405000
## 525 135000
## 526 177000
## 527 78000
## 528 135000
## 529 100000
## 530 90320
## 531 85000
## 532 75000
## 533 214000
## 534 192600
## 535 266400
## 536 213120
## 537 112900
## 538 155000
## 539 141300
## 540 102100
## 541 115934
## 542 81666
## 543 206699
## 544 99100
## 545 130000
## 546 115000
## 547 110500
## 548 130000
## 549 99050
## 550 160000
## 551 205300
## 552 140400
## 553 176000
## 554 144000
## 555 200100
## 556 160000
## 557 145000
## 558 70500
## 559 205300
## 560 140400
## 561 205300
## 562 184700
## 563 175100
## 564 140250
## 565 116150
## 566 54000
## 567 170000
## 568 65438
## 569 80000
## 570 140000
## 571 210000
## 572 140000
## 573 100000
## 574 69000
## 575 210000
## 576 140000
## 577 210000
## 578 150075
## 579 100000
## 580 25000
## 581 126500
## 582 106260
## 583 220110
## 584 160080
## 585 105000
## 586 110925
## 587 45807
## 588 140000
## 589 99000
## 590 60000
## 591 192564
## 592 144854
## 593 230000
## 594 150000
## 595 150260
## 596 109280
## 597 210000
## 598 170000
## 599 160000
## 600 130000
## 601 67000
## 602 52000
## 603 154000
## 604 126000
## 605 129000
## 606 150000
## 607 200000
# Ngũ phân vị cho biến salary_in_usd
quantile(PTDLDT$salary_in_usd)
## 0% 25% 50% 75% 100%
## 2859 62726 101570 150000 600000
hist(salary_in_usd, main="The Distribution of Salaries", xlab="salary_in_usd")
plot(density(salary_in_usd),add=TRUE)
## Warning in plot.window(...): "add" is not a graphical parameter
## Warning in plot.xy(xy, type, ...): "add" is not a graphical parameter
## Warning in axis(side = side, at = at, labels = labels, ...): "add" is not a
## graphical parameter
## Warning in axis(side = side, at = at, labels = labels, ...): "add" is not a
## graphical parameter
## Warning in box(...): "add" is not a graphical parameter
## Warning in title(...): "add" is not a graphical parameter
Mức lương dao động trong khoảng $2.859 và $600.000 USD và phân phối có xu hướng ở bên trái. Mức lương trung bình là $112,298.
2.1.2. Thống kê mô tả cho biến job_title
# 6 thống kê cơ bản cho biến job_title
summary(PTDLDT$job_title )
## Length Class Mode
## 0 NULL NULL
table(PTDLDT$job_title)
## < table of extent 0 >
table(PTDLDT$job_title)/sum(table(PTDLDT$job_title))
## numeric(0)
PTDLDT<-data.frame(job_title)
PTDLDT
## job_title
## 1 Data Scientist
## 2 Machine Learning Scientist
## 3 Big Data Engineer
## 4 Product Data Analyst
## 5 Machine Learning Engineer
## 6 Data Analyst
## 7 Lead Data Scientist
## 8 Data Scientist
## 9 Business Data Analyst
## 10 Lead Data Engineer
## 11 Data Scientist
## 12 Data Scientist
## 13 Data Scientist
## 14 Lead Data Analyst
## 15 Data Analyst
## 16 Data Analyst
## 17 Data Engineer
## 18 Big Data Engineer
## 19 Data Science Consultant
## 20 Lead Data Engineer
## 21 Machine Learning Engineer
## 22 Product Data Analyst
## 23 Data Engineer
## 24 BI Data Analyst
## 25 Lead Data Scientist
## 26 Director of Data Science
## 27 Research Scientist
## 28 Data Engineer
## 29 Business Data Analyst
## 30 Machine Learning Manager
## 31 Data Engineering Manager
## 32 Big Data Engineer
## 33 Data Scientist
## 34 Research Scientist
## 35 Data Analyst
## 36 Data Engineer
## 37 Data Science Consultant
## 38 Machine Learning Engineer
## 39 Data Analyst
## 40 Machine Learning Engineer
## 41 Data Scientist
## 42 Data Engineering Manager
## 43 Machine Learning Infrastructure Engineer
## 44 Data Engineer
## 45 Data Engineer
## 46 ML Engineer
## 47 Data Scientist
## 48 Data Engineer
## 49 Data Scientist
## 50 Data Engineer
## 51 Data Analyst
## 52 Data Analyst
## 53 AI Scientist
## 54 Data Engineer
## 55 Computer Vision Engineer
## 56 Principal Data Scientist
## 57 Data Scientist
## 58 Data Scientist
## 59 Data Scientist
## 60 Data Scientist
## 61 Data Engineer
## 62 Data Engineer
## 63 Data Scientist
## 64 Data Scientist
## 65 Machine Learning Engineer
## 66 Data Scientist
## 67 Data Scientist
## 68 Data Science Manager
## 69 Data Scientist
## 70 Data Scientist
## 71 Data Scientist
## 72 Data Scientist
## 73 Research Scientist
## 74 BI Data Analyst
## 75 Head of Data
## 76 Data Scientist
## 77 BI Data Analyst
## 78 3D Computer Vision Researcher
## 79 ML Engineer
## 80 Data Analyst
## 81 Data Analytics Engineer
## 82 Data Engineer
## 83 Applied Data Scientist
## 84 Machine Learning Engineer
## 85 Director of Data Science
## 86 Data Engineer
## 87 Data Analyst
## 88 Data Analytics Engineer
## 89 Lead Data Analyst
## 90 Data Analyst
## 91 Marketing Data Analyst
## 92 Data Science Consultant
## 93 Lead Data Analyst
## 94 Lead Data Engineer
## 95 Data Scientist
## 96 Cloud Data Engineer
## 97 AI Scientist
## 98 Financial Data Analyst
## 99 Computer Vision Software Engineer
## 100 Computer Vision Software Engineer
## 101 Data Analyst
## 102 Data Engineer
## 103 BI Data Analyst
## 104 Data Analyst
## 105 Data Scientist
## 106 Data Analyst
## 107 Research Scientist
## 108 Data Engineer
## 109 Data Engineer
## 110 Data Engineer
## 111 Machine Learning Engineer
## 112 Director of Data Engineering
## 113 Lead Data Engineer
## 114 AI Scientist
## 115 Data Engineer
## 116 Machine Learning Scientist
## 117 Data Scientist
## 118 Data Science Engineer
## 119 Data Analyst
## 120 Data Engineer
## 121 Big Data Engineer
## 122 Principal Data Engineer
## 123 Data Analyst
## 124 Applied Data Scientist
## 125 Data Analyst
## 126 Principal Data Scientist
## 127 Machine Learning Scientist
## 128 Data Scientist
## 129 Machine Learning Engineer
## 130 Lead Data Scientist
## 131 Machine Learning Developer
## 132 Data Scientist
## 133 Applied Machine Learning Scientist
## 134 Computer Vision Engineer
## 135 Data Scientist
## 136 Data Analyst
## 137 ML Engineer
## 138 ML Engineer
## 139 Principal Data Scientist
## 140 Data Scientist
## 141 Data Analyst
## 142 Data Science Manager
## 143 Data Engineering Manager
## 144 Data Scientist
## 145 Data Engineer
## 146 Machine Learning Engineer
## 147 Research Scientist
## 148 Data Engineer
## 149 Data Engineering Manager
## 150 Cloud Data Engineer
## 151 Director of Data Science
## 152 Data Scientist
## 153 Data Scientist
## 154 Data Scientist
## 155 Data Science Manager
## 156 Data Science Engineer
## 157 Data Scientist
## 158 Applied Machine Learning Scientist
## 159 Data Analytics Manager
## 160 Machine Learning Engineer
## 161 Head of Data
## 162 Head of Data Science
## 163 Data Engineer
## 164 Data Science Consultant
## 165 Director of Data Science
## 166 Data Specialist
## 167 Data Engineer
## 168 Director of Data Science
## 169 BI Data Analyst
## 170 Data Architect
## 171 Data Architect
## 172 Data Engineer
## 173 Data Analyst
## 174 Principal Data Scientist
## 175 Research Scientist
## 176 Data Engineering Manager
## 177 Data Scientist
## 178 Data Scientist
## 179 Machine Learning Engineer
## 180 Data Scientist
## 181 Big Data Engineer
## 182 Data Scientist
## 183 Data Engineer
## 184 Finance Data Analyst
## 185 Machine Learning Scientist
## 186 Data Engineer
## 187 Data Analytics Engineer
## 188 Data Science Consultant
## 189 Data Engineer
## 190 Machine Learning Engineer
## 191 Data Science Manager
## 192 Machine Learning Engineer
## 193 Big Data Engineer
## 194 Data Science Manager
## 195 Research Scientist
## 196 Data Scientist
## 197 BI Data Analyst
## 198 Machine Learning Engineer
## 199 Data Science Manager
## 200 Data Science Consultant
## 201 Data Scientist
## 202 Machine Learning Infrastructure Engineer
## 203 Data Scientist
## 204 Research Scientist
## 205 Data Scientist
## 206 Data Scientist
## 207 Machine Learning Engineer
## 208 Data Engineer
## 209 Data Engineer
## 210 Data Analytics Manager
## 211 Machine Learning Engineer
## 212 Research Scientist
## 213 Data Engineer
## 214 Big Data Engineer
## 215 Machine Learning Engineer
## 216 Principal Data Engineer
## 217 Computer Vision Engineer
## 218 Data Scientist
## 219 Machine Learning Engineer
## 220 Data Analytics Manager
## 221 Machine Learning Engineer
## 222 Data Scientist
## 223 Data Scientist
## 224 Data Scientist
## 225 Machine Learning Scientist
## 226 Principal Data Scientist
## 227 Data Scientist
## 228 Data Scientist
## 229 Data Scientist
## 230 Data Analyst
## 231 Big Data Engineer
## 232 ML Engineer
## 233 Director of Data Engineering
## 234 Data Analyst
## 235 Data Architect
## 236 Head of Data Science
## 237 Research Scientist
## 238 Data Scientist
## 239 Data Scientist
## 240 Data Engineer
## 241 Data Scientist
## 242 Data Analyst
## 243 Data Engineer
## 244 Data Scientist
## 245 AI Scientist
## 246 Data Engineer
## 247 Data Scientist
## 248 Data Engineer
## 249 Data Engineer
## 250 Principal Data Analyst
## 251 Data Scientist
## 252 Data Scientist
## 253 Principal Data Engineer
## 254 Data Scientist
## 255 Data Analyst
## 256 Big Data Architect
## 257 Data Engineer
## 258 Principal Data Scientist
## 259 Machine Learning Engineer
## 260 Director of Data Science
## 261 Data Scientist
## 262 Data Analyst
## 263 Data Scientist
## 264 Machine Learning Engineer
## 265 Data Scientist
## 266 Lead Data Engineer
## 267 Data Engineer
## 268 Data Engineer
## 269 Data Engineer
## 270 Data Engineer
## 271 Data Engineer
## 272 Computer Vision Engineer
## 273 Data Science Consultant
## 274 Machine Learning Engineer
## 275 Data Scientist
## 276 Data Scientist
## 277 Data Scientist
## 278 AI Scientist
## 279 Data Scientist
## 280 Business Data Analyst
## 281 Data Engineer
## 282 Research Scientist
## 283 Data Engineer
## 284 Staff Data Scientist
## 285 Research Scientist
## 286 Data Science Manager
## 287 Head of Data
## 288 Data Scientist
## 289 Machine Learning Engineer
## 290 Data Engineer
## 291 Data Analyst
## 292 Data Analyst
## 293 Data Scientist
## 294 Data Scientist
## 295 Data Engineer
## 296 Data Engineer
## 297 Data Analyst
## 298 Data Analyst
## 299 Data Scientist
## 300 Data Scientist
## 301 Data Scientist
## 302 Data Scientist
## 303 Data Scientist
## 304 Data Scientist
## 305 Data Engineer
## 306 Data Analyst
## 307 Data Analyst
## 308 Data Analyst
## 309 Data Analyst
## 310 Data Engineer
## 311 Data Engineer
## 312 Data Scientist
## 313 Data Scientist
## 314 Data Engineer
## 315 Data Engineer
## 316 Data Scientist
## 317 Data Engineer
## 318 Data Scientist
## 319 Data Analyst
## 320 Data Engineer
## 321 Data Engineer
## 322 Data Engineer
## 323 Data Engineer
## 324 Data Scientist
## 325 Data Scientist
## 326 Data Analyst
## 327 Data Analyst
## 328 Data Analyst
## 329 Data Analyst
## 330 Data Analyst
## 331 Data Analyst
## 332 Data Analyst
## 333 Data Analyst
## 334 Data Analyst
## 335 Data Engineer
## 336 Data Engineer
## 337 Data Analyst
## 338 Data Engineer
## 339 Data Analyst
## 340 Data Analyst
## 341 Data Engineer
## 342 Data Engineer
## 343 Head of Data Science
## 344 Head of Data Science
## 345 Analytics Engineer
## 346 Data Engineer
## 347 Data Engineer
## 348 Data Scientist
## 349 Data Engineer
## 350 Data Analyst
## 351 Data Science Manager
## 352 Data Science Manager
## 353 Data Scientist
## 354 Data Scientist
## 355 Data Engineer
## 356 Data Engineer
## 357 Data Scientist
## 358 Data Scientist
## 359 Data Architect
## 360 Data Architect
## 361 Data Analyst
## 362 Data Analyst
## 363 Data Analyst
## 364 Data Analyst
## 365 Data Engineer
## 366 Data Scientist
## 367 Data Engineer
## 368 Data Analyst
## 369 Analytics Engineer
## 370 Data Scientist
## 371 Data Scientist
## 372 Machine Learning Engineer
## 373 Machine Learning Engineer
## 374 ETL Developer
## 375 ETL Developer
## 376 Lead Data Engineer
## 377 Data Analyst
## 378 Data Engineer
## 379 Data Architect
## 380 Data Architect
## 381 Data Engineer
## 382 Data Engineer
## 383 Data Analyst
## 384 Data Analyst
## 385 Head of Machine Learning
## 386 Data Engineer
## 387 Machine Learning Engineer
## 388 Data Analyst
## 389 Data Engineer
## 390 Machine Learning Engineer
## 391 Machine Learning Engineer
## 392 AI Scientist
## 393 Data Analyst
## 394 Data Analyst
## 395 Data Analytics Manager
## 396 Data Analytics Manager
## 397 Machine Learning Engineer
## 398 Data Engineer
## 399 Data Scientist
## 400 Data Scientist
## 401 Data Engineer
## 402 Data Engineer
## 403 Data Analyst
## 404 Data Analyst
## 405 Data Engineer
## 406 Data Engineer
## 407 Data Analyst
## 408 Data Engineer
## 409 Data Analyst
## 410 Data Scientist
## 411 Data Scientist
## 412 Data Scientist
## 413 Data Engineer
## 414 Data Engineer
## 415 Data Engineer
## 416 Data Engineer
## 417 Data Scientist
## 418 Data Science Engineer
## 419 Data Engineer
## 420 Machine Learning Scientist
## 421 Machine Learning Scientist
## 422 Data Science Manager
## 423 Data Science Manager
## 424 Data Scientist
## 425 Data Scientist
## 426 Data Engineer
## 427 Data Engineer
## 428 Data Engineer
## 429 Data Scientist
## 430 Data Analyst
## 431 Data Analyst
## 432 Data Analyst
## 433 Data Engineer
## 434 Data Engineer
## 435 Data Engineer
## 436 Data Engineer
## 437 Data Engineer
## 438 Data Engineer
## 439 Machine Learning Engineer
## 440 Machine Learning Engineer
## 441 Data Analyst
## 442 Data Analyst
## 443 Data Engineer
## 444 Data Engineer
## 445 Data Scientist
## 446 Data Engineer
## 447 Data Engineer
## 448 Data Engineer
## 449 Data Engineer
## 450 ML Engineer
## 451 Data Engineer
## 452 Machine Learning Developer
## 453 Director of Data Science
## 454 Machine Learning Engineer
## 455 Computer Vision Engineer
## 456 NLP Engineer
## 457 Data Engineer
## 458 Lead Machine Learning Engineer
## 459 Business Data Analyst
## 460 Data Scientist
## 461 Machine Learning Infrastructure Engineer
## 462 Financial Data Analyst
## 463 Data Engineer
## 464 Data Scientist
## 465 Principal Data Scientist
## 466 Data Engineer
## 467 Research Scientist
## 468 Data Scientist
## 469 Data Engineer
## 470 Data Scientist
## 471 Data Analyst
## 472 Data Analyst
## 473 Data Scientist
## 474 Data Scientist
## 475 Data Scientist
## 476 Data Scientist
## 477 Data Scientist
## 478 Machine Learning Engineer
## 479 Data Scientist
## 480 Data Scientist
## 481 Machine Learning Engineer
## 482 Machine Learning Engineer
## 483 Data Engineer
## 484 Data Engineer
## 485 Data Engineer
## 486 Machine Learning Engineer
## 487 Data Scientist
## 488 Data Scientist
## 489 Data Scientist
## 490 Applied Machine Learning Scientist
## 491 Head of Data
## 492 Principal Data Analyst
## 493 Data Scientist
## 494 Machine Learning Developer
## 495 Data Scientist
## 496 Machine Learning Scientist
## 497 Data Engineer
## 498 Data Scientist
## 499 Research Scientist
## 500 Data Scientist
## 501 Machine Learning Engineer
## 502 Head of Data
## 503 Data Scientist
## 504 Machine Learning Engineer
## 505 Data Engineer
## 506 Data Scientist
## 507 Applied Machine Learning Scientist
## 508 Research Scientist
## 509 Research Scientist
## 510 Applied Data Scientist
## 511 Computer Vision Software Engineer
## 512 Business Data Analyst
## 513 Data Engineer
## 514 Machine Learning Engineer
## 515 Data Analytics Engineer
## 516 Data Scientist
## 517 Data Science Manager
## 518 Data Engineer
## 519 Data Scientist
## 520 Applied Data Scientist
## 521 Data Scientist
## 522 Computer Vision Engineer
## 523 Data Analyst
## 524 Data Analytics Lead
## 525 Data Scientist
## 526 Applied Data Scientist
## 527 Data Scientist
## 528 Data Analyst
## 529 Data Analyst
## 530 Data Analyst
## 531 Data Analyst
## 532 Data Analyst
## 533 Machine Learning Engineer
## 534 Machine Learning Engineer
## 535 Data Architect
## 536 Data Architect
## 537 Data Analyst
## 538 Data Engineer
## 539 Data Scientist
## 540 Data Scientist
## 541 Data Analyst
## 542 Data Analyst
## 543 Data Engineer
## 544 Data Engineer
## 545 Data Engineer
## 546 Data Engineer
## 547 Data Engineer
## 548 Data Engineer
## 549 Data Analyst
## 550 Data Engineer
## 551 Data Scientist
## 552 Data Scientist
## 553 Data Scientist
## 554 Data Scientist
## 555 Data Engineer
## 556 Data Engineer
## 557 Data Engineer
## 558 Data Engineer
## 559 Data Scientist
## 560 Data Scientist
## 561 Analytics Engineer
## 562 Analytics Engineer
## 563 Data Engineer
## 564 Data Engineer
## 565 Data Analyst
## 566 Data Engineer
## 567 Data Analyst
## 568 Data Analyst
## 569 Data Analyst
## 570 Data Scientist
## 571 Data Scientist
## 572 Data Scientist
## 573 Data Analyst
## 574 Data Analyst
## 575 Data Scientist
## 576 Data Scientist
## 577 Data Scientist
## 578 Data Analyst
## 579 Data Engineer
## 580 Data Engineer
## 581 Data Analyst
## 582 Data Analyst
## 583 Data Engineer
## 584 Data Engineer
## 585 Data Analyst
## 586 Data Analyst
## 587 Data Analyst
## 588 Data Scientist
## 589 Data Analyst
## 590 Data Analyst
## 591 Data Architect
## 592 Data Architect
## 593 Data Scientist
## 594 Data Scientist
## 595 Data Analytics Manager
## 596 Data Analytics Manager
## 597 Data Scientist
## 598 Data Analyst
## 599 Data Scientist
## 600 Data Scientist
## 601 Data Analyst
## 602 Data Analyst
## 603 Data Engineer
## 604 Data Engineer
## 605 Data Analyst
## 606 Data Analyst
## 607 AI Scientist
PTDLDT |> count(job_title) |>
mutate(pC = percent(n/sum(n),accuracy = 0.01)) |>
ggplot(aes(x = job_title, y = n)) +
geom_col(fill = 'blue') +
geom_text(aes(label = pC),color = 'yellow', hjust = 2, size = 5) +
ylab('job_title') +
coord_flip()
Tổng thể, đó là data scientist, data engineer và data analyst. Hầu hết, có nhiều chức danh công việc có số lượng nhân viên ít hơn 1,5% tổng thể.
2.1.3. Thống kê mô tả cho biến work_year
# 6 thống kê cơ bản cho biến work_year
summary(PTDLDT$work_year)
## Length Class Mode
## 0 NULL NULL
# Ngũ phân vị cho biến work_year
quantile(PTDLDT$work_year)
## 0% 25% 50% 75% 100%
## NA NA NA NA NA
table(PTDLDT$work_year)/sum(table(PTDLDT$work_year))
## numeric(0)
PTDLDT |> ggplot(aes(x = work_year, y = after_stat(count))) +
geom_bar(fill = 'blue') +
geom_text(aes(label = scales::percent(after_stat(count/sum(count)))), stat = 'count', color = 'red', vjust = - .5) +
theme_classic() +
labs(x = 'work_year', y = 'The number employees')
Từ năm 2020 đến năm 2022 số lượng nhân viên tăng từ 12% đến 52%. Số lượng nhân viên nhiều nhất vào năm 2022
2.1.4. Thống kê mô tả cho biến experience_level
# 6 thống kê cơ bản cho biến experience_level
summary(PTDLDT$experience_level )
## Length Class Mode
## 0 NULL NULL
table(PTDLDT$experience_level)
## < table of extent 0 >
table(PTDLDT$experience_level)/sum(table(PTDLDT$experience_level))
## numeric(0)
PTDLDT |> ggplot(aes(x = experience_level, y = after_stat(count))) +
geom_bar(fill = 'blue') +
geom_text(aes(label = scales::percent(after_stat(count/sum(count)))), stat = 'count', color = 'red', vjust = - .5) +
theme_classic() +
labs(x = 'experience_level', y = 'The number employees')
Số lượng nhân viên của vị trí Senior-level / Expert là cao nhất với 46% trên tổng sô nhân viên
rm<-table(PTDLDT$company_size,PTDLDT$employment_type)
rm
## < table of extent 0 x 0 >
ggplot(PTDLDT, aes(experience_level, fill = employment_type)) + geom_bar(position = 'dodge')
2.1.5. Thống kê mô tả cho biến company_size
# 6 thống kê cơ bản cho biến company_size
summary(PTDLDT$company_size)
## Length Class Mode
## 0 NULL NULL
table(PTDLDT$company_size)
## < table of extent 0 >
table(PTDLDT$company_size)/sum(table(PTDLDT$company_size))
## numeric(0)
PTDLDT |> ggplot(aes(x = company_size, y = after_stat(count))) +
geom_bar(fill = 'blue') +
geom_text(aes(label = scales::percent(after_stat(count/sum(count)))), stat = 'count', color = 'red', vjust = - .5) +
theme_classic() +
labs(x = 'company_size', y = 'The number employees')
Số lượng nhân viên của công ty có quy mô vừa là nhiều nhất với 54%
trên tổng sô lượng nhân viên được kháo sát
* Phân tích hình thức làm việc theo quy mô công ty
rm<-table(PTDLDT$company_size,PTDLDT$employment_type)
rm
## < table of extent 0 x 0 >
ggplot(PTDLDT, aes(company_size, fill = employment_type)) + geom_bar(position = 'dodge')
2.1.6. Thống kê mô tả cho biến employment_type
# 6 thống kê cơ bản cho biến employment_type
summary(PTDLDT$company_location )
## Length Class Mode
## 0 NULL NULL
table(PTDLDT$employment_type)
## < table of extent 0 >
table(PTDLDT$employment_type)/sum(table(PTDLDT$employment_type))
## numeric(0)
PTDLDT |> ggplot(aes(x = employment_type, y = after_stat(count))) +
geom_bar(fill = 'blue') +
geom_text(aes(label = scales::percent(after_stat(count/sum(count)))), stat = 'count', color = 'red', vjust = - .5) +
theme_classic() +
labs(x = 'employment_type', y = 'The number employees')
Nhân viên toàn thời gian chiếm ưu thế tổng thể với 96,9% số lượng nhân viên.
rm<-table(PTDLDT$employment_type,PTDLDT$experience_level)
rm
## < table of extent 0 x 0 >
2.1.7. Thống kê mô tả cho biến company_location
# 6 thống kê cơ bản cho biến company_location
summary(PTDLDT$company_location)
## Length Class Mode
## 0 NULL NULL
table(PTDLDT$company_location)
## < table of extent 0 >
table(PTDLDT$company_location)/sum(table(PTDLDT$company_location))
## numeric(0)
PTDLDT |> ggplot(aes(x = company_location )) +
geom_bar( fill = 'black')
United States là quốc gia có số lượng nhân viên nhiều nhất theo vị trí công ty nói chung với 58,5%. Hầu hết, có nhiều địa điểm công ty có số lượng nhân viên dưới 1,5% tổng thể.
2.1.7 Thống kê mô tả cho các biến định lượng còn lại
PTDLDT1<-data.frame(PTDLDT$work_year, PTDLDT$salary, PTDLDT$salary_in_usd, PTDLDT$remote_ratio)
summary(PTDLDT1)
## < table of extent 0 x 0 >
Từ bảng thống kê trên ta thấy:
Biểu đồ Histogram
PTDLDT<-data.frame(salary)
PTDLDT
## salary
## 1 70000
## 2 260000
## 3 85000
## 4 20000
## 5 150000
## 6 72000
## 7 190000
## 8 11000000
## 9 135000
## 10 125000
## 11 45000
## 12 3000000
## 13 35000
## 14 87000
## 15 85000
## 16 8000
## 17 4450000
## 18 100000
## 19 423000
## 20 56000
## 21 299000
## 22 450000
## 23 42000
## 24 98000
## 25 115000
## 26 325000
## 27 42000
## 28 720000
## 29 100000
## 30 157000
## 31 51999
## 32 70000
## 33 60000
## 34 450000
## 35 41000
## 36 65000
## 37 103000
## 38 250000
## 39 10000
## 40 138000
## 41 45760
## 42 70000
## 43 44000
## 44 106000
## 45 88000
## 46 14000
## 47 60000
## 48 188000
## 49 105000
## 50 61500
## 51 450000
## 52 91000
## 53 300000
## 54 48000
## 55 60000
## 56 130000
## 57 34000
## 58 118000
## 59 120000
## 60 138350
## 61 110000
## 62 130800
## 63 19000
## 64 412000
## 65 40000
## 66 55000
## 67 43200
## 68 190200
## 69 105000
## 70 80000
## 71 55000
## 72 37000
## 73 60000
## 74 150000
## 75 235000
## 76 45000
## 77 100000
## 78 400000
## 79 270000
## 80 80000
## 81 67000
## 82 140000
## 83 68000
## 84 40000
## 85 130000
## 86 110000
## 87 50000
## 88 110000
## 89 170000
## 90 80000
## 91 75000
## 92 65000
## 93 1450000
## 94 276000
## 95 2200000
## 96 120000
## 97 12000
## 98 450000
## 99 70000
## 100 81000
## 101 75000
## 102 150000
## 103 11000000
## 104 62000
## 105 73000
## 106 37456
## 107 235000
## 108 115000
## 109 150000
## 110 2250000
## 111 80000
## 112 82500
## 113 75000
## 114 12000
## 115 38400
## 116 225000
## 117 50000
## 118 34000
## 119 90000
## 120 200000
## 121 60000
## 122 200000
## 123 50000
## 124 80000
## 125 8760
## 126 151000
## 127 120000
## 128 700000
## 129 20000
## 130 3000000
## 131 100000
## 132 42000
## 133 38400
## 134 24000
## 135 100000
## 136 90000
## 137 7000000
## 138 8500000
## 139 220000
## 140 80000
## 141 135000
## 142 240000
## 143 150000
## 144 82500
## 145 100000
## 146 70000
## 147 53000
## 148 90000
## 149 153000
## 150 160000
## 151 168000
## 152 150000
## 153 95000
## 154 13400
## 155 144000
## 156 159500
## 157 160000
## 158 423000
## 159 120000
## 160 125000
## 161 230000
## 162 85000
## 163 24000
## 164 54000
## 165 110000
## 166 165000
## 167 80000
## 168 250000
## 169 55000
## 170 150000
## 171 170000
## 172 60000
## 173 60000
## 174 235000
## 175 51400
## 176 174000
## 177 58000
## 178 30400000
## 179 81000
## 180 420000
## 181 1672000
## 182 76760
## 183 22000
## 184 45000
## 185 12000
## 186 4000
## 187 50000
## 188 59000
## 189 65000
## 190 74000
## 191 152000
## 192 21844
## 193 18000
## 194 174000
## 195 120500
## 196 147000
## 197 9272
## 198 1799997
## 199 4000000
## 200 90000
## 201 52000
## 202 195000
## 203 32000
## 204 50000
## 205 160000
## 206 69600
## 207 200000
## 208 165000
## 209 20000
## 210 120000
## 211 21000
## 212 48000
## 213 48000
## 214 435000
## 215 21000
## 216 185000
## 217 180000
## 218 76760
## 219 75000
## 220 140000
## 221 180000
## 222 85000
## 223 2500000
## 224 40900
## 225 225000
## 226 416000
## 227 110000
## 228 75000
## 229 135000
## 230 90000
## 231 1200000
## 232 256000
## 233 200000
## 234 200000
## 235 180000
## 236 110000
## 237 80000
## 238 39600
## 239 4000
## 240 1600000
## 241 130000
## 242 80000
## 243 110000
## 244 165000
## 245 1335000
## 246 52500
## 247 31000
## 248 108000
## 249 70000
## 250 170000
## 251 115000
## 252 90000
## 253 600000
## 254 2100000
## 255 93000
## 256 125000
## 257 200000
## 258 147000
## 259 185000
## 260 120000
## 261 130000
## 262 54000
## 263 1250000
## 264 4900000
## 265 21600
## 266 160000
## 267 93150
## 268 111775
## 269 250000
## 270 55000
## 271 72500
## 272 102000
## 273 65000
## 274 85000
## 275 65720
## 276 100000
## 277 58000
## 278 55000
## 279 180000
## 280 50000
## 281 112000
## 282 100000
## 283 59000
## 284 105000
## 285 69999
## 286 7000000
## 287 87000
## 288 109000
## 289 43200
## 290 135000
## 291 155000
## 292 120600
## 293 130000
## 294 90000
## 295 170000
## 296 150000
## 297 102100
## 298 84900
## 299 136620
## 300 99360
## 301 90000
## 302 80000
## 303 146000
## 304 123000
## 305 40000
## 306 99000
## 307 116000
## 308 106260
## 309 126500
## 310 242000
## 311 200000
## 312 50000
## 313 30000
## 314 60000
## 315 40000
## 316 165220
## 317 35000
## 318 120160
## 319 90320
## 320 181940
## 321 132320
## 322 220110
## 323 160080
## 324 180000
## 325 120000
## 326 124190
## 327 130000
## 328 110000
## 329 170000
## 330 115500
## 331 112900
## 332 90320
## 333 112900
## 334 90320
## 335 165400
## 336 132320
## 337 167000
## 338 243900
## 339 136600
## 340 109280
## 341 128875
## 342 93700
## 343 224000
## 344 167875
## 345 175000
## 346 156600
## 347 108800
## 348 95550
## 349 113000
## 350 135000
## 351 161342
## 352 137141
## 353 167000
## 354 123000
## 355 60000
## 356 50000
## 357 150000
## 358 211500
## 359 192400
## 360 90700
## 361 130000
## 362 61300
## 363 130000
## 364 61300
## 365 160000
## 366 138600
## 367 136000
## 368 58000
## 369 135000
## 370 170000
## 371 123000
## 372 189650
## 373 164996
## 374 50000
## 375 50000
## 376 150000
## 377 132000
## 378 165400
## 379 208775
## 380 147800
## 381 136994
## 382 101570
## 383 128875
## 384 93700
## 385 6000000
## 386 132320
## 387 28500
## 388 164000
## 389 155000
## 390 95000
## 391 75000
## 392 120000
## 393 112900
## 394 90320
## 395 145000
## 396 105400
## 397 80000
## 398 90000
## 399 215300
## 400 158200
## 401 209100
## 402 154600
## 403 115934
## 404 81666
## 405 175000
## 406 75000
## 407 58000
## 408 183600
## 409 40000
## 410 180000
## 411 55000
## 412 35000
## 413 60000
## 414 45000
## 415 60000
## 416 45000
## 417 260000
## 418 60000
## 419 63900
## 420 160000
## 421 112300
## 422 241000
## 423 159000
## 424 180000
## 425 80000
## 426 82900
## 427 100800
## 428 45000
## 429 140400
## 430 30000
## 431 40000
## 432 30000
## 433 80000
## 434 70000
## 435 80000
## 436 70000
## 437 60000
## 438 80000
## 439 189650
## 440 164996
## 441 40000
## 442 30000
## 443 75000
## 444 60000
## 445 215300
## 446 70000
## 447 209100
## 448 154600
## 449 180000
## 450 20000
## 451 80000
## 452 100000
## 453 250000
## 454 120000
## 455 125000
## 456 240000
## 457 105000
## 458 80000
## 459 1400000
## 460 2400000
## 461 53000
## 462 100000
## 463 50000
## 464 1400000
## 465 148000
## 466 120000
## 467 144000
## 468 104890
## 469 100000
## 470 140000
## 471 135000
## 472 50000
## 473 220000
## 474 140000
## 475 140000
## 476 70000
## 477 185100
## 478 220000
## 479 200000
## 480 120000
## 481 120000
## 482 65000
## 483 324000
## 484 216000
## 485 210000
## 486 120000
## 487 230000
## 488 100000
## 489 100000
## 490 29000
## 491 200000
## 492 75000
## 493 150000
## 494 100000
## 495 100000
## 496 153000
## 497 52800
## 498 165000
## 499 85000
## 500 66500
## 501 57000
## 502 30000
## 503 40000
## 504 121000
## 505 115000
## 506 120000
## 507 75000
## 508 59000
## 509 120000
## 510 157000
## 511 150000
## 512 90000
## 513 65000
## 514 65000
## 515 20000
## 516 48000
## 517 152500
## 518 62000
## 519 115000
## 520 380000
## 521 88000
## 522 10000
## 523 20000
## 524 405000
## 525 135000
## 526 177000
## 527 78000
## 528 135000
## 529 100000
## 530 90320
## 531 85000
## 532 75000
## 533 214000
## 534 192600
## 535 266400
## 536 213120
## 537 112900
## 538 155000
## 539 141300
## 540 102100
## 541 115934
## 542 81666
## 543 206699
## 544 99100
## 545 130000
## 546 115000
## 547 110500
## 548 130000
## 549 99050
## 550 160000
## 551 205300
## 552 140400
## 553 176000
## 554 144000
## 555 200100
## 556 160000
## 557 145000
## 558 70500
## 559 205300
## 560 140400
## 561 205300
## 562 184700
## 563 175100
## 564 140250
## 565 116150
## 566 54000
## 567 170000
## 568 50000
## 569 80000
## 570 140000
## 571 210000
## 572 140000
## 573 100000
## 574 69000
## 575 210000
## 576 140000
## 577 210000
## 578 150075
## 579 100000
## 580 25000
## 581 126500
## 582 106260
## 583 220110
## 584 160080
## 585 105000
## 586 110925
## 587 35000
## 588 140000
## 589 99000
## 590 60000
## 591 192564
## 592 144854
## 593 230000
## 594 150000
## 595 150260
## 596 109280
## 597 210000
## 598 170000
## 599 160000
## 600 130000
## 601 67000
## 602 52000
## 603 154000
## 604 126000
## 605 129000
## 606 150000
## 607 200000
hist(PTDLDT$salary)
Tổng số tiền lương gộp được trả (salary) nằm trong phạm vi 1000 đến 50000000 xuất hiện nhiều nhất.
PTDLDT<-data.frame(salary_in_usd)
PTDLDT
## salary_in_usd
## 1 79833
## 2 260000
## 3 109024
## 4 20000
## 5 150000
## 6 72000
## 7 190000
## 8 35735
## 9 135000
## 10 125000
## 11 51321
## 12 40481
## 13 39916
## 14 87000
## 15 85000
## 16 8000
## 17 41689
## 18 114047
## 19 5707
## 20 56000
## 21 43331
## 22 6072
## 23 47899
## 24 98000
## 25 115000
## 26 325000
## 27 42000
## 28 33511
## 29 100000
## 30 117104
## 31 59303
## 32 70000
## 33 68428
## 34 450000
## 35 46759
## 36 74130
## 37 103000
## 38 250000
## 39 10000
## 40 138000
## 41 45760
## 42 79833
## 43 50180
## 44 106000
## 45 112872
## 46 15966
## 47 76958
## 48 188000
## 49 105000
## 50 70139
## 51 6072
## 52 91000
## 53 45896
## 54 54742
## 55 60000
## 56 148261
## 57 38776
## 58 118000
## 59 120000
## 60 138350
## 61 110000
## 62 130800
## 63 21669
## 64 412000
## 65 45618
## 66 62726
## 67 49268
## 68 190200
## 69 105000
## 70 91237
## 71 62726
## 72 42197
## 73 82528
## 74 150000
## 75 235000
## 76 53192
## 77 100000
## 78 5409
## 79 270000
## 80 80000
## 81 79197
## 82 140000
## 83 54238
## 84 47282
## 85 153667
## 86 28476
## 87 59102
## 88 110000
## 89 170000
## 90 80000
## 91 88654
## 92 76833
## 93 19609
## 94 276000
## 95 29751
## 96 89294
## 97 12000
## 98 450000
## 99 70000
## 100 95746
## 101 75000
## 102 150000
## 103 36259
## 104 62000
## 105 73000
## 106 51519
## 107 187442
## 108 115000
## 109 150000
## 110 30428
## 111 94564
## 112 113476
## 113 103160
## 114 12000
## 115 45391
## 116 225000
## 117 50000
## 118 40189
## 119 90000
## 120 200000
## 121 60000
## 122 200000
## 123 50000
## 124 110037
## 125 10354
## 126 151000
## 127 120000
## 128 9466
## 129 20000
## 130 40570
## 131 100000
## 132 49646
## 133 38400
## 134 24000
## 135 100000
## 136 90000
## 137 63711
## 138 77364
## 139 220000
## 140 80000
## 141 135000
## 142 240000
## 143 150000
## 144 82500
## 145 100000
## 146 82744
## 147 62649
## 148 90000
## 149 153000
## 150 160000
## 151 168000
## 152 150000
## 153 75774
## 154 13400
## 155 144000
## 156 127221
## 157 119059
## 158 423000
## 159 120000
## 160 125000
## 161 230000
## 162 85000
## 163 28369
## 164 63831
## 165 130026
## 166 165000
## 167 80000
## 168 250000
## 169 55000
## 170 150000
## 171 170000
## 172 82528
## 173 60000
## 174 235000
## 175 60757
## 176 174000
## 177 2859
## 178 40038
## 179 81000
## 180 5679
## 181 22611
## 182 90734
## 183 26005
## 184 61896
## 185 12000
## 186 4000
## 187 50000
## 188 69741
## 189 76833
## 190 74000
## 191 152000
## 192 21844
## 193 18000
## 194 174000
## 195 96113
## 196 147000
## 197 9272
## 198 24342
## 199 54094
## 200 90000
## 201 61467
## 202 195000
## 203 37825
## 204 50000
## 205 160000
## 206 12901
## 207 200000
## 208 165000
## 209 20000
## 210 120000
## 211 24823
## 212 56738
## 213 66022
## 214 5882
## 215 24823
## 216 185000
## 217 28609
## 218 90734
## 219 88654
## 220 140000
## 221 46597
## 222 116914
## 223 33808
## 224 56256
## 225 225000
## 226 416000
## 227 87738
## 228 88654
## 229 135000
## 230 71786
## 231 16228
## 232 256000
## 233 200000
## 234 200000
## 235 180000
## 236 110000
## 237 63810
## 238 46809
## 239 4000
## 240 21637
## 241 103691
## 242 80000
## 243 110000
## 244 165000
## 245 18053
## 246 72212
## 247 36643
## 248 12103
## 249 96282
## 250 170000
## 251 115000
## 252 90000
## 253 600000
## 254 28399
## 255 93000
## 256 99703
## 257 200000
## 258 173762
## 259 185000
## 260 141846
## 261 130000
## 262 63831
## 263 16904
## 264 66265
## 265 25532
## 266 160000
## 267 93150
## 268 111775
## 269 28016
## 270 65013
## 271 72500
## 272 18907
## 273 76833
## 274 85000
## 275 77684
## 276 100000
## 277 58000
## 278 55000
## 279 20171
## 280 59102
## 281 112000
## 282 100000
## 283 69741
## 284 105000
## 285 69999
## 286 94665
## 287 102839
## 288 109000
## 289 51064
## 290 135000
## 291 155000
## 292 120600
## 293 130000
## 294 90000
## 295 170000
## 296 150000
## 297 102100
## 298 84900
## 299 136620
## 300 99360
## 301 117789
## 302 104702
## 303 146000
## 304 123000
## 305 52351
## 306 99000
## 307 116000
## 308 106260
## 309 126500
## 310 242000
## 311 200000
## 312 65438
## 313 39263
## 314 78526
## 315 52351
## 316 165220
## 317 45807
## 318 120160
## 319 90320
## 320 181940
## 321 132320
## 322 220110
## 323 160080
## 324 180000
## 325 120000
## 326 124190
## 327 130000
## 328 110000
## 329 170000
## 330 115500
## 331 112900
## 332 90320
## 333 112900
## 334 90320
## 335 165400
## 336 132320
## 337 167000
## 338 243900
## 339 136600
## 340 109280
## 341 128875
## 342 93700
## 343 224000
## 344 167875
## 345 175000
## 346 156600
## 347 108800
## 348 95550
## 349 113000
## 350 135000
## 351 161342
## 352 137141
## 353 167000
## 354 123000
## 355 78526
## 356 65438
## 357 150000
## 358 211500
## 359 192400
## 360 90700
## 361 130000
## 362 61300
## 363 130000
## 364 61300
## 365 160000
## 366 138600
## 367 136000
## 368 58000
## 369 135000
## 370 170000
## 371 123000
## 372 189650
## 373 164996
## 374 54957
## 375 54957
## 376 118187
## 377 132000
## 378 165400
## 379 208775
## 380 147800
## 381 136994
## 382 101570
## 383 128875
## 384 93700
## 385 79039
## 386 132320
## 387 37300
## 388 164000
## 389 155000
## 390 124333
## 391 98158
## 392 120000
## 393 112900
## 394 90320
## 395 145000
## 396 105400
## 397 87932
## 398 117789
## 399 215300
## 400 158200
## 401 209100
## 402 154600
## 403 115934
## 404 81666
## 405 175000
## 406 98158
## 407 58000
## 408 183600
## 409 52351
## 410 180000
## 411 71982
## 412 45807
## 413 65949
## 414 49461
## 415 78526
## 416 58894
## 417 260000
## 418 60000
## 419 63900
## 420 160000
## 421 112300
## 422 241000
## 423 159000
## 424 180000
## 425 80000
## 426 82900
## 427 100800
## 428 49461
## 429 140400
## 430 39263
## 431 43966
## 432 32974
## 433 87932
## 434 76940
## 435 104702
## 436 91614
## 437 65949
## 438 87932
## 439 189650
## 440 164996
## 441 43966
## 442 32974
## 443 98158
## 444 78526
## 445 215300
## 446 76940
## 447 209100
## 448 154600
## 449 180000
## 450 21983
## 451 80000
## 452 78791
## 453 196979
## 454 120000
## 455 125000
## 456 37236
## 457 105000
## 458 87932
## 459 18442
## 460 31615
## 461 58255
## 462 100000
## 463 54957
## 464 18442
## 465 162674
## 466 120000
## 467 144000
## 468 104890
## 469 100000
## 470 140000
## 471 135000
## 472 50000
## 473 220000
## 474 140000
## 475 183228
## 476 91614
## 477 185100
## 478 220000
## 479 200000
## 480 120000
## 481 120000
## 482 65000
## 483 324000
## 484 216000
## 485 210000
## 486 120000
## 487 230000
## 488 100000
## 489 100000
## 490 31875
## 491 200000
## 492 75000
## 493 35590
## 494 78791
## 495 100000
## 496 153000
## 497 58035
## 498 165000
## 499 93427
## 500 52396
## 501 62651
## 502 32974
## 503 40000
## 504 87425
## 505 115000
## 506 86703
## 507 75000
## 508 64849
## 509 120000
## 510 157000
## 511 150000
## 512 70912
## 513 65000
## 514 71444
## 515 20000
## 516 48000
## 517 152500
## 518 68147
## 519 122346
## 520 380000
## 521 69336
## 522 10000
## 523 20000
## 524 405000
## 525 135000
## 526 177000
## 527 78000
## 528 135000
## 529 100000
## 530 90320
## 531 85000
## 532 75000
## 533 214000
## 534 192600
## 535 266400
## 536 213120
## 537 112900
## 538 155000
## 539 141300
## 540 102100
## 541 115934
## 542 81666
## 543 206699
## 544 99100
## 545 130000
## 546 115000
## 547 110500
## 548 130000
## 549 99050
## 550 160000
## 551 205300
## 552 140400
## 553 176000
## 554 144000
## 555 200100
## 556 160000
## 557 145000
## 558 70500
## 559 205300
## 560 140400
## 561 205300
## 562 184700
## 563 175100
## 564 140250
## 565 116150
## 566 54000
## 567 170000
## 568 65438
## 569 80000
## 570 140000
## 571 210000
## 572 140000
## 573 100000
## 574 69000
## 575 210000
## 576 140000
## 577 210000
## 578 150075
## 579 100000
## 580 25000
## 581 126500
## 582 106260
## 583 220110
## 584 160080
## 585 105000
## 586 110925
## 587 45807
## 588 140000
## 589 99000
## 590 60000
## 591 192564
## 592 144854
## 593 230000
## 594 150000
## 595 150260
## 596 109280
## 597 210000
## 598 170000
## 599 160000
## 600 130000
## 601 67000
## 602 52000
## 603 154000
## 604 126000
## 605 129000
## 606 150000
## 607 200000
hist(PTDLDT$salary_in_usd)
Lương tính bằng USD (salary_in_usd) phân bố tương đối đều ở phạm vi giá trị từ 1000 USD đến 200000 USD và phạm vi giá trị từ 1000 USD đến 100000 USD xuất hiện nhiều nhất.
PTDLDT<-data.frame(remote_ratio)
PTDLDT
## remote_ratio
## 1 0
## 2 0
## 3 50
## 4 0
## 5 50
## 6 100
## 7 100
## 8 50
## 9 100
## 10 50
## 11 0
## 12 0
## 13 0
## 14 100
## 15 100
## 16 50
## 17 100
## 18 100
## 19 50
## 20 100
## 21 0
## 22 100
## 23 50
## 24 0
## 25 0
## 26 100
## 27 50
## 28 0
## 29 100
## 30 50
## 31 100
## 32 100
## 33 100
## 34 0
## 35 50
## 36 50
## 37 100
## 38 50
## 39 100
## 40 100
## 41 100
## 42 50
## 43 0
## 44 100
## 45 50
## 46 100
## 47 100
## 48 100
## 49 100
## 50 50
## 51 0
## 52 100
## 53 50
## 54 100
## 55 100
## 56 100
## 57 100
## 58 100
## 59 50
## 60 100
## 61 100
## 62 100
## 63 50
## 64 100
## 65 100
## 66 50
## 67 0
## 68 100
## 69 100
## 70 0
## 71 50
## 72 50
## 73 50
## 74 100
## 75 100
## 76 50
## 77 100
## 78 50
## 79 100
## 80 100
## 81 100
## 82 100
## 83 50
## 84 100
## 85 100
## 86 100
## 87 50
## 88 100
## 89 100
## 90 100
## 91 100
## 92 100
## 93 100
## 94 0
## 95 50
## 96 50
## 97 100
## 98 100
## 99 100
## 100 100
## 101 0
## 102 100
## 103 50
## 104 0
## 105 0
## 106 50
## 107 100
## 108 100
## 109 100
## 110 100
## 111 50
## 112 100
## 113 100
## 114 100
## 115 100
## 116 100
## 117 100
## 118 100
## 119 100
## 120 100
## 121 50
## 122 100
## 123 100
## 124 0
## 125 50
## 126 100
## 127 50
## 128 0
## 129 100
## 130 50
## 131 50
## 132 50
## 133 100
## 134 100
## 135 0
## 136 100
## 137 50
## 138 50
## 139 0
## 140 100
## 141 100
## 142 0
## 143 0
## 144 100
## 145 100
## 146 50
## 147 50
## 148 100
## 149 100
## 150 100
## 151 0
## 152 100
## 153 100
## 154 100
## 155 100
## 156 50
## 157 100
## 158 50
## 159 100
## 160 100
## 161 50
## 162 0
## 163 50
## 164 50
## 165 50
## 166 100
## 167 100
## 168 0
## 169 50
## 170 100
## 171 100
## 172 100
## 173 100
## 174 100
## 175 50
## 176 100
## 177 0
## 178 100
## 179 50
## 180 100
## 181 0
## 182 50
## 183 0
## 184 50
## 185 50
## 186 100
## 187 100
## 188 100
## 189 50
## 190 50
## 191 100
## 192 50
## 193 0
## 194 100
## 195 50
## 196 50
## 197 100
## 198 100
## 199 50
## 200 100
## 201 50
## 202 100
## 203 100
## 204 100
## 205 100
## 206 0
## 207 100
## 208 0
## 209 0
## 210 0
## 211 50
## 212 50
## 213 50
## 214 0
## 215 50
## 216 100
## 217 50
## 218 50
## 219 100
## 220 100
## 221 100
## 222 50
## 223 0
## 224 50
## 225 100
## 226 100
## 227 100
## 228 50
## 229 0
## 230 100
## 231 100
## 232 100
## 233 100
## 234 100
## 235 100
## 236 0
## 237 100
## 238 100
## 239 0
## 240 50
## 241 100
## 242 100
## 243 100
## 244 100
## 245 100
## 246 50
## 247 50
## 248 0
## 249 50
## 250 100
## 251 50
## 252 100
## 253 100
## 254 100
## 255 100
## 256 50
## 257 100
## 258 100
## 259 50
## 260 0
## 261 50
## 262 50
## 263 100
## 264 0
## 265 100
## 266 50
## 267 0
## 268 0
## 269 100
## 270 50
## 271 100
## 272 0
## 273 0
## 274 100
## 275 50
## 276 100
## 277 50
## 278 100
## 279 50
## 280 100
## 281 100
## 282 0
## 283 100
## 284 100
## 285 50
## 286 50
## 287 100
## 288 50
## 289 50
## 290 100
## 291 100
## 292 100
## 293 0
## 294 0
## 295 100
## 296 100
## 297 100
## 298 100
## 299 100
## 300 100
## 301 0
## 302 0
## 303 100
## 304 100
## 305 100
## 306 0
## 307 0
## 308 0
## 309 0
## 310 100
## 311 100
## 312 0
## 313 0
## 314 0
## 315 0
## 316 100
## 317 100
## 318 100
## 319 100
## 320 0
## 321 0
## 322 0
## 323 0
## 324 0
## 325 0
## 326 100
## 327 100
## 328 100
## 329 100
## 330 100
## 331 100
## 332 100
## 333 100
## 334 100
## 335 100
## 336 100
## 337 100
## 338 100
## 339 100
## 340 100
## 341 100
## 342 100
## 343 100
## 344 100
## 345 100
## 346 100
## 347 0
## 348 0
## 349 0
## 350 100
## 351 100
## 352 100
## 353 100
## 354 100
## 355 0
## 356 0
## 357 0
## 358 100
## 359 100
## 360 100
## 361 100
## 362 100
## 363 100
## 364 100
## 365 0
## 366 100
## 367 0
## 368 0
## 369 100
## 370 100
## 371 100
## 372 0
## 373 0
## 374 0
## 375 0
## 376 100
## 377 0
## 378 100
## 379 100
## 380 100
## 381 100
## 382 100
## 383 100
## 384 100
## 385 50
## 386 100
## 387 100
## 388 0
## 389 100
## 390 0
## 391 0
## 392 0
## 393 100
## 394 100
## 395 100
## 396 100
## 397 100
## 398 0
## 399 100
## 400 100
## 401 100
## 402 100
## 403 0
## 404 0
## 405 100
## 406 0
## 407 0
## 408 100
## 409 100
## 410 100
## 411 0
## 412 0
## 413 100
## 414 100
## 415 100
## 416 100
## 417 100
## 418 100
## 419 0
## 420 100
## 421 100
## 422 100
## 423 100
## 424 0
## 425 0
## 426 0
## 427 100
## 428 100
## 429 0
## 430 100
## 431 100
## 432 100
## 433 100
## 434 100
## 435 100
## 436 100
## 437 100
## 438 100
## 439 0
## 440 0
## 441 100
## 442 100
## 443 100
## 444 100
## 445 0
## 446 100
## 447 100
## 448 100
## 449 100
## 450 100
## 451 100
## 452 100
## 453 50
## 454 100
## 455 0
## 456 50
## 457 100
## 458 0
## 459 100
## 460 100
## 461 50
## 462 50
## 463 50
## 464 100
## 465 100
## 466 100
## 467 50
## 468 100
## 469 100
## 470 100
## 471 100
## 472 100
## 473 100
## 474 100
## 475 0
## 476 0
## 477 100
## 478 100
## 479 100
## 480 100
## 481 100
## 482 100
## 483 100
## 484 100
## 485 100
## 486 100
## 487 100
## 488 50
## 489 100
## 490 100
## 491 100
## 492 100
## 493 100
## 494 100
## 495 100
## 496 50
## 497 100
## 498 100
## 499 50
## 500 100
## 501 100
## 502 100
## 503 100
## 504 100
## 505 100
## 506 50
## 507 100
## 508 0
## 509 100
## 510 100
## 511 100
## 512 50
## 513 100
## 514 100
## 515 0
## 516 100
## 517 100
## 518 100
## 519 0
## 520 100
## 521 100
## 522 100
## 523 100
## 524 100
## 525 100
## 526 100
## 527 100
## 528 100
## 529 100
## 530 100
## 531 0
## 532 0
## 533 100
## 534 100
## 535 100
## 536 100
## 537 100
## 538 100
## 539 0
## 540 0
## 541 100
## 542 100
## 543 0
## 544 0
## 545 100
## 546 100
## 547 100
## 548 100
## 549 100
## 550 100
## 551 0
## 552 0
## 553 100
## 554 100
## 555 100
## 556 100
## 557 100
## 558 0
## 559 0
## 560 0
## 561 0
## 562 0
## 563 100
## 564 100
## 565 100
## 566 0
## 567 100
## 568 0
## 569 100
## 570 100
## 571 100
## 572 100
## 573 100
## 574 100
## 575 100
## 576 100
## 577 100
## 578 100
## 579 100
## 580 100
## 581 100
## 582 100
## 583 100
## 584 100
## 585 100
## 586 100
## 587 0
## 588 100
## 589 0
## 590 100
## 591 100
## 592 100
## 593 100
## 594 100
## 595 100
## 596 100
## 597 100
## 598 100
## 599 100
## 600 100
## 601 0
## 602 0
## 603 100
## 604 100
## 605 0
## 606 100
## 607 100
hist(PTDLDT$remote_ratio)
Tổng số lượng công việc được thực hiện từ xa (remote_ratio) phân bố không đều, chủ yếu tập trung vào khoảng từ 0 - 10, 40 - 50 và cao nhất vào khoảng từ 90 - 100.
2.2. Tính rủi ro tương đối
2.2.1. Rủi ro tương đối giữa biến employment_type và experience_level
2.2.2. Rủi ro tương đối giữa biến employment_type và company_size
2.3. Tỷ lệ chênh
2.3.1. Tỷ lệ chênh giữa biến employment_type và experience_level
2.3.2. Tỷ lệ chênh giữa biến employment_type và company_size
2.4. Thống kê suy diễn cho dữ liệu định tính
2.4.1 Kiểm định tính độc lập cho 2 biến định tính
Kiểm định tính độc lập cho 2 biến employment_type và job_title
Kết quả kiểm định p- value < 2.2e-16 < 0.05. Qua kết quả kiểm định cho thấy hình thức làm việc của người được khảo sát có liên quan và được quyết định bởi vị trí công việc.
Kiểm định tính độc lập cho 2 biến employment_type và experience_level
Kết quả kiểm định p- value = 3.749e-05 < 0.05. Qua kết quả kiểm định cho thấy hình thức làm việc của người được khảo sát có liên quan và được quyết định bởi kinh nghiệm làm việc.
Kiểm định tính độc lập cho 2 biến employment_type và company_size
Kết quả kiểm định p- value = 0.3269 > 0.05. Với mức ý nghĩa 5% chưa đủ cơ sở kết luận hình thức làm việc có liên quan tới quy mô công ty, tức hình thức làm việc và quy mô công ty độc lập với nhau.
Kiểm định tính độc lập cho 2 biến employment_type và company_location
Kết quả kiểm định p- value = 4.46e-07 < 0.05. Qua kết quả kiểm định cho thấy hình thức làm việc của người được khảo sát có liên quan và được quyết định bởi quốc gia của văn phòng chính.
2.4.2 Khoảng ước lượng cho tỷ lệ
Ước lượng tỷ lệ người được khảo sát có mức lương tính bằng USD (salary_in_usd) lớn hơn 100000 USD đồng thời kiểm định xem tỷ lệ (%) người được khảo sát có mức lương tính bằng USD lớn hơn 100000 USD là 30% không?
Với khoảng tin cậy 95% uớc lượng tỷ lệ người được khảo sát có mức lương tính bằng USD (salary_in_usd) lớn hơn 100000 USD nằm trong khoảng từ 0.984495 đến 1.000000.
p-value < 0, bác bỏ giả thuyết H0. Do đó tỷ lệ người được khảo sát có mức lương tính bằng USD (salary_in_usd) lớn hơn 100000 USD không bằng 30% với mức ý nghĩa 5%.
Ước lượng sự chênh lệch về người được khảo sát có mức lương tính bằng USD (salary_in_usd) lớn hơn 100000 USD giữa công ty có quy mô nhỏ và vừa . Đồng thời thực hiện bài toán kiển định sự chênh lệch này giữa công ty có qui mô nhỏ, vừa . Đồng thời thực hiện bài toán kiển định sự chênh lệch này
Vì p_value = 1.231e-07 < 0.05 nên đủ cơ sở để bác bỏ giả thuyết H0, do đó có sự chênh lệnh giữa tỷ lệ người được khảo sát làm ở công ty nhỏ và vừa có mức lương tính bằng USD (salary_in_usd) lớn hơn 100000 USD
Khoảng tin cậy 95% cho chênh lệch tỷ lệ nằm trong khoảng từ -0.4467366 đến -0.2185750.