Gọi dữ liệu PhDPublications từ package AER
Sau đó sẽ gán dữ liệu vào p
Tiếp theo là đặt tên cho các biến tương ứng
a: articles
g: gender
ma: married
k: kids
pr: prestige
m: mentor
library(AER)
## Loading required package: car
## Loading required package: carData
## Loading required package: lmtest
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
## Loading required package: sandwich
## Loading required package: survival
data('PhDPublications')
p <- PhDPublications
names(p) <- c('a','g','ma','k','pr','m')
Lọc lấy dữ liệu những ngiên cứu sinh đã kết hôn rồi
Ta thấy kết quả có 606 người nghiên cứu sinh đã kết hôn (66%)
yes <- p[p$ma== 'yes',]
yes
## a g ma k pr m
## 1 0 male yes 0 2.520 7
## 4 0 male yes 1 1.180 3
## 6 0 female yes 2 3.590 2
## 8 0 male yes 2 2.960 4
## 10 0 female yes 0 1.250 0
## 13 0 female yes 1 3.690 3
## 14 0 female yes 0 3.400 4
## 15 0 female yes 0 1.790 0
## 17 0 female yes 0 2.000 7
## 18 0 male yes 2 4.290 13
## 21 0 female yes 0 2.260 6
## 22 0 male yes 3 2.960 3
## 23 0 male yes 1 4.290 5
## 24 0 male yes 1 2.860 4
## 25 0 male yes 3 2.760 1
## 26 0 female yes 0 1.520 3
## 27 0 female yes 1 3.540 8
## 28 0 male yes 1 4.290 3
## 30 0 male yes 0 2.320 3
## 32 0 male yes 0 4.290 8
## 35 0 male yes 1 1.520 0
## 39 0 male yes 1 1.220 2
## 40 0 female yes 0 3.750 5
## 42 0 female yes 1 2.860 3
## 44 0 female yes 1 3.360 3
## 46 0 male yes 1 1.180 0
## 47 0 male yes 0 2.500 1
## 48 0 male yes 0 3.360 25
## 50 0 female yes 0 3.920 8
## 52 0 female yes 2 1.970 0
## 53 0 male yes 2 2.960 12
## 54 0 male yes 0 4.290 8
## 55 0 male yes 1 2.260 2
## 58 0 male yes 1 3.150 1
## 59 0 male yes 1 3.920 1
## 62 0 male yes 1 2.100 0
## 64 0 female yes 0 3.540 2
## 65 0 female yes 0 2.540 1
## 66 0 male yes 1 2.760 3
## 67 0 male yes 0 4.540 10
## 68 0 male yes 0 1.680 6
## 69 0 male yes 1 2.200 0
## 72 0 female yes 2 2.580 0
## 73 0 female yes 0 1.790 1
## 75 0 female yes 0 1.280 4
## 76 0 male yes 2 2.580 5
## 77 0 male yes 2 2.120 0
## 78 0 male yes 1 2.210 1
## 79 0 male yes 1 2.260 5
## 82 0 female yes 1 3.540 1
## 83 0 male yes 1 3.400 18
## 84 0 male yes 0 2.210 6
## 85 0 male yes 0 2.210 19
## 86 0 male yes 2 0.920 1
## 88 0 male yes 2 3.150 6
## 89 0 male yes 0 4.290 19
## 90 0 male yes 1 2.510 8
## 91 0 male yes 1 4.290 1
## 92 0 female yes 0 2.760 0
## 93 0 male yes 0 1.420 3
## 94 0 male yes 0 2.210 19
## 96 0 male yes 0 1.520 7
## 99 0 female yes 2 3.750 4
## 100 0 male yes 0 4.290 8
## 102 0 male yes 1 2.100 0
## 103 0 male yes 2 1.400 7
## 104 0 female yes 0 3.190 4
## 105 0 male yes 2 1.810 1
## 106 0 male yes 1 3.150 2
## 107 0 female yes 0 3.750 7
## 109 0 male yes 3 2.210 3
## 110 0 female yes 2 3.360 2
## 111 0 female yes 0 3.470 11
## 113 0 female yes 1 3.360 2
## 114 0 male yes 0 2.540 5
## 115 0 male yes 2 2.150 4
## 116 0 male yes 1 4.540 3
## 117 0 male yes 0 1.680 4
## 118 0 female yes 1 2.550 0
## 120 0 male yes 1 3.470 2
## 121 0 female yes 0 3.470 1
## 123 0 male yes 1 2.120 10
## 126 0 male yes 1 2.860 13
## 127 0 female yes 1 4.290 9
## 128 0 male yes 0 3.210 2
## 130 0 female yes 0 1.810 5
## 132 0 male yes 1 3.360 23
## 133 0 female yes 0 4.540 4
## 134 0 female yes 1 4.290 4
## 136 0 male yes 2 4.620 30
## 137 0 female yes 1 3.590 14
## 139 0 male yes 3 2.860 1
## 141 0 female yes 1 2.500 0
## 142 0 female yes 0 4.620 0
## 144 0 female yes 1 3.360 3
## 146 0 female yes 2 3.410 5
## 147 0 male yes 0 2.100 0
## 149 0 male yes 0 3.360 2
## 150 0 male yes 3 3.590 7
## 152 0 female yes 0 3.590 12
## 154 0 male yes 3 4.540 11
## 156 0 male yes 1 2.210 5
## 157 0 male yes 2 3.690 5
## 158 0 female yes 0 1.780 1
## 160 0 male yes 0 2.860 8
## 161 0 female yes 0 2.580 3
## 163 0 female yes 1 1.220 11
## 168 0 female yes 0 1.860 6
## 169 0 male yes 0 2.960 0
## 170 0 female yes 0 3.690 7
## 171 0 female yes 0 3.690 2
## 172 0 female yes 0 4.290 1
## 175 0 male yes 2 2.320 2
## 179 0 female yes 2 4.540 6
## 180 0 male yes 1 2.100 0
## 181 0 female yes 1 2.540 0
## 182 0 male yes 1 2.210 19
## 184 0 male yes 1 2.100 12
## 186 0 female yes 1 4.620 15
## 190 0 female yes 0 1.830 2
## 192 0 female yes 1 4.290 6
## 194 0 male yes 0 2.140 1
## 195 0 male yes 2 3.400 13
## 197 0 female yes 0 2.960 0
## 198 0 female yes 2 3.190 0
## 199 0 male yes 1 3.690 16
## 200 0 female yes 2 1.255 0
## 201 0 male yes 2 4.140 12
## 202 0 male yes 1 2.390 5
## 203 0 male yes 2 3.920 2
## 205 0 female yes 0 2.120 2
## 206 0 female yes 2 2.120 1
## 207 0 female yes 0 2.610 3
## 209 0 male yes 3 2.860 7
## 210 0 female yes 0 2.390 0
## 211 0 male yes 2 3.340 1
## 213 0 female yes 1 3.590 8
## 214 0 male yes 2 4.540 1
## 215 0 female yes 0 3.590 1
## 217 0 male yes 0 1.520 4
## 218 0 male yes 0 4.290 6
## 219 0 female yes 0 4.620 5
## 220 0 male yes 1 4.290 13
## 221 0 male yes 0 2.510 3
## 223 0 female yes 0 2.960 8
## 224 0 female yes 0 3.690 3
## 225 0 female yes 0 3.470 2
## 226 0 male yes 2 4.290 15
## 229 0 female yes 0 2.000 6
## 230 0 male yes 0 2.320 4
## 231 0 female yes 1 2.000 9
## 232 0 male yes 1 1.680 27
## 234 0 male yes 0 2.200 2
## 235 0 male yes 1 2.120 10
## 238 0 male yes 2 4.290 24
## 239 0 male yes 1 2.100 0
## 243 0 male yes 1 2.580 6
## 244 0 female yes 0 3.150 7
## 247 0 male yes 2 3.590 5
## 251 0 male yes 0 3.400 13
## 254 0 female yes 0 2.860 13
## 257 0 female yes 0 2.390 2
## 258 0 male yes 2 2.860 11
## 259 0 female yes 0 2.960 7
## 261 0 male yes 1 1.810 5
## 262 0 male yes 1 4.290 2
## 263 0 male yes 1 2.100 0
## 265 0 male yes 2 4.290 2
## 266 0 male yes 0 4.290 2
## 267 0 male yes 2 3.400 0
## 269 0 male yes 2 2.320 5
## 271 0 female yes 0 2.580 0
## 272 0 male yes 0 3.690 3
## 273 0 male yes 2 3.410 7
## 274 0 male yes 0 2.320 0
## 275 0 male yes 1 3.690 8
## 276 1 male yes 0 2.540 4
## 277 1 female yes 1 1.760 4
## 278 1 male yes 1 4.290 13
## 279 1 male yes 3 2.100 0
## 280 1 female yes 1 3.090 12
## 282 1 male yes 0 2.100 0
## 283 1 female yes 1 3.750 7
## 287 1 male yes 0 2.000 4
## 288 1 male yes 1 2.000 16
## 289 1 male yes 1 2.610 6
## 290 1 male yes 0 4.250 12
## 292 1 female yes 0 4.290 11
## 293 1 male yes 0 2.100 2
## 294 1 female yes 0 2.870 5
## 295 1 female yes 0 3.470 3
## 296 1 male yes 0 1.780 1
## 297 1 male yes 0 4.140 15
## 298 1 male yes 3 4.290 0
## 302 1 female yes 0 2.610 7
## 303 1 male yes 0 1.680 34
## 304 1 female yes 0 3.190 3
## 305 1 male yes 1 3.590 5
## 306 1 male yes 0 2.500 0
## 310 1 male yes 1 3.920 0
## 311 1 male yes 2 2.960 0
## 313 1 male yes 0 4.290 11
## 314 1 female yes 1 3.320 24
## 317 1 female yes 0 1.640 22
## 320 1 female yes 0 4.290 6
## 321 1 male yes 0 1.750 3
## 322 1 male yes 0 2.960 8
## 324 1 male yes 2 4.250 20
## 325 1 male yes 2 2.560 22
## 327 1 male yes 2 3.920 2
## 328 1 male yes 1 1.780 77
## 329 1 female yes 0 3.400 14
## 330 1 male yes 1 1.740 4
## 333 1 female yes 0 2.870 18
## 334 1 male yes 0 4.290 6
## 335 1 female yes 0 3.190 2
## 336 1 male yes 1 1.220 1
## 337 1 female yes 2 3.540 17
## 338 1 male yes 1 4.290 1
## 339 1 male yes 1 4.620 3
## 343 1 male yes 1 3.400 2
## 344 1 female yes 0 1.280 2
## 345 1 male yes 2 1.740 4
## 346 1 male yes 1 2.260 1
## 347 1 female yes 0 3.590 5
## 348 1 male yes 1 4.620 16
## 351 1 male yes 1 2.390 3
## 352 1 male yes 0 2.260 1
## 353 1 male yes 2 2.860 7
## 354 1 male yes 2 2.760 8
## 355 1 male yes 1 1.630 8
## 356 1 male yes 2 4.290 12
## 358 1 female yes 0 2.120 0
## 359 1 female yes 1 2.610 6
## 360 1 male yes 0 1.800 1
## 361 1 female yes 0 4.290 21
## 363 1 female yes 0 4.620 16
## 365 1 male yes 2 2.100 0
## 366 1 female yes 0 2.000 5
## 368 1 male yes 2 1.750 2
## 372 1 male yes 1 3.920 8
## 373 1 male yes 2 2.510 3
## 375 1 male yes 1 2.000 11
## 379 1 male yes 0 4.620 1
## 380 1 male yes 1 2.560 16
## 381 1 male yes 0 4.620 18
## 382 1 male yes 0 3.590 10
## 383 1 male yes 2 4.290 6
## 386 1 male yes 0 3.190 3
## 387 1 female yes 0 3.590 1
## 388 1 female yes 0 2.960 19
## 390 1 male yes 3 2.960 6
## 391 1 female yes 0 4.540 13
## 392 1 male yes 1 4.540 10
## 393 1 male yes 2 2.500 4
## 394 1 male yes 0 1.680 8
## 395 1 male yes 0 2.320 4
## 396 1 female yes 3 3.190 9
## 398 1 female yes 0 1.250 5
## 400 1 female yes 0 4.620 4
## 402 1 female yes 0 3.150 9
## 404 1 female yes 0 1.950 3
## 406 1 female yes 0 4.540 2
## 407 1 female yes 2 2.580 2
## 408 1 female yes 0 3.850 29
## 409 1 male yes 1 3.410 10
## 410 1 female yes 1 2.260 9
## 412 1 male yes 1 3.590 6
## 413 1 female yes 1 2.120 9
## 414 1 male yes 0 2.960 7
## 418 1 female yes 2 2.860 7
## 419 1 male yes 0 4.540 2
## 420 1 male yes 0 3.590 12
## 421 1 female yes 0 4.620 18
## 422 1 male yes 3 1.670 3
## 423 1 male yes 2 1.750 1
## 424 1 female yes 1 2.830 5
## 425 1 male yes 3 3.150 11
## 426 1 male yes 1 3.590 9
## 429 1 male yes 0 4.290 0
## 430 1 male yes 2 4.290 0
## 431 1 female yes 0 2.390 7
## 432 1 male yes 1 4.540 3
## 433 1 male yes 0 2.320 4
## 435 1 male yes 1 3.690 5
## 438 1 male yes 0 2.760 5
## 440 1 male yes 2 3.620 4
## 441 1 male yes 1 4.290 14
## 443 1 female yes 1 2.390 9
## 445 1 male yes 0 1.780 4
## 446 1 male yes 1 2.100 8
## 447 1 female yes 0 2.250 3
## 448 1 male yes 1 2.260 5
## 449 1 male yes 0 1.860 5
## 451 1 male yes 0 4.340 10
## 455 1 male yes 1 4.540 45
## 458 1 male yes 0 1.520 2
## 459 1 male yes 0 2.550 11
## 460 1 female yes 0 1.180 1
## 461 1 female yes 2 3.090 9
## 463 1 female yes 0 2.320 1
## 465 1 male yes 0 4.290 1
## 468 1 male yes 1 3.590 2
## 471 1 female yes 0 3.590 32
## 474 1 female yes 0 1.750 0
## 475 1 female yes 0 3.470 3
## 476 1 male yes 1 2.610 4
## 478 1 male yes 2 4.290 9
## 480 1 female yes 0 4.620 18
## 481 1 male yes 1 2.860 17
## 482 1 male yes 1 2.860 17
## 483 1 male yes 0 2.860 39
## 485 1 female yes 0 1.760 8
## 486 1 male yes 0 2.500 0
## 489 1 female yes 1 3.540 14
## 490 1 female yes 0 3.690 1
## 493 1 male yes 1 4.340 4
## 494 1 male yes 0 3.540 11
## 495 1 male yes 2 4.290 10
## 496 1 male yes 0 1.810 0
## 498 1 male yes 1 1.810 5
## 500 1 female yes 1 2.320 5
## 502 1 male yes 1 4.290 2
## 503 1 male yes 1 2.860 2
## 504 1 female yes 1 2.860 2
## 505 1 male yes 1 1.220 0
## 506 1 male yes 0 2.100 0
## 507 1 male yes 1 1.680 12
## 509 1 female yes 0 2.870 15
## 510 1 male yes 1 3.470 1
## 512 1 male yes 1 3.540 21
## 513 1 female yes 0 1.950 11
## 514 1 male yes 1 3.590 19
## 517 1 female yes 2 4.290 13
## 518 1 male yes 2 3.190 5
## 519 1 male yes 0 2.960 0
## 520 1 male yes 1 2.760 7
## 521 1 female yes 0 1.810 11
## 522 2 male yes 0 3.360 4
## 525 2 female yes 0 4.540 10
## 527 2 female yes 0 3.090 2
## 531 2 male yes 1 4.290 2
## 532 2 female yes 1 1.740 4
## 533 2 male yes 2 2.960 8
## 535 2 male yes 1 4.540 10
## 537 2 male yes 1 4.290 13
## 539 2 female yes 0 3.590 0
## 543 2 female yes 1 3.470 11
## 545 2 male yes 0 1.950 4
## 546 2 male yes 2 2.960 46
## 547 2 male yes 1 4.540 53
## 548 2 male yes 0 3.400 9
## 549 2 male yes 0 2.100 4
## 550 2 male yes 2 4.290 8
## 553 2 male yes 1 2.500 2
## 554 2 female yes 1 4.620 17
## 555 2 female yes 0 1.800 10
## 558 2 male yes 2 1.800 6
## 559 2 female yes 0 3.590 5
## 560 2 male yes 0 2.760 3
## 561 2 male yes 0 4.140 16
## 564 2 female yes 0 0.920 0
## 566 2 male yes 1 2.390 4
## 567 2 male yes 0 1.180 0
## 568 2 male yes 2 4.540 2
## 569 2 female yes 2 3.850 47
## 570 2 male yes 2 2.960 21
## 571 2 female yes 0 3.360 8
## 572 2 female yes 0 3.190 5
## 573 2 female yes 1 3.690 15
## 574 2 male yes 0 1.630 8
## 575 2 male yes 0 1.720 1
## 576 2 female yes 0 2.580 5
## 577 2 male yes 0 1.520 5
## 579 2 female yes 2 1.220 4
## 582 2 male yes 2 2.870 20
## 583 2 male yes 1 3.150 7
## 585 2 male yes 1 1.760 7
## 586 2 male yes 1 1.520 3
## 588 2 male yes 2 4.290 10
## 589 2 male yes 1 2.560 5
## 591 2 female yes 0 1.860 5
## 593 2 female yes 0 3.920 7
## 595 2 male yes 1 4.290 14
## 596 2 female yes 1 3.690 10
## 597 2 male yes 2 1.970 0
## 598 2 male yes 1 3.190 10
## 601 2 male yes 0 2.830 1
## 602 2 male yes 3 4.340 7
## 606 2 male yes 0 4.290 24
## 607 2 male yes 1 2.760 8
## 608 2 female yes 0 3.750 0
## 609 2 male yes 1 4.290 12
## 610 2 male yes 2 2.210 12
## 611 2 male yes 0 3.540 21
## 612 2 male yes 0 2.960 2
## 613 2 female yes 0 2.120 2
## 617 2 female yes 0 4.540 9
## 619 2 male yes 0 1.760 0
## 620 2 male yes 2 4.340 17
## 621 2 female yes 0 2.520 16
## 622 2 male yes 1 2.560 7
## 624 2 female yes 0 1.400 0
## 625 2 male yes 2 3.320 27
## 626 2 male yes 0 2.510 5
## 627 2 female yes 2 2.580 3
## 628 2 male yes 2 3.540 16
## 629 2 male yes 0 4.540 11
## 631 2 male yes 0 4.340 5
## 632 2 female yes 1 3.470 4
## 634 2 male yes 2 2.500 5
## 635 2 male yes 3 2.000 8
## 637 2 female yes 0 4.620 23
## 642 2 male yes 0 3.690 5
## 643 2 male yes 0 4.290 17
## 645 2 male yes 0 4.290 13
## 646 2 female yes 1 3.210 7
## 648 2 male yes 0 2.500 0
## 650 2 female yes 0 3.750 4
## 652 2 male yes 0 3.190 11
## 653 2 female yes 1 2.000 7
## 654 2 female yes 0 3.090 1
## 655 2 female yes 1 3.590 2
## 656 2 female yes 0 4.340 11
## 658 2 male yes 0 2.100 2
## 660 2 male yes 1 2.100 3
## 661 2 male yes 1 1.780 1
## 662 2 male yes 0 2.510 0
## 663 2 male yes 1 2.520 10
## 664 2 female yes 1 3.400 4
## 665 2 female yes 1 3.090 3
## 666 2 male yes 0 4.290 13
## 667 2 female yes 0 2.960 8
## 668 2 female yes 2 3.590 11
## 670 2 female yes 0 3.590 11
## 671 2 male yes 1 3.420 3
## 672 2 female yes 1 4.290 4
## 674 2 female yes 1 4.290 11
## 675 2 male yes 0 4.620 3
## 676 2 male yes 2 1.860 6
## 677 2 male yes 0 4.620 8
## 678 2 female yes 2 4.540 48
## 679 2 female yes 0 3.750 8
## 680 2 male yes 0 1.760 0
## 681 2 female yes 0 3.410 31
## 682 2 male yes 0 2.550 24
## 683 2 male yes 1 1.250 2
## 684 2 female yes 0 1.480 9
## 685 2 female yes 0 2.830 3
## 686 2 female yes 0 4.290 6
## 689 2 female yes 2 3.210 2
## 691 2 female yes 0 1.450 7
## 692 2 female yes 1 3.340 4
## 694 2 male yes 2 4.290 30
## 697 2 female yes 1 4.540 7
## 698 2 male yes 1 4.540 6
## 703 3 male yes 2 4.540 31
## 704 3 male yes 0 3.090 5
## 705 3 male yes 1 1.950 14
## 706 3 female yes 1 3.590 3
## 707 3 male yes 1 2.610 5
## 710 3 female yes 0 3.410 19
## 711 3 female yes 1 2.320 5
## 712 3 female yes 0 2.120 3
## 713 3 male yes 0 4.540 37
## 714 3 male yes 0 2.960 8
## 716 3 male yes 0 2.320 4
## 717 3 male yes 2 1.800 6
## 719 3 female yes 1 4.620 14
## 721 3 male yes 0 4.540 5
## 723 3 male yes 2 4.290 0
## 724 3 male yes 1 2.960 5
## 725 3 male yes 2 4.290 25
## 726 3 male yes 1 4.290 18
## 727 3 male yes 1 2.540 6
## 731 3 female yes 0 3.750 6
## 732 3 male yes 2 1.950 3
## 733 3 male yes 1 1.800 4
## 734 3 male yes 0 2.760 8
## 736 3 male yes 0 4.250 20
## 737 3 male yes 2 2.830 7
## 739 3 female yes 0 1.180 0
## 740 3 female yes 0 3.360 11
## 741 3 female yes 0 4.290 21
## 742 3 female yes 1 4.620 49
## 744 3 male yes 0 3.690 24
## 745 3 male yes 0 2.260 12
## 747 3 male yes 1 4.290 19
## 748 3 male yes 0 1.420 3
## 749 3 female yes 2 1.890 16
## 750 3 male yes 0 3.690 26
## 751 3 female yes 0 2.960 22
## 752 3 female yes 1 1.860 1
## 753 3 female yes 0 2.260 6
## 754 3 male yes 0 4.290 15
## 755 3 female yes 0 3.150 4
## 756 3 male yes 0 2.610 0
## 758 3 male yes 1 2.210 10
## 759 3 male yes 0 1.780 0
## 760 3 male yes 1 3.620 5
## 761 3 male yes 0 3.920 0
## 762 3 female yes 0 4.620 10
## 763 3 male yes 0 2.610 5
## 764 3 female yes 1 3.360 3
## 765 3 female yes 0 3.690 12
## 766 3 male yes 0 3.470 14
## 767 3 male yes 0 1.250 4
## 768 3 male yes 0 4.620 18
## 769 3 male yes 1 3.590 14
## 771 3 male yes 0 4.290 38
## 773 3 male yes 2 2.580 2
## 775 3 male yes 0 3.470 8
## 776 3 female yes 0 4.620 14
## 778 3 male yes 2 2.100 4
## 779 3 male yes 2 1.380 8
## 780 3 male yes 1 3.090 5
## 781 3 male yes 3 2.860 3
## 783 3 female yes 1 1.220 3
## 784 4 male yes 0 2.830 5
## 785 4 female yes 0 4.540 16
## 786 4 male yes 0 4.290 22
## 788 4 male yes 0 3.540 9
## 791 4 female yes 0 4.340 6
## 792 4 female yes 1 2.510 2
## 793 4 male yes 0 4.290 2
## 794 4 male yes 1 2.960 0
## 797 4 female yes 0 3.400 5
## 799 4 male yes 1 2.960 57
## 800 4 female yes 0 3.540 5
## 801 4 male yes 2 1.720 2
## 802 4 male yes 2 2.860 15
## 803 4 male yes 2 4.540 66
## 804 4 male yes 1 1.760 11
## 805 4 male yes 2 1.860 15
## 806 4 male yes 0 3.470 4
## 808 4 male yes 0 1.810 10
## 809 4 male yes 2 2.050 13
## 811 4 female yes 0 2.260 3
## 812 4 male yes 1 1.860 47
## 813 4 female yes 1 4.290 4
## 814 4 male yes 2 3.540 2
## 815 4 male yes 0 4.290 30
## 816 4 male yes 0 2.540 11
## 817 4 female yes 0 4.250 13
## 819 4 female yes 1 3.540 12
## 820 4 female yes 0 3.190 8
## 821 4 male yes 2 4.540 21
## 823 4 female yes 0 2.580 14
## 824 4 female yes 0 1.280 4
## 825 4 female yes 0 3.210 14
## 832 4 male yes 1 2.550 21
## 834 4 female yes 0 2.360 5
## 835 4 male yes 1 4.250 29
## 836 4 male yes 1 4.290 5
## 837 4 female yes 0 3.190 7
## 840 4 male yes 0 1.760 7
## 841 4 male yes 1 2.580 25
## 842 4 female yes 0 3.410 4
## 844 4 female yes 0 1.780 4
## 846 4 male yes 2 3.690 16
## 847 4 male yes 0 3.620 5
## 848 4 male yes 0 1.505 4
## 849 4 male yes 2 2.580 6
## 851 5 female yes 0 2.260 16
## 853 5 male yes 2 3.850 15
## 854 5 male yes 1 3.150 5
## 855 5 male yes 1 3.150 27
## 856 5 male yes 0 4.340 6
## 857 5 male yes 0 4.250 12
## 860 5 male yes 1 2.580 25
## 861 5 male yes 1 3.590 21
## 862 5 male yes 1 2.960 4
## 863 5 male yes 0 4.540 13
## 864 5 male yes 0 4.290 30
## 866 5 female yes 0 4.540 15
## 867 5 female yes 1 3.850 1
## 868 5 male yes 0 2.500 4
## 869 5 male yes 1 3.470 0
## 870 5 female yes 0 2.860 24
## 871 5 female yes 0 4.620 0
## 872 5 male yes 1 4.540 53
## 873 5 male yes 0 1.250 2
## 874 5 female yes 0 3.210 19
## 875 5 male yes 1 1.760 11
## 878 6 male yes 1 4.620 8
## 879 6 female yes 0 2.100 36
## 880 6 female yes 2 1.860 38
## 881 6 male yes 0 4.340 9
## 882 6 female yes 0 4.290 24
## 883 6 male yes 2 2.510 11
## 884 6 male yes 1 2.960 13
## 888 6 male yes 1 3.850 16
## 892 6 female yes 0 4.290 1
## 895 7 male yes 0 3.590 1
## 898 7 male yes 1 1.970 0
## 902 7 male yes 0 3.690 9
## 905 7 male yes 1 3.590 27
## 907 8 male yes 0 2.510 11
## 908 9 male yes 1 2.960 23
## 909 9 male yes 1 1.860 47
## 910 10 female yes 0 3.590 18
## 911 11 male yes 2 2.860 7
## 912 12 male yes 1 4.290 35
## 913 12 male yes 1 1.860 5
## 914 16 male yes 0 1.740 21
## 915 19 male yes 0 1.860 42
Ngược lại, ta lọc lấy dữ liệu của những nghiên cứu sinh chưa kết hôn và có 309 người chưa kết hôn (34%)
no <- p[p$ma== 'no',]
no
## a g ma k pr m
## 2 0 female no 0 2.050 6
## 3 0 female no 0 3.750 6
## 5 0 female no 0 3.750 26
## 7 0 female no 0 3.190 3
## 9 0 male no 0 4.620 6
## 11 0 male no 0 2.960 14
## 12 0 female no 0 0.755 13
## 16 0 female no 0 3.090 1
## 19 0 female no 0 3.360 7
## 20 0 female no 0 4.290 9
## 29 0 female no 0 3.090 0
## 31 0 female no 0 2.390 0
## 33 0 female no 0 1.505 13
## 34 0 male no 0 2.100 0
## 36 0 female no 0 2.000 0
## 37 0 female no 0 1.750 0
## 38 0 male no 0 4.290 9
## 41 0 male no 0 4.290 9
## 43 0 male no 0 3.920 5
## 45 0 male no 0 2.100 6
## 49 0 female no 0 4.540 14
## 51 0 male no 0 4.540 5
## 56 0 female no 0 2.120 11
## 57 0 female no 0 3.210 2
## 60 0 male no 0 2.960 0
## 61 0 female no 0 2.860 6
## 63 0 female no 0 3.750 4
## 70 0 female no 0 1.005 0
## 71 0 male no 0 2.120 2
## 74 0 male no 0 4.290 2
## 80 0 female no 0 3.210 5
## 81 0 female no 0 2.100 2
## 87 0 female no 0 4.290 35
## 95 0 male no 0 4.140 5
## 97 0 male no 0 4.620 8
## 98 0 female no 0 3.620 7
## 101 0 female no 0 3.750 5
## 108 0 female no 0 2.050 6
## 112 0 female no 0 2.120 0
## 119 0 female no 0 2.120 11
## 122 0 female no 0 3.360 9
## 124 0 female no 0 2.100 1
## 125 0 female no 0 4.290 1
## 129 0 male no 0 2.100 0
## 131 0 female no 0 2.520 2
## 135 0 female no 0 2.120 9
## 138 0 female no 0 3.590 4
## 140 0 female no 0 1.505 3
## 143 0 male no 0 2.500 0
## 145 0 female no 0 2.000 2
## 148 0 female no 0 2.000 2
## 151 0 male no 0 2.140 2
## 153 0 female no 0 2.390 10
## 155 0 male no 0 2.960 2
## 159 0 female no 0 2.860 11
## 162 0 female no 0 3.750 1
## 164 0 female no 0 2.100 9
## 165 0 female no 0 3.590 18
## 166 0 female no 0 3.540 5
## 167 0 female no 0 2.860 16
## 173 0 female no 0 2.520 1
## 174 0 female no 0 1.760 10
## 176 0 female no 0 3.690 2
## 177 0 female no 0 3.750 14
## 178 0 female no 0 4.290 5
## 183 0 male no 0 4.540 8
## 185 0 male no 0 2.260 5
## 187 0 female no 0 2.760 4
## 188 0 female no 0 4.290 12
## 189 0 female no 0 0.755 0
## 191 0 female no 0 1.790 0
## 193 0 female no 0 2.500 0
## 196 0 female no 0 2.870 15
## 204 0 female no 0 2.960 4
## 208 0 male no 0 4.290 0
## 212 0 female no 0 3.620 8
## 216 0 male no 0 4.290 9
## 222 0 male no 0 2.860 3
## 227 0 male no 0 4.290 0
## 228 0 female no 0 3.920 1
## 233 0 male no 0 3.470 0
## 236 0 female no 0 1.400 14
## 237 0 female no 0 3.360 3
## 240 0 male no 0 4.290 5
## 241 0 female no 0 4.290 0
## 242 0 female no 0 2.830 1
## 245 0 male no 0 4.290 2
## 246 0 male no 0 2.960 0
## 248 0 female no 0 2.390 15
## 249 0 female no 0 1.250 2
## 250 0 female no 0 2.760 1
## 252 0 male no 0 4.290 7
## 253 0 female no 0 3.690 4
## 255 0 female no 0 4.290 3
## 256 0 female no 0 4.140 2
## 260 0 male no 0 3.590 8
## 264 0 female no 0 3.190 0
## 268 0 male no 0 4.290 35
## 270 0 male no 0 1.680 5
## 281 1 female no 0 3.360 6
## 284 1 female no 0 2.140 6
## 285 1 female no 0 4.290 22
## 286 1 female no 0 2.000 2
## 291 1 male no 0 2.360 14
## 299 1 male no 0 4.290 3
## 300 1 male no 0 1.810 10
## 301 1 female no 0 2.320 15
## 307 1 male no 0 3.400 6
## 308 1 female no 0 2.260 4
## 309 1 male no 0 3.400 12
## 312 1 male no 0 4.290 15
## 315 1 male no 0 1.860 15
## 316 1 female no 0 2.870 6
## 318 1 female no 0 2.250 7
## 319 1 female no 0 2.100 8
## 323 1 female no 0 2.250 4
## 326 1 female no 0 3.190 11
## 331 1 male no 0 4.290 6
## 332 1 female no 0 2.000 6
## 340 1 female no 0 2.000 6
## 341 1 female no 0 3.590 3
## 342 1 female no 0 3.190 6
## 349 1 female no 0 1.400 2
## 350 1 female no 0 0.920 4
## 357 1 female no 0 1.400 3
## 362 1 female no 0 3.690 18
## 364 1 male no 0 2.150 10
## 367 1 female no 0 1.255 0
## 369 1 female no 0 3.850 2
## 370 1 male no 0 4.250 4
## 371 1 female no 0 3.470 3
## 374 1 female no 0 1.400 12
## 376 1 female no 0 2.000 10
## 377 1 male no 0 4.290 2
## 378 1 male no 0 3.360 10
## 384 1 female no 0 3.590 8
## 385 1 female no 0 4.290 6
## 389 1 female no 0 2.580 2
## 397 1 female no 0 2.210 2
## 399 1 male no 0 4.140 5
## 401 1 female no 0 4.540 37
## 403 1 male no 0 4.290 11
## 405 1 male no 0 2.000 9
## 411 1 female no 0 4.250 2
## 415 1 female no 0 2.520 0
## 416 1 female no 0 2.260 4
## 417 1 female no 0 4.540 9
## 427 1 female no 0 3.750 24
## 428 1 female no 0 2.050 17
## 434 1 female no 0 4.290 25
## 436 1 male no 0 4.290 9
## 437 1 male no 0 3.920 2
## 439 1 male no 0 2.760 6
## 442 1 male no 0 2.870 12
## 444 1 male no 0 4.290 14
## 450 1 female no 0 3.920 4
## 452 1 female no 0 3.360 4
## 453 1 female no 0 2.510 1
## 454 1 female no 0 3.750 21
## 456 1 female no 0 1.630 8
## 457 1 female no 0 4.620 10
## 462 1 female no 0 4.620 5
## 464 1 male no 0 2.050 3
## 466 1 male no 0 3.400 2
## 467 1 male no 0 4.290 10
## 469 1 male no 0 3.360 5
## 470 1 female no 0 2.050 13
## 472 1 female no 0 3.850 18
## 473 1 male no 0 3.360 0
## 477 1 male no 0 2.760 4
## 479 1 female no 0 1.400 3
## 484 1 male no 0 2.000 7
## 487 1 female no 0 4.290 17
## 488 1 male no 0 2.560 16
## 491 1 male no 0 2.870 5
## 492 1 female no 0 1.655 0
## 497 1 female no 0 3.400 7
## 499 1 female no 0 3.190 18
## 501 1 female no 0 4.540 19
## 508 1 female no 0 3.360 34
## 511 1 male no 0 2.760 7
## 515 1 female no 0 3.190 3
## 516 1 female no 0 2.760 2
## 523 2 male no 0 3.090 14
## 524 2 female no 0 3.750 8
## 526 2 female no 0 1.630 6
## 528 2 female no 0 3.690 4
## 529 2 female no 0 2.120 2
## 530 2 female no 0 2.260 3
## 534 2 female no 0 2.580 5
## 536 2 female no 0 4.620 12
## 538 2 female no 0 4.540 13
## 540 2 female no 0 4.290 5
## 541 2 male no 0 3.690 26
## 542 2 female no 0 3.210 0
## 544 2 male no 0 4.540 37
## 551 2 female no 0 3.750 5
## 552 2 female no 0 2.050 2
## 556 2 female no 0 3.090 0
## 557 2 male no 0 4.290 10
## 562 2 male no 0 3.590 3
## 563 2 female no 0 4.540 12
## 565 2 female no 0 4.290 15
## 578 2 male no 0 2.860 4
## 580 2 female no 0 2.540 4
## 581 2 female no 0 3.360 4
## 584 2 female no 0 4.620 14
## 587 2 male no 0 4.290 5
## 590 2 male no 0 4.540 29
## 592 2 female no 0 4.290 1
## 594 2 male no 0 2.260 2
## 599 2 female no 0 4.540 5
## 600 2 male no 0 4.290 25
## 603 2 female no 0 3.360 3
## 604 2 female no 0 3.410 14
## 605 2 female no 0 2.860 3
## 614 2 male no 0 2.390 4
## 615 2 female no 0 3.190 5
## 616 2 female no 0 1.970 8
## 618 2 female no 0 2.550 36
## 623 2 male no 0 4.540 10
## 630 2 male no 0 4.290 17
## 633 2 female no 0 3.470 5
## 636 2 male no 0 3.920 10
## 638 2 female no 0 3.090 6
## 639 2 female no 0 2.320 4
## 640 2 female no 0 4.290 21
## 641 2 female no 0 3.360 7
## 644 2 female no 0 3.590 11
## 647 2 female no 0 2.260 8
## 649 2 male no 0 2.260 3
## 651 2 female no 0 4.290 4
## 657 2 female no 0 2.870 9
## 659 2 female no 0 2.830 26
## 669 2 male no 0 4.540 55
## 673 2 female no 0 3.190 4
## 687 2 female no 0 3.190 10
## 688 2 female no 0 1.400 0
## 690 2 male no 0 4.620 9
## 693 2 female no 0 4.540 23
## 695 2 female no 0 3.690 7
## 696 2 female no 0 2.580 2
## 699 2 male no 0 4.290 9
## 700 3 female no 0 4.290 12
## 701 3 female no 0 3.750 0
## 702 3 male no 0 4.620 8
## 708 3 male no 0 2.870 12
## 709 3 male no 0 4.290 30
## 715 3 male no 0 2.870 12
## 718 3 female no 0 2.390 11
## 720 3 female no 0 4.290 10
## 722 3 male no 0 3.590 16
## 728 3 male no 0 3.920 0
## 729 3 male no 0 2.320 8
## 730 3 female no 0 4.620 22
## 735 3 male no 0 3.590 7
## 738 3 female no 0 2.520 4
## 743 3 male no 0 2.830 8
## 746 3 female no 0 2.050 5
## 757 3 female no 0 4.540 3
## 770 3 female no 0 3.360 2
## 772 3 male no 0 3.540 12
## 774 3 male no 0 1.520 3
## 777 3 male no 0 3.540 25
## 782 3 female no 0 4.290 5
## 787 4 male no 0 4.290 7
## 789 4 male no 0 2.520 6
## 790 4 female no 0 1.400 3
## 795 4 male no 0 3.850 47
## 796 4 male no 0 4.540 5
## 798 4 male no 0 3.410 21
## 807 4 male no 0 3.410 7
## 810 4 male no 0 4.620 18
## 818 4 female no 0 2.500 10
## 822 4 female no 0 2.860 39
## 826 4 female no 0 2.870 6
## 827 4 female no 0 3.340 11
## 828 4 female no 0 3.150 8
## 829 4 female no 0 2.320 8
## 830 4 male no 0 4.290 19
## 831 4 male no 0 3.690 7
## 833 4 female no 0 4.620 3
## 838 4 female no 0 3.190 3
## 839 4 female no 0 2.560 23
## 843 4 female no 0 3.590 9
## 845 4 female no 0 3.750 3
## 850 4 male no 0 2.870 15
## 852 5 female no 0 3.750 13
## 858 5 male no 0 3.360 11
## 859 5 female no 0 3.590 14
## 865 5 female no 0 2.870 12
## 876 5 female no 0 2.580 6
## 877 5 female no 0 3.620 3
## 885 6 male no 0 4.290 18
## 886 6 male no 0 3.400 14
## 887 6 female no 0 4.540 12
## 889 6 female no 0 3.150 9
## 890 6 female no 0 4.540 15
## 891 6 male no 0 3.470 6
## 893 6 male no 0 1.970 4
## 894 6 female no 0 3.320 6
## 896 7 male no 0 2.540 6
## 897 7 male no 0 3.410 20
## 899 7 female no 0 3.150 9
## 900 7 male no 0 4.620 15
## 901 7 male no 0 4.540 42
## 903 7 male no 0 4.340 19
## 904 7 male no 0 4.290 19
## 906 7 male no 0 3.690 19
Ta dùng lệch summary tóm tắt thống kê dữ liệu. Ta có thể biết các thông tin về min, max, trung bình, trung vị, tứ phân vị của các biến trong tập dữ liệu.
summary(p)
## a g ma k pr
## Min. : 0.000 male :494 no :309 Min. :0.0000 Min. :0.755
## 1st Qu.: 0.000 female:421 yes:606 1st Qu.:0.0000 1st Qu.:2.260
## Median : 1.000 Median :0.0000 Median :3.150
## Mean : 1.693 Mean :0.4951 Mean :3.103
## 3rd Qu.: 2.000 3rd Qu.:1.0000 3rd Qu.:3.920
## Max. :19.000 Max. :3.0000 Max. :4.620
## m
## Min. : 0.000
## 1st Qu.: 3.000
## Median : 6.000
## Mean : 8.767
## 3rd Qu.:12.000
## Max. :77.000
Ta cũng có thể sử dụng các lệnh thống kê để phân tích biến a (số bài báo cáo)
Kết quả cho thấy:
-Trung bình số bài báo cáo của 1 nghiên cứu sinh là gần được 2 bài
-Trung vị là 1 cho biết có 50% số nghiên cứu sinh có số bài báo cáo ít hơn 1
-Độ lệch chuẩn của biến a là 1.92
-Phương sai của biến a là 3.7
-Hàm Quantile cho biết 70% nghiên cứu sinh có số lượng bài báo cáo ít hơn 2
mean(p$a)
## [1] 1.692896
median(p$a)
## [1] 1
sd(p$a)
## [1] 1.926069
var(p$a)
## [1] 3.709742
quantile(p$a,0.7)
## 70%
## 2
Đầu tiên, ta nhìn tổng quan biến a (số bài báo cáo)
Chia số bài báo cáo thành 3 tổ khác nhau
Sau đó, lập bảng thống kê với biến a
Ta thấy, tổ it là tổ có số bài báo cáo từ 1 bài đến 6 bài có số lượng nghiên cứu sinh nhiều nhất là 619 người(67%)
Tổ trungbinh là tổ có số bài báo cáo từ 6 đến 12 bài có số lượng nghiên cứu sinh chiếm thứ 2 là 19 người (2%)
Tổ nhieu là tổ có số bài báo cáo từ 12 bài trở lên có số lượng nghiên cứu sinh chiếm ít nhất là 2 người(0.2%)
Phần còn lại là số nghiên cứu sinh không có bài báo cáo nào với 275 người.
summary(p$a)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 0.000 1.000 1.693 2.000 19.000
sbbc <- cut(p$a, breaks = c(0,6,12,19), labels = c('it','trungbinh','nhieu'))
table(sbbc)
## sbbc
## it trungbinh nhieu
## 619 19 2
Thống kê tổng hợp dữ liệu của biến a theo biến g và tính trung bình của các biến trong g theo a bằng lệnh aggregate
Từ kết quả ta thấy, những nam nghiên cứu sinh trung bình làm khoảng 2 bài báo cáo
Còn những nữ nghiên cứu sinh trung bình làm được 1 bài báo cáo
aggregate(p$a, list(p$g), FUN = 'mean')
## Group.1 x
## 1 male 1.882591
## 2 female 1.470309
Ta dùng lệnh “group_by” để phân nhóm dữ liệu theo giới tính
Bên cạnh đó, có thể dùng lệnh summarise để tính trung bình số bài báo cáo các nghiên cứu sinh làm được theo giới tính
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.2 ✔ readr 2.1.4
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ ggplot2 3.4.2 ✔ tibble 3.2.1
## ✔ lubridate 1.9.2 ✔ tidyr 1.3.0
## ✔ purrr 1.0.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ✖ dplyr::recode() masks car::recode()
## ✖ purrr::some() masks car::some()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
p %>% group_by(g)
## # A tibble: 915 × 6
## # Groups: g [2]
## a g ma k pr m
## <int> <fct> <fct> <int> <dbl> <int>
## 1 0 male yes 0 2.52 7
## 2 0 female no 0 2.05 6
## 3 0 female no 0 3.75 6
## 4 0 male yes 1 1.18 3
## 5 0 female no 0 3.75 26
## 6 0 female yes 2 3.59 2
## 7 0 female no 0 3.19 3
## 8 0 male yes 2 2.96 4
## 9 0 male no 0 4.62 6
## 10 0 female yes 0 1.25 0
## # ℹ 905 more rows
group_by(p,g)
## # A tibble: 915 × 6
## # Groups: g [2]
## a g ma k pr m
## <int> <fct> <fct> <int> <dbl> <int>
## 1 0 male yes 0 2.52 7
## 2 0 female no 0 2.05 6
## 3 0 female no 0 3.75 6
## 4 0 male yes 1 1.18 3
## 5 0 female no 0 3.75 26
## 6 0 female yes 2 3.59 2
## 7 0 female no 0 3.19 3
## 8 0 male yes 2 2.96 4
## 9 0 male no 0 4.62 6
## 10 0 female yes 0 1.25 0
## # ℹ 905 more rows
p %>% group_by(g) %>% summarise(n = mean(a))
## # A tibble: 2 × 2
## g n
## <fct> <dbl>
## 1 male 1.88
## 2 female 1.47
Tập dữ liệu PhDPublications được thu thập vào năm 1997 nói về số bài báo cáo của các nghiên cứu sinh trong lĩnh vực hóa sinh.
Dữ liệu gồm 915 quan sát và có 6 biến:
articles: số bài báo cáo được đăng trong 3 năm gần đây
gender: giới tính của nghiên cứu sinh
married: tình trạng hôn nhân của nghiên cứu sinh
kids: số con dưới 6 tuổi của nghiên cứu sinh
prestige: chất lượng của chương trình đào tạo
mentor: số bài báo cáo được đăng của người hướng dẫn nghiên cứu sinh
library(AER)
data("PhDPublications")
Gán dữ liệu vào p
p <- PhDPublications
Xem cấu trúc dữ liệu
str(p)
## 'data.frame': 915 obs. of 6 variables:
## $ articles: int 0 0 0 0 0 0 0 0 0 0 ...
## $ gender : Factor w/ 2 levels "male","female": 1 2 2 1 2 2 2 1 1 2 ...
## $ married : Factor w/ 2 levels "no","yes": 2 1 1 2 1 2 1 2 1 2 ...
## $ kids : int 0 0 0 1 0 2 0 2 0 0 ...
## $ prestige: num 2.52 2.05 3.75 1.18 3.75 ...
## $ mentor : int 7 6 6 3 26 2 3 4 6 0 ...
## - attr(*, "datalabel")= chr "Academic Biochemists / S Long"
## - attr(*, "time.stamp")= chr "30 Jan 2001 10:49"
## - attr(*, "formats")= chr [1:6] "%9.0g" "%9.0g" "%9.0g" "%9.0g" ...
## - attr(*, "types")= int [1:6] 98 98 98 98 102 98
## - attr(*, "val.labels")= chr [1:6] "" "sexlbl" "marlbl" "" ...
## - attr(*, "var.labels")= chr [1:6] "Articles in last 3 yrs of PhD" "Gender: 1=female 0=male" "Married: 1=yes 0=no" "Number of children < 6" ...
## - attr(*, "version")= int 6
## - attr(*, "label.table")=List of 6
## ..$ marlbl: Named num [1:2] 0 1
## .. ..- attr(*, "names")= chr [1:2] "Single" "Married"
## ..$ sexlbl: Named num [1:2] 0 1
## .. ..- attr(*, "names")= chr [1:2] "Men" "Women"
## ..$ : NULL
## ..$ : NULL
## ..$ : NULL
## ..$ : NULL
Xem các quan sát đầu của tập dữ liệu
head(p)
## articles gender married kids prestige mentor
## 1 0 male yes 0 2.52 7
## 2 0 female no 0 2.05 6
## 3 0 female no 0 3.75 6
## 4 0 male yes 1 1.18 3
## 5 0 female no 0 3.75 26
## 6 0 female yes 2 3.59 2
Xem các quan sát cuối của tập dữ liệu
tail(p)
## articles gender married kids prestige mentor
## 910 10 female yes 0 3.59 18
## 911 11 male yes 2 2.86 7
## 912 12 male yes 1 4.29 35
## 913 12 male yes 1 1.86 5
## 914 16 male yes 0 1.74 21
## 915 19 male yes 0 1.86 42
Đặt tên các biến
names(p) <- c('a','g','ma','k','pr','m')
Gán biến a vào sobaibc
Lọc số nghiên cứu sinh có số bài báo cáo từ 5 đến 10 bài
sobaibc <- p$a
sobaibc510 <- sobaibc[sobaibc>5 & sobaibc<10]
sobaibc510
## [1] 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 8 9 9
Lọc số nghiên cứu sinh có số bài báo cáo nhiều hơn 1 và có hơn 1 con
sobaibcs <- p[p$a>1&p$k>1,]
sobaibcs
## a g ma k pr m
## 533 2 male yes 2 2.96 8
## 546 2 male yes 2 2.96 46
## 550 2 male yes 2 4.29 8
## 558 2 male yes 2 1.80 6
## 568 2 male yes 2 4.54 2
## 569 2 female yes 2 3.85 47
## 570 2 male yes 2 2.96 21
## 579 2 female yes 2 1.22 4
## 582 2 male yes 2 2.87 20
## 588 2 male yes 2 4.29 10
## 597 2 male yes 2 1.97 0
## 602 2 male yes 3 4.34 7
## 610 2 male yes 2 2.21 12
## 620 2 male yes 2 4.34 17
## 625 2 male yes 2 3.32 27
## 627 2 female yes 2 2.58 3
## 628 2 male yes 2 3.54 16
## 634 2 male yes 2 2.50 5
## 635 2 male yes 3 2.00 8
## 668 2 female yes 2 3.59 11
## 676 2 male yes 2 1.86 6
## 678 2 female yes 2 4.54 48
## 689 2 female yes 2 3.21 2
## 694 2 male yes 2 4.29 30
## 703 3 male yes 2 4.54 31
## 717 3 male yes 2 1.80 6
## 723 3 male yes 2 4.29 0
## 725 3 male yes 2 4.29 25
## 732 3 male yes 2 1.95 3
## 737 3 male yes 2 2.83 7
## 749 3 female yes 2 1.89 16
## 773 3 male yes 2 2.58 2
## 778 3 male yes 2 2.10 4
## 779 3 male yes 2 1.38 8
## 781 3 male yes 3 2.86 3
## 801 4 male yes 2 1.72 2
## 802 4 male yes 2 2.86 15
## 803 4 male yes 2 4.54 66
## 805 4 male yes 2 1.86 15
## 809 4 male yes 2 2.05 13
## 814 4 male yes 2 3.54 2
## 821 4 male yes 2 4.54 21
## 846 4 male yes 2 3.69 16
## 849 4 male yes 2 2.58 6
## 853 5 male yes 2 3.85 15
## 880 6 female yes 2 1.86 38
## 883 6 male yes 2 2.51 11
## 911 11 male yes 2 2.86 7
Chia biến a thành 4 tổ và lập bảng tần số
Số lượng bài báo cáo dưới 5 bài chiếm số lượng nhiều nhất với 850 nghiên cứu sinh (chiếm 93%)
Tổ từ 5 đến 10 bài báo cáo có 59 nghiên cứu sinh( chiếm 6.4%)
Tổ từ 10 đến 15 bài báo cáo có 4 nghiên cứu sinh (chiếm 0.4%)
Số lượng nghiên cứu sinh có từ 15 đến 19 bài báo cáo chiếm số lượng ít nhất với 2 người (chiếm 0.2%)
table(cut(p$a,4))
##
## (-0.019,4.75] (4.75,9.5] (9.5,14.2] (14.2,19]
## 850 59 4 2
Lập bảng tần số của số bài báo cáo theo giới tính
Ta thấy trong 915 nghiên cứu sinh thì nam chiếm nhiều hơn với 494 người (chiếm 54%) tuy nghiên không có sự cách biệt quá lớn so với nữ (chiếm 46%).
Số lượng bài báo cáo dưới 5 chiếm nhiều nhất (93%) với 450 bài là của nam nghiên cứu sinh và 400 bài của nữ nghiên cứu sinh.
table(cut(p$a,4),p$g)
##
## male female
## (-0.019,4.75] 450 400
## (4.75,9.5] 39 20
## (9.5,14.2] 3 1
## (14.2,19] 2 0
Lập bảng tần số của số bài báo cáo theo số con
table(cut(p$a,4),p$k)
##
## 0 1 2 3
## (-0.019,4.75] 556 177 101 16
## (4.75,9.5] 40 16 3 0
## (9.5,14.2] 1 2 1 0
## (14.2,19] 2 0 0 0