BÀI TẬP VỀ NHÀ 2

Lấy dữ liệu từ package

Gọi dữ liệu PhDPublications từ package AER

Sau đó sẽ gán dữ liệu vào p

Tiếp theo là đặt tên cho các biến tương ứng

a: articles

g: gender

ma: married

k: kids

pr: prestige

m: mentor

library(AER)
## Loading required package: car
## Loading required package: carData
## Loading required package: lmtest
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## Loading required package: sandwich
## Loading required package: survival
data('PhDPublications')
p <- PhDPublications
names(p) <- c('a','g','ma','k','pr','m')

Lọc dữ liệu

Lọc lấy dữ liệu những ngiên cứu sinh đã kết hôn rồi

Ta thấy kết quả có 606 người nghiên cứu sinh đã kết hôn (66%)

yes <- p[p$ma== 'yes',]
yes
##      a      g  ma k    pr  m
## 1    0   male yes 0 2.520  7
## 4    0   male yes 1 1.180  3
## 6    0 female yes 2 3.590  2
## 8    0   male yes 2 2.960  4
## 10   0 female yes 0 1.250  0
## 13   0 female yes 1 3.690  3
## 14   0 female yes 0 3.400  4
## 15   0 female yes 0 1.790  0
## 17   0 female yes 0 2.000  7
## 18   0   male yes 2 4.290 13
## 21   0 female yes 0 2.260  6
## 22   0   male yes 3 2.960  3
## 23   0   male yes 1 4.290  5
## 24   0   male yes 1 2.860  4
## 25   0   male yes 3 2.760  1
## 26   0 female yes 0 1.520  3
## 27   0 female yes 1 3.540  8
## 28   0   male yes 1 4.290  3
## 30   0   male yes 0 2.320  3
## 32   0   male yes 0 4.290  8
## 35   0   male yes 1 1.520  0
## 39   0   male yes 1 1.220  2
## 40   0 female yes 0 3.750  5
## 42   0 female yes 1 2.860  3
## 44   0 female yes 1 3.360  3
## 46   0   male yes 1 1.180  0
## 47   0   male yes 0 2.500  1
## 48   0   male yes 0 3.360 25
## 50   0 female yes 0 3.920  8
## 52   0 female yes 2 1.970  0
## 53   0   male yes 2 2.960 12
## 54   0   male yes 0 4.290  8
## 55   0   male yes 1 2.260  2
## 58   0   male yes 1 3.150  1
## 59   0   male yes 1 3.920  1
## 62   0   male yes 1 2.100  0
## 64   0 female yes 0 3.540  2
## 65   0 female yes 0 2.540  1
## 66   0   male yes 1 2.760  3
## 67   0   male yes 0 4.540 10
## 68   0   male yes 0 1.680  6
## 69   0   male yes 1 2.200  0
## 72   0 female yes 2 2.580  0
## 73   0 female yes 0 1.790  1
## 75   0 female yes 0 1.280  4
## 76   0   male yes 2 2.580  5
## 77   0   male yes 2 2.120  0
## 78   0   male yes 1 2.210  1
## 79   0   male yes 1 2.260  5
## 82   0 female yes 1 3.540  1
## 83   0   male yes 1 3.400 18
## 84   0   male yes 0 2.210  6
## 85   0   male yes 0 2.210 19
## 86   0   male yes 2 0.920  1
## 88   0   male yes 2 3.150  6
## 89   0   male yes 0 4.290 19
## 90   0   male yes 1 2.510  8
## 91   0   male yes 1 4.290  1
## 92   0 female yes 0 2.760  0
## 93   0   male yes 0 1.420  3
## 94   0   male yes 0 2.210 19
## 96   0   male yes 0 1.520  7
## 99   0 female yes 2 3.750  4
## 100  0   male yes 0 4.290  8
## 102  0   male yes 1 2.100  0
## 103  0   male yes 2 1.400  7
## 104  0 female yes 0 3.190  4
## 105  0   male yes 2 1.810  1
## 106  0   male yes 1 3.150  2
## 107  0 female yes 0 3.750  7
## 109  0   male yes 3 2.210  3
## 110  0 female yes 2 3.360  2
## 111  0 female yes 0 3.470 11
## 113  0 female yes 1 3.360  2
## 114  0   male yes 0 2.540  5
## 115  0   male yes 2 2.150  4
## 116  0   male yes 1 4.540  3
## 117  0   male yes 0 1.680  4
## 118  0 female yes 1 2.550  0
## 120  0   male yes 1 3.470  2
## 121  0 female yes 0 3.470  1
## 123  0   male yes 1 2.120 10
## 126  0   male yes 1 2.860 13
## 127  0 female yes 1 4.290  9
## 128  0   male yes 0 3.210  2
## 130  0 female yes 0 1.810  5
## 132  0   male yes 1 3.360 23
## 133  0 female yes 0 4.540  4
## 134  0 female yes 1 4.290  4
## 136  0   male yes 2 4.620 30
## 137  0 female yes 1 3.590 14
## 139  0   male yes 3 2.860  1
## 141  0 female yes 1 2.500  0
## 142  0 female yes 0 4.620  0
## 144  0 female yes 1 3.360  3
## 146  0 female yes 2 3.410  5
## 147  0   male yes 0 2.100  0
## 149  0   male yes 0 3.360  2
## 150  0   male yes 3 3.590  7
## 152  0 female yes 0 3.590 12
## 154  0   male yes 3 4.540 11
## 156  0   male yes 1 2.210  5
## 157  0   male yes 2 3.690  5
## 158  0 female yes 0 1.780  1
## 160  0   male yes 0 2.860  8
## 161  0 female yes 0 2.580  3
## 163  0 female yes 1 1.220 11
## 168  0 female yes 0 1.860  6
## 169  0   male yes 0 2.960  0
## 170  0 female yes 0 3.690  7
## 171  0 female yes 0 3.690  2
## 172  0 female yes 0 4.290  1
## 175  0   male yes 2 2.320  2
## 179  0 female yes 2 4.540  6
## 180  0   male yes 1 2.100  0
## 181  0 female yes 1 2.540  0
## 182  0   male yes 1 2.210 19
## 184  0   male yes 1 2.100 12
## 186  0 female yes 1 4.620 15
## 190  0 female yes 0 1.830  2
## 192  0 female yes 1 4.290  6
## 194  0   male yes 0 2.140  1
## 195  0   male yes 2 3.400 13
## 197  0 female yes 0 2.960  0
## 198  0 female yes 2 3.190  0
## 199  0   male yes 1 3.690 16
## 200  0 female yes 2 1.255  0
## 201  0   male yes 2 4.140 12
## 202  0   male yes 1 2.390  5
## 203  0   male yes 2 3.920  2
## 205  0 female yes 0 2.120  2
## 206  0 female yes 2 2.120  1
## 207  0 female yes 0 2.610  3
## 209  0   male yes 3 2.860  7
## 210  0 female yes 0 2.390  0
## 211  0   male yes 2 3.340  1
## 213  0 female yes 1 3.590  8
## 214  0   male yes 2 4.540  1
## 215  0 female yes 0 3.590  1
## 217  0   male yes 0 1.520  4
## 218  0   male yes 0 4.290  6
## 219  0 female yes 0 4.620  5
## 220  0   male yes 1 4.290 13
## 221  0   male yes 0 2.510  3
## 223  0 female yes 0 2.960  8
## 224  0 female yes 0 3.690  3
## 225  0 female yes 0 3.470  2
## 226  0   male yes 2 4.290 15
## 229  0 female yes 0 2.000  6
## 230  0   male yes 0 2.320  4
## 231  0 female yes 1 2.000  9
## 232  0   male yes 1 1.680 27
## 234  0   male yes 0 2.200  2
## 235  0   male yes 1 2.120 10
## 238  0   male yes 2 4.290 24
## 239  0   male yes 1 2.100  0
## 243  0   male yes 1 2.580  6
## 244  0 female yes 0 3.150  7
## 247  0   male yes 2 3.590  5
## 251  0   male yes 0 3.400 13
## 254  0 female yes 0 2.860 13
## 257  0 female yes 0 2.390  2
## 258  0   male yes 2 2.860 11
## 259  0 female yes 0 2.960  7
## 261  0   male yes 1 1.810  5
## 262  0   male yes 1 4.290  2
## 263  0   male yes 1 2.100  0
## 265  0   male yes 2 4.290  2
## 266  0   male yes 0 4.290  2
## 267  0   male yes 2 3.400  0
## 269  0   male yes 2 2.320  5
## 271  0 female yes 0 2.580  0
## 272  0   male yes 0 3.690  3
## 273  0   male yes 2 3.410  7
## 274  0   male yes 0 2.320  0
## 275  0   male yes 1 3.690  8
## 276  1   male yes 0 2.540  4
## 277  1 female yes 1 1.760  4
## 278  1   male yes 1 4.290 13
## 279  1   male yes 3 2.100  0
## 280  1 female yes 1 3.090 12
## 282  1   male yes 0 2.100  0
## 283  1 female yes 1 3.750  7
## 287  1   male yes 0 2.000  4
## 288  1   male yes 1 2.000 16
## 289  1   male yes 1 2.610  6
## 290  1   male yes 0 4.250 12
## 292  1 female yes 0 4.290 11
## 293  1   male yes 0 2.100  2
## 294  1 female yes 0 2.870  5
## 295  1 female yes 0 3.470  3
## 296  1   male yes 0 1.780  1
## 297  1   male yes 0 4.140 15
## 298  1   male yes 3 4.290  0
## 302  1 female yes 0 2.610  7
## 303  1   male yes 0 1.680 34
## 304  1 female yes 0 3.190  3
## 305  1   male yes 1 3.590  5
## 306  1   male yes 0 2.500  0
## 310  1   male yes 1 3.920  0
## 311  1   male yes 2 2.960  0
## 313  1   male yes 0 4.290 11
## 314  1 female yes 1 3.320 24
## 317  1 female yes 0 1.640 22
## 320  1 female yes 0 4.290  6
## 321  1   male yes 0 1.750  3
## 322  1   male yes 0 2.960  8
## 324  1   male yes 2 4.250 20
## 325  1   male yes 2 2.560 22
## 327  1   male yes 2 3.920  2
## 328  1   male yes 1 1.780 77
## 329  1 female yes 0 3.400 14
## 330  1   male yes 1 1.740  4
## 333  1 female yes 0 2.870 18
## 334  1   male yes 0 4.290  6
## 335  1 female yes 0 3.190  2
## 336  1   male yes 1 1.220  1
## 337  1 female yes 2 3.540 17
## 338  1   male yes 1 4.290  1
## 339  1   male yes 1 4.620  3
## 343  1   male yes 1 3.400  2
## 344  1 female yes 0 1.280  2
## 345  1   male yes 2 1.740  4
## 346  1   male yes 1 2.260  1
## 347  1 female yes 0 3.590  5
## 348  1   male yes 1 4.620 16
## 351  1   male yes 1 2.390  3
## 352  1   male yes 0 2.260  1
## 353  1   male yes 2 2.860  7
## 354  1   male yes 2 2.760  8
## 355  1   male yes 1 1.630  8
## 356  1   male yes 2 4.290 12
## 358  1 female yes 0 2.120  0
## 359  1 female yes 1 2.610  6
## 360  1   male yes 0 1.800  1
## 361  1 female yes 0 4.290 21
## 363  1 female yes 0 4.620 16
## 365  1   male yes 2 2.100  0
## 366  1 female yes 0 2.000  5
## 368  1   male yes 2 1.750  2
## 372  1   male yes 1 3.920  8
## 373  1   male yes 2 2.510  3
## 375  1   male yes 1 2.000 11
## 379  1   male yes 0 4.620  1
## 380  1   male yes 1 2.560 16
## 381  1   male yes 0 4.620 18
## 382  1   male yes 0 3.590 10
## 383  1   male yes 2 4.290  6
## 386  1   male yes 0 3.190  3
## 387  1 female yes 0 3.590  1
## 388  1 female yes 0 2.960 19
## 390  1   male yes 3 2.960  6
## 391  1 female yes 0 4.540 13
## 392  1   male yes 1 4.540 10
## 393  1   male yes 2 2.500  4
## 394  1   male yes 0 1.680  8
## 395  1   male yes 0 2.320  4
## 396  1 female yes 3 3.190  9
## 398  1 female yes 0 1.250  5
## 400  1 female yes 0 4.620  4
## 402  1 female yes 0 3.150  9
## 404  1 female yes 0 1.950  3
## 406  1 female yes 0 4.540  2
## 407  1 female yes 2 2.580  2
## 408  1 female yes 0 3.850 29
## 409  1   male yes 1 3.410 10
## 410  1 female yes 1 2.260  9
## 412  1   male yes 1 3.590  6
## 413  1 female yes 1 2.120  9
## 414  1   male yes 0 2.960  7
## 418  1 female yes 2 2.860  7
## 419  1   male yes 0 4.540  2
## 420  1   male yes 0 3.590 12
## 421  1 female yes 0 4.620 18
## 422  1   male yes 3 1.670  3
## 423  1   male yes 2 1.750  1
## 424  1 female yes 1 2.830  5
## 425  1   male yes 3 3.150 11
## 426  1   male yes 1 3.590  9
## 429  1   male yes 0 4.290  0
## 430  1   male yes 2 4.290  0
## 431  1 female yes 0 2.390  7
## 432  1   male yes 1 4.540  3
## 433  1   male yes 0 2.320  4
## 435  1   male yes 1 3.690  5
## 438  1   male yes 0 2.760  5
## 440  1   male yes 2 3.620  4
## 441  1   male yes 1 4.290 14
## 443  1 female yes 1 2.390  9
## 445  1   male yes 0 1.780  4
## 446  1   male yes 1 2.100  8
## 447  1 female yes 0 2.250  3
## 448  1   male yes 1 2.260  5
## 449  1   male yes 0 1.860  5
## 451  1   male yes 0 4.340 10
## 455  1   male yes 1 4.540 45
## 458  1   male yes 0 1.520  2
## 459  1   male yes 0 2.550 11
## 460  1 female yes 0 1.180  1
## 461  1 female yes 2 3.090  9
## 463  1 female yes 0 2.320  1
## 465  1   male yes 0 4.290  1
## 468  1   male yes 1 3.590  2
## 471  1 female yes 0 3.590 32
## 474  1 female yes 0 1.750  0
## 475  1 female yes 0 3.470  3
## 476  1   male yes 1 2.610  4
## 478  1   male yes 2 4.290  9
## 480  1 female yes 0 4.620 18
## 481  1   male yes 1 2.860 17
## 482  1   male yes 1 2.860 17
## 483  1   male yes 0 2.860 39
## 485  1 female yes 0 1.760  8
## 486  1   male yes 0 2.500  0
## 489  1 female yes 1 3.540 14
## 490  1 female yes 0 3.690  1
## 493  1   male yes 1 4.340  4
## 494  1   male yes 0 3.540 11
## 495  1   male yes 2 4.290 10
## 496  1   male yes 0 1.810  0
## 498  1   male yes 1 1.810  5
## 500  1 female yes 1 2.320  5
## 502  1   male yes 1 4.290  2
## 503  1   male yes 1 2.860  2
## 504  1 female yes 1 2.860  2
## 505  1   male yes 1 1.220  0
## 506  1   male yes 0 2.100  0
## 507  1   male yes 1 1.680 12
## 509  1 female yes 0 2.870 15
## 510  1   male yes 1 3.470  1
## 512  1   male yes 1 3.540 21
## 513  1 female yes 0 1.950 11
## 514  1   male yes 1 3.590 19
## 517  1 female yes 2 4.290 13
## 518  1   male yes 2 3.190  5
## 519  1   male yes 0 2.960  0
## 520  1   male yes 1 2.760  7
## 521  1 female yes 0 1.810 11
## 522  2   male yes 0 3.360  4
## 525  2 female yes 0 4.540 10
## 527  2 female yes 0 3.090  2
## 531  2   male yes 1 4.290  2
## 532  2 female yes 1 1.740  4
## 533  2   male yes 2 2.960  8
## 535  2   male yes 1 4.540 10
## 537  2   male yes 1 4.290 13
## 539  2 female yes 0 3.590  0
## 543  2 female yes 1 3.470 11
## 545  2   male yes 0 1.950  4
## 546  2   male yes 2 2.960 46
## 547  2   male yes 1 4.540 53
## 548  2   male yes 0 3.400  9
## 549  2   male yes 0 2.100  4
## 550  2   male yes 2 4.290  8
## 553  2   male yes 1 2.500  2
## 554  2 female yes 1 4.620 17
## 555  2 female yes 0 1.800 10
## 558  2   male yes 2 1.800  6
## 559  2 female yes 0 3.590  5
## 560  2   male yes 0 2.760  3
## 561  2   male yes 0 4.140 16
## 564  2 female yes 0 0.920  0
## 566  2   male yes 1 2.390  4
## 567  2   male yes 0 1.180  0
## 568  2   male yes 2 4.540  2
## 569  2 female yes 2 3.850 47
## 570  2   male yes 2 2.960 21
## 571  2 female yes 0 3.360  8
## 572  2 female yes 0 3.190  5
## 573  2 female yes 1 3.690 15
## 574  2   male yes 0 1.630  8
## 575  2   male yes 0 1.720  1
## 576  2 female yes 0 2.580  5
## 577  2   male yes 0 1.520  5
## 579  2 female yes 2 1.220  4
## 582  2   male yes 2 2.870 20
## 583  2   male yes 1 3.150  7
## 585  2   male yes 1 1.760  7
## 586  2   male yes 1 1.520  3
## 588  2   male yes 2 4.290 10
## 589  2   male yes 1 2.560  5
## 591  2 female yes 0 1.860  5
## 593  2 female yes 0 3.920  7
## 595  2   male yes 1 4.290 14
## 596  2 female yes 1 3.690 10
## 597  2   male yes 2 1.970  0
## 598  2   male yes 1 3.190 10
## 601  2   male yes 0 2.830  1
## 602  2   male yes 3 4.340  7
## 606  2   male yes 0 4.290 24
## 607  2   male yes 1 2.760  8
## 608  2 female yes 0 3.750  0
## 609  2   male yes 1 4.290 12
## 610  2   male yes 2 2.210 12
## 611  2   male yes 0 3.540 21
## 612  2   male yes 0 2.960  2
## 613  2 female yes 0 2.120  2
## 617  2 female yes 0 4.540  9
## 619  2   male yes 0 1.760  0
## 620  2   male yes 2 4.340 17
## 621  2 female yes 0 2.520 16
## 622  2   male yes 1 2.560  7
## 624  2 female yes 0 1.400  0
## 625  2   male yes 2 3.320 27
## 626  2   male yes 0 2.510  5
## 627  2 female yes 2 2.580  3
## 628  2   male yes 2 3.540 16
## 629  2   male yes 0 4.540 11
## 631  2   male yes 0 4.340  5
## 632  2 female yes 1 3.470  4
## 634  2   male yes 2 2.500  5
## 635  2   male yes 3 2.000  8
## 637  2 female yes 0 4.620 23
## 642  2   male yes 0 3.690  5
## 643  2   male yes 0 4.290 17
## 645  2   male yes 0 4.290 13
## 646  2 female yes 1 3.210  7
## 648  2   male yes 0 2.500  0
## 650  2 female yes 0 3.750  4
## 652  2   male yes 0 3.190 11
## 653  2 female yes 1 2.000  7
## 654  2 female yes 0 3.090  1
## 655  2 female yes 1 3.590  2
## 656  2 female yes 0 4.340 11
## 658  2   male yes 0 2.100  2
## 660  2   male yes 1 2.100  3
## 661  2   male yes 1 1.780  1
## 662  2   male yes 0 2.510  0
## 663  2   male yes 1 2.520 10
## 664  2 female yes 1 3.400  4
## 665  2 female yes 1 3.090  3
## 666  2   male yes 0 4.290 13
## 667  2 female yes 0 2.960  8
## 668  2 female yes 2 3.590 11
## 670  2 female yes 0 3.590 11
## 671  2   male yes 1 3.420  3
## 672  2 female yes 1 4.290  4
## 674  2 female yes 1 4.290 11
## 675  2   male yes 0 4.620  3
## 676  2   male yes 2 1.860  6
## 677  2   male yes 0 4.620  8
## 678  2 female yes 2 4.540 48
## 679  2 female yes 0 3.750  8
## 680  2   male yes 0 1.760  0
## 681  2 female yes 0 3.410 31
## 682  2   male yes 0 2.550 24
## 683  2   male yes 1 1.250  2
## 684  2 female yes 0 1.480  9
## 685  2 female yes 0 2.830  3
## 686  2 female yes 0 4.290  6
## 689  2 female yes 2 3.210  2
## 691  2 female yes 0 1.450  7
## 692  2 female yes 1 3.340  4
## 694  2   male yes 2 4.290 30
## 697  2 female yes 1 4.540  7
## 698  2   male yes 1 4.540  6
## 703  3   male yes 2 4.540 31
## 704  3   male yes 0 3.090  5
## 705  3   male yes 1 1.950 14
## 706  3 female yes 1 3.590  3
## 707  3   male yes 1 2.610  5
## 710  3 female yes 0 3.410 19
## 711  3 female yes 1 2.320  5
## 712  3 female yes 0 2.120  3
## 713  3   male yes 0 4.540 37
## 714  3   male yes 0 2.960  8
## 716  3   male yes 0 2.320  4
## 717  3   male yes 2 1.800  6
## 719  3 female yes 1 4.620 14
## 721  3   male yes 0 4.540  5
## 723  3   male yes 2 4.290  0
## 724  3   male yes 1 2.960  5
## 725  3   male yes 2 4.290 25
## 726  3   male yes 1 4.290 18
## 727  3   male yes 1 2.540  6
## 731  3 female yes 0 3.750  6
## 732  3   male yes 2 1.950  3
## 733  3   male yes 1 1.800  4
## 734  3   male yes 0 2.760  8
## 736  3   male yes 0 4.250 20
## 737  3   male yes 2 2.830  7
## 739  3 female yes 0 1.180  0
## 740  3 female yes 0 3.360 11
## 741  3 female yes 0 4.290 21
## 742  3 female yes 1 4.620 49
## 744  3   male yes 0 3.690 24
## 745  3   male yes 0 2.260 12
## 747  3   male yes 1 4.290 19
## 748  3   male yes 0 1.420  3
## 749  3 female yes 2 1.890 16
## 750  3   male yes 0 3.690 26
## 751  3 female yes 0 2.960 22
## 752  3 female yes 1 1.860  1
## 753  3 female yes 0 2.260  6
## 754  3   male yes 0 4.290 15
## 755  3 female yes 0 3.150  4
## 756  3   male yes 0 2.610  0
## 758  3   male yes 1 2.210 10
## 759  3   male yes 0 1.780  0
## 760  3   male yes 1 3.620  5
## 761  3   male yes 0 3.920  0
## 762  3 female yes 0 4.620 10
## 763  3   male yes 0 2.610  5
## 764  3 female yes 1 3.360  3
## 765  3 female yes 0 3.690 12
## 766  3   male yes 0 3.470 14
## 767  3   male yes 0 1.250  4
## 768  3   male yes 0 4.620 18
## 769  3   male yes 1 3.590 14
## 771  3   male yes 0 4.290 38
## 773  3   male yes 2 2.580  2
## 775  3   male yes 0 3.470  8
## 776  3 female yes 0 4.620 14
## 778  3   male yes 2 2.100  4
## 779  3   male yes 2 1.380  8
## 780  3   male yes 1 3.090  5
## 781  3   male yes 3 2.860  3
## 783  3 female yes 1 1.220  3
## 784  4   male yes 0 2.830  5
## 785  4 female yes 0 4.540 16
## 786  4   male yes 0 4.290 22
## 788  4   male yes 0 3.540  9
## 791  4 female yes 0 4.340  6
## 792  4 female yes 1 2.510  2
## 793  4   male yes 0 4.290  2
## 794  4   male yes 1 2.960  0
## 797  4 female yes 0 3.400  5
## 799  4   male yes 1 2.960 57
## 800  4 female yes 0 3.540  5
## 801  4   male yes 2 1.720  2
## 802  4   male yes 2 2.860 15
## 803  4   male yes 2 4.540 66
## 804  4   male yes 1 1.760 11
## 805  4   male yes 2 1.860 15
## 806  4   male yes 0 3.470  4
## 808  4   male yes 0 1.810 10
## 809  4   male yes 2 2.050 13
## 811  4 female yes 0 2.260  3
## 812  4   male yes 1 1.860 47
## 813  4 female yes 1 4.290  4
## 814  4   male yes 2 3.540  2
## 815  4   male yes 0 4.290 30
## 816  4   male yes 0 2.540 11
## 817  4 female yes 0 4.250 13
## 819  4 female yes 1 3.540 12
## 820  4 female yes 0 3.190  8
## 821  4   male yes 2 4.540 21
## 823  4 female yes 0 2.580 14
## 824  4 female yes 0 1.280  4
## 825  4 female yes 0 3.210 14
## 832  4   male yes 1 2.550 21
## 834  4 female yes 0 2.360  5
## 835  4   male yes 1 4.250 29
## 836  4   male yes 1 4.290  5
## 837  4 female yes 0 3.190  7
## 840  4   male yes 0 1.760  7
## 841  4   male yes 1 2.580 25
## 842  4 female yes 0 3.410  4
## 844  4 female yes 0 1.780  4
## 846  4   male yes 2 3.690 16
## 847  4   male yes 0 3.620  5
## 848  4   male yes 0 1.505  4
## 849  4   male yes 2 2.580  6
## 851  5 female yes 0 2.260 16
## 853  5   male yes 2 3.850 15
## 854  5   male yes 1 3.150  5
## 855  5   male yes 1 3.150 27
## 856  5   male yes 0 4.340  6
## 857  5   male yes 0 4.250 12
## 860  5   male yes 1 2.580 25
## 861  5   male yes 1 3.590 21
## 862  5   male yes 1 2.960  4
## 863  5   male yes 0 4.540 13
## 864  5   male yes 0 4.290 30
## 866  5 female yes 0 4.540 15
## 867  5 female yes 1 3.850  1
## 868  5   male yes 0 2.500  4
## 869  5   male yes 1 3.470  0
## 870  5 female yes 0 2.860 24
## 871  5 female yes 0 4.620  0
## 872  5   male yes 1 4.540 53
## 873  5   male yes 0 1.250  2
## 874  5 female yes 0 3.210 19
## 875  5   male yes 1 1.760 11
## 878  6   male yes 1 4.620  8
## 879  6 female yes 0 2.100 36
## 880  6 female yes 2 1.860 38
## 881  6   male yes 0 4.340  9
## 882  6 female yes 0 4.290 24
## 883  6   male yes 2 2.510 11
## 884  6   male yes 1 2.960 13
## 888  6   male yes 1 3.850 16
## 892  6 female yes 0 4.290  1
## 895  7   male yes 0 3.590  1
## 898  7   male yes 1 1.970  0
## 902  7   male yes 0 3.690  9
## 905  7   male yes 1 3.590 27
## 907  8   male yes 0 2.510 11
## 908  9   male yes 1 2.960 23
## 909  9   male yes 1 1.860 47
## 910 10 female yes 0 3.590 18
## 911 11   male yes 2 2.860  7
## 912 12   male yes 1 4.290 35
## 913 12   male yes 1 1.860  5
## 914 16   male yes 0 1.740 21
## 915 19   male yes 0 1.860 42

Ngược lại, ta lọc lấy dữ liệu của những nghiên cứu sinh chưa kết hôn và có 309 người chưa kết hôn (34%)

no <- p[p$ma== 'no',]
no
##     a      g ma k    pr  m
## 2   0 female no 0 2.050  6
## 3   0 female no 0 3.750  6
## 5   0 female no 0 3.750 26
## 7   0 female no 0 3.190  3
## 9   0   male no 0 4.620  6
## 11  0   male no 0 2.960 14
## 12  0 female no 0 0.755 13
## 16  0 female no 0 3.090  1
## 19  0 female no 0 3.360  7
## 20  0 female no 0 4.290  9
## 29  0 female no 0 3.090  0
## 31  0 female no 0 2.390  0
## 33  0 female no 0 1.505 13
## 34  0   male no 0 2.100  0
## 36  0 female no 0 2.000  0
## 37  0 female no 0 1.750  0
## 38  0   male no 0 4.290  9
## 41  0   male no 0 4.290  9
## 43  0   male no 0 3.920  5
## 45  0   male no 0 2.100  6
## 49  0 female no 0 4.540 14
## 51  0   male no 0 4.540  5
## 56  0 female no 0 2.120 11
## 57  0 female no 0 3.210  2
## 60  0   male no 0 2.960  0
## 61  0 female no 0 2.860  6
## 63  0 female no 0 3.750  4
## 70  0 female no 0 1.005  0
## 71  0   male no 0 2.120  2
## 74  0   male no 0 4.290  2
## 80  0 female no 0 3.210  5
## 81  0 female no 0 2.100  2
## 87  0 female no 0 4.290 35
## 95  0   male no 0 4.140  5
## 97  0   male no 0 4.620  8
## 98  0 female no 0 3.620  7
## 101 0 female no 0 3.750  5
## 108 0 female no 0 2.050  6
## 112 0 female no 0 2.120  0
## 119 0 female no 0 2.120 11
## 122 0 female no 0 3.360  9
## 124 0 female no 0 2.100  1
## 125 0 female no 0 4.290  1
## 129 0   male no 0 2.100  0
## 131 0 female no 0 2.520  2
## 135 0 female no 0 2.120  9
## 138 0 female no 0 3.590  4
## 140 0 female no 0 1.505  3
## 143 0   male no 0 2.500  0
## 145 0 female no 0 2.000  2
## 148 0 female no 0 2.000  2
## 151 0   male no 0 2.140  2
## 153 0 female no 0 2.390 10
## 155 0   male no 0 2.960  2
## 159 0 female no 0 2.860 11
## 162 0 female no 0 3.750  1
## 164 0 female no 0 2.100  9
## 165 0 female no 0 3.590 18
## 166 0 female no 0 3.540  5
## 167 0 female no 0 2.860 16
## 173 0 female no 0 2.520  1
## 174 0 female no 0 1.760 10
## 176 0 female no 0 3.690  2
## 177 0 female no 0 3.750 14
## 178 0 female no 0 4.290  5
## 183 0   male no 0 4.540  8
## 185 0   male no 0 2.260  5
## 187 0 female no 0 2.760  4
## 188 0 female no 0 4.290 12
## 189 0 female no 0 0.755  0
## 191 0 female no 0 1.790  0
## 193 0 female no 0 2.500  0
## 196 0 female no 0 2.870 15
## 204 0 female no 0 2.960  4
## 208 0   male no 0 4.290  0
## 212 0 female no 0 3.620  8
## 216 0   male no 0 4.290  9
## 222 0   male no 0 2.860  3
## 227 0   male no 0 4.290  0
## 228 0 female no 0 3.920  1
## 233 0   male no 0 3.470  0
## 236 0 female no 0 1.400 14
## 237 0 female no 0 3.360  3
## 240 0   male no 0 4.290  5
## 241 0 female no 0 4.290  0
## 242 0 female no 0 2.830  1
## 245 0   male no 0 4.290  2
## 246 0   male no 0 2.960  0
## 248 0 female no 0 2.390 15
## 249 0 female no 0 1.250  2
## 250 0 female no 0 2.760  1
## 252 0   male no 0 4.290  7
## 253 0 female no 0 3.690  4
## 255 0 female no 0 4.290  3
## 256 0 female no 0 4.140  2
## 260 0   male no 0 3.590  8
## 264 0 female no 0 3.190  0
## 268 0   male no 0 4.290 35
## 270 0   male no 0 1.680  5
## 281 1 female no 0 3.360  6
## 284 1 female no 0 2.140  6
## 285 1 female no 0 4.290 22
## 286 1 female no 0 2.000  2
## 291 1   male no 0 2.360 14
## 299 1   male no 0 4.290  3
## 300 1   male no 0 1.810 10
## 301 1 female no 0 2.320 15
## 307 1   male no 0 3.400  6
## 308 1 female no 0 2.260  4
## 309 1   male no 0 3.400 12
## 312 1   male no 0 4.290 15
## 315 1   male no 0 1.860 15
## 316 1 female no 0 2.870  6
## 318 1 female no 0 2.250  7
## 319 1 female no 0 2.100  8
## 323 1 female no 0 2.250  4
## 326 1 female no 0 3.190 11
## 331 1   male no 0 4.290  6
## 332 1 female no 0 2.000  6
## 340 1 female no 0 2.000  6
## 341 1 female no 0 3.590  3
## 342 1 female no 0 3.190  6
## 349 1 female no 0 1.400  2
## 350 1 female no 0 0.920  4
## 357 1 female no 0 1.400  3
## 362 1 female no 0 3.690 18
## 364 1   male no 0 2.150 10
## 367 1 female no 0 1.255  0
## 369 1 female no 0 3.850  2
## 370 1   male no 0 4.250  4
## 371 1 female no 0 3.470  3
## 374 1 female no 0 1.400 12
## 376 1 female no 0 2.000 10
## 377 1   male no 0 4.290  2
## 378 1   male no 0 3.360 10
## 384 1 female no 0 3.590  8
## 385 1 female no 0 4.290  6
## 389 1 female no 0 2.580  2
## 397 1 female no 0 2.210  2
## 399 1   male no 0 4.140  5
## 401 1 female no 0 4.540 37
## 403 1   male no 0 4.290 11
## 405 1   male no 0 2.000  9
## 411 1 female no 0 4.250  2
## 415 1 female no 0 2.520  0
## 416 1 female no 0 2.260  4
## 417 1 female no 0 4.540  9
## 427 1 female no 0 3.750 24
## 428 1 female no 0 2.050 17
## 434 1 female no 0 4.290 25
## 436 1   male no 0 4.290  9
## 437 1   male no 0 3.920  2
## 439 1   male no 0 2.760  6
## 442 1   male no 0 2.870 12
## 444 1   male no 0 4.290 14
## 450 1 female no 0 3.920  4
## 452 1 female no 0 3.360  4
## 453 1 female no 0 2.510  1
## 454 1 female no 0 3.750 21
## 456 1 female no 0 1.630  8
## 457 1 female no 0 4.620 10
## 462 1 female no 0 4.620  5
## 464 1   male no 0 2.050  3
## 466 1   male no 0 3.400  2
## 467 1   male no 0 4.290 10
## 469 1   male no 0 3.360  5
## 470 1 female no 0 2.050 13
## 472 1 female no 0 3.850 18
## 473 1   male no 0 3.360  0
## 477 1   male no 0 2.760  4
## 479 1 female no 0 1.400  3
## 484 1   male no 0 2.000  7
## 487 1 female no 0 4.290 17
## 488 1   male no 0 2.560 16
## 491 1   male no 0 2.870  5
## 492 1 female no 0 1.655  0
## 497 1 female no 0 3.400  7
## 499 1 female no 0 3.190 18
## 501 1 female no 0 4.540 19
## 508 1 female no 0 3.360 34
## 511 1   male no 0 2.760  7
## 515 1 female no 0 3.190  3
## 516 1 female no 0 2.760  2
## 523 2   male no 0 3.090 14
## 524 2 female no 0 3.750  8
## 526 2 female no 0 1.630  6
## 528 2 female no 0 3.690  4
## 529 2 female no 0 2.120  2
## 530 2 female no 0 2.260  3
## 534 2 female no 0 2.580  5
## 536 2 female no 0 4.620 12
## 538 2 female no 0 4.540 13
## 540 2 female no 0 4.290  5
## 541 2   male no 0 3.690 26
## 542 2 female no 0 3.210  0
## 544 2   male no 0 4.540 37
## 551 2 female no 0 3.750  5
## 552 2 female no 0 2.050  2
## 556 2 female no 0 3.090  0
## 557 2   male no 0 4.290 10
## 562 2   male no 0 3.590  3
## 563 2 female no 0 4.540 12
## 565 2 female no 0 4.290 15
## 578 2   male no 0 2.860  4
## 580 2 female no 0 2.540  4
## 581 2 female no 0 3.360  4
## 584 2 female no 0 4.620 14
## 587 2   male no 0 4.290  5
## 590 2   male no 0 4.540 29
## 592 2 female no 0 4.290  1
## 594 2   male no 0 2.260  2
## 599 2 female no 0 4.540  5
## 600 2   male no 0 4.290 25
## 603 2 female no 0 3.360  3
## 604 2 female no 0 3.410 14
## 605 2 female no 0 2.860  3
## 614 2   male no 0 2.390  4
## 615 2 female no 0 3.190  5
## 616 2 female no 0 1.970  8
## 618 2 female no 0 2.550 36
## 623 2   male no 0 4.540 10
## 630 2   male no 0 4.290 17
## 633 2 female no 0 3.470  5
## 636 2   male no 0 3.920 10
## 638 2 female no 0 3.090  6
## 639 2 female no 0 2.320  4
## 640 2 female no 0 4.290 21
## 641 2 female no 0 3.360  7
## 644 2 female no 0 3.590 11
## 647 2 female no 0 2.260  8
## 649 2   male no 0 2.260  3
## 651 2 female no 0 4.290  4
## 657 2 female no 0 2.870  9
## 659 2 female no 0 2.830 26
## 669 2   male no 0 4.540 55
## 673 2 female no 0 3.190  4
## 687 2 female no 0 3.190 10
## 688 2 female no 0 1.400  0
## 690 2   male no 0 4.620  9
## 693 2 female no 0 4.540 23
## 695 2 female no 0 3.690  7
## 696 2 female no 0 2.580  2
## 699 2   male no 0 4.290  9
## 700 3 female no 0 4.290 12
## 701 3 female no 0 3.750  0
## 702 3   male no 0 4.620  8
## 708 3   male no 0 2.870 12
## 709 3   male no 0 4.290 30
## 715 3   male no 0 2.870 12
## 718 3 female no 0 2.390 11
## 720 3 female no 0 4.290 10
## 722 3   male no 0 3.590 16
## 728 3   male no 0 3.920  0
## 729 3   male no 0 2.320  8
## 730 3 female no 0 4.620 22
## 735 3   male no 0 3.590  7
## 738 3 female no 0 2.520  4
## 743 3   male no 0 2.830  8
## 746 3 female no 0 2.050  5
## 757 3 female no 0 4.540  3
## 770 3 female no 0 3.360  2
## 772 3   male no 0 3.540 12
## 774 3   male no 0 1.520  3
## 777 3   male no 0 3.540 25
## 782 3 female no 0 4.290  5
## 787 4   male no 0 4.290  7
## 789 4   male no 0 2.520  6
## 790 4 female no 0 1.400  3
## 795 4   male no 0 3.850 47
## 796 4   male no 0 4.540  5
## 798 4   male no 0 3.410 21
## 807 4   male no 0 3.410  7
## 810 4   male no 0 4.620 18
## 818 4 female no 0 2.500 10
## 822 4 female no 0 2.860 39
## 826 4 female no 0 2.870  6
## 827 4 female no 0 3.340 11
## 828 4 female no 0 3.150  8
## 829 4 female no 0 2.320  8
## 830 4   male no 0 4.290 19
## 831 4   male no 0 3.690  7
## 833 4 female no 0 4.620  3
## 838 4 female no 0 3.190  3
## 839 4 female no 0 2.560 23
## 843 4 female no 0 3.590  9
## 845 4 female no 0 3.750  3
## 850 4   male no 0 2.870 15
## 852 5 female no 0 3.750 13
## 858 5   male no 0 3.360 11
## 859 5 female no 0 3.590 14
## 865 5 female no 0 2.870 12
## 876 5 female no 0 2.580  6
## 877 5 female no 0 3.620  3
## 885 6   male no 0 4.290 18
## 886 6   male no 0 3.400 14
## 887 6 female no 0 4.540 12
## 889 6 female no 0 3.150  9
## 890 6 female no 0 4.540 15
## 891 6   male no 0 3.470  6
## 893 6   male no 0 1.970  4
## 894 6 female no 0 3.320  6
## 896 7   male no 0 2.540  6
## 897 7   male no 0 3.410 20
## 899 7 female no 0 3.150  9
## 900 7   male no 0 4.620 15
## 901 7   male no 0 4.540 42
## 903 7   male no 0 4.340 19
## 904 7   male no 0 4.290 19
## 906 7   male no 0 3.690 19

Thống kê biến

Ta dùng lệch summary tóm tắt thống kê dữ liệu. Ta có thể biết các thông tin về min, max, trung bình, trung vị, tứ phân vị của các biến trong tập dữ liệu.

summary(p)
##        a               g         ma            k                pr       
##  Min.   : 0.000   male  :494   no :309   Min.   :0.0000   Min.   :0.755  
##  1st Qu.: 0.000   female:421   yes:606   1st Qu.:0.0000   1st Qu.:2.260  
##  Median : 1.000                          Median :0.0000   Median :3.150  
##  Mean   : 1.693                          Mean   :0.4951   Mean   :3.103  
##  3rd Qu.: 2.000                          3rd Qu.:1.0000   3rd Qu.:3.920  
##  Max.   :19.000                          Max.   :3.0000   Max.   :4.620  
##        m         
##  Min.   : 0.000  
##  1st Qu.: 3.000  
##  Median : 6.000  
##  Mean   : 8.767  
##  3rd Qu.:12.000  
##  Max.   :77.000

Ta cũng có thể sử dụng các lệnh thống kê để phân tích biến a (số bài báo cáo)

Kết quả cho thấy:

-Trung bình số bài báo cáo của 1 nghiên cứu sinh là gần được 2 bài

-Trung vị là 1 cho biết có 50% số nghiên cứu sinh có số bài báo cáo ít hơn 1

-Độ lệch chuẩn của biến a là 1.92

-Phương sai của biến a là 3.7

-Hàm Quantile cho biết 70% nghiên cứu sinh có số lượng bài báo cáo ít hơn 2

mean(p$a)
## [1] 1.692896
median(p$a)
## [1] 1
sd(p$a)
## [1] 1.926069
var(p$a)
## [1] 3.709742
quantile(p$a,0.7)
## 70% 
##   2

Đầu tiên, ta nhìn tổng quan biến a (số bài báo cáo)

Chia số bài báo cáo thành 3 tổ khác nhau

Sau đó, lập bảng thống kê với biến a

  • Ta thấy, tổ it là tổ có số bài báo cáo từ 1 bài đến 6 bài có số lượng nghiên cứu sinh nhiều nhất là 619 người(67%)

  • Tổ trungbinh là tổ có số bài báo cáo từ 6 đến 12 bài có số lượng nghiên cứu sinh chiếm thứ 2 là 19 người (2%)

  • Tổ nhieu là tổ có số bài báo cáo từ 12 bài trở lên có số lượng nghiên cứu sinh chiếm ít nhất là 2 người(0.2%)

  • Phần còn lại là số nghiên cứu sinh không có bài báo cáo nào với 275 người.

summary(p$a)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   0.000   1.000   1.693   2.000  19.000
sbbc <- cut(p$a, breaks = c(0,6,12,19), labels = c('it','trungbinh','nhieu'))
table(sbbc)
## sbbc
##        it trungbinh     nhieu 
##       619        19         2

Thống kê tổng hợp dữ liệu của biến a theo biến g và tính trung bình của các biến trong g theo a bằng lệnh aggregate

  • Từ kết quả ta thấy, những nam nghiên cứu sinh trung bình làm khoảng 2 bài báo cáo

  • Còn những nữ nghiên cứu sinh trung bình làm được 1 bài báo cáo

aggregate(p$a, list(p$g), FUN = 'mean')
##   Group.1        x
## 1    male 1.882591
## 2  female 1.470309

Ta dùng lệnh “group_by” để phân nhóm dữ liệu theo giới tính

Bên cạnh đó, có thể dùng lệnh summarise để tính trung bình số bài báo cáo các nghiên cứu sinh làm được theo giới tính

library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.2     ✔ readr     2.1.4
## ✔ forcats   1.0.0     ✔ stringr   1.5.0
## ✔ ggplot2   3.4.2     ✔ tibble    3.2.1
## ✔ lubridate 1.9.2     ✔ tidyr     1.3.0
## ✔ purrr     1.0.1     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ✖ dplyr::recode() masks car::recode()
## ✖ purrr::some()   masks car::some()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
p %>% group_by(g)
## # A tibble: 915 × 6
## # Groups:   g [2]
##        a g      ma        k    pr     m
##    <int> <fct>  <fct> <int> <dbl> <int>
##  1     0 male   yes       0  2.52     7
##  2     0 female no        0  2.05     6
##  3     0 female no        0  3.75     6
##  4     0 male   yes       1  1.18     3
##  5     0 female no        0  3.75    26
##  6     0 female yes       2  3.59     2
##  7     0 female no        0  3.19     3
##  8     0 male   yes       2  2.96     4
##  9     0 male   no        0  4.62     6
## 10     0 female yes       0  1.25     0
## # ℹ 905 more rows
group_by(p,g)
## # A tibble: 915 × 6
## # Groups:   g [2]
##        a g      ma        k    pr     m
##    <int> <fct>  <fct> <int> <dbl> <int>
##  1     0 male   yes       0  2.52     7
##  2     0 female no        0  2.05     6
##  3     0 female no        0  3.75     6
##  4     0 male   yes       1  1.18     3
##  5     0 female no        0  3.75    26
##  6     0 female yes       2  3.59     2
##  7     0 female no        0  3.19     3
##  8     0 male   yes       2  2.96     4
##  9     0 male   no        0  4.62     6
## 10     0 female yes       0  1.25     0
## # ℹ 905 more rows
p %>% group_by(g) %>%  summarise(n = mean(a))
## # A tibble: 2 × 2
##   g          n
##   <fct>  <dbl>
## 1 male    1.88
## 2 female  1.47

BÀI TẬP VỀ NHÀ 1

Gỉai thích dữ liệu

Tập dữ liệu PhDPublications được thu thập vào năm 1997 nói về số bài báo cáo của các nghiên cứu sinh trong lĩnh vực hóa sinh.

Dữ liệu gồm 915 quan sát và có 6 biến:

  • articles: số bài báo cáo được đăng trong 3 năm gần đây

  • gender: giới tính của nghiên cứu sinh

  • married: tình trạng hôn nhân của nghiên cứu sinh

  • kids: số con dưới 6 tuổi của nghiên cứu sinh

  • prestige: chất lượng của chương trình đào tạo

  • mentor: số bài báo cáo được đăng của người hướng dẫn nghiên cứu sinh

Lấy dữ liệu từ package

library(AER)
data("PhDPublications")

Gán dữ liệu vào p

p <- PhDPublications

Xem cấu trúc dữ liệu

str(p)
## 'data.frame':    915 obs. of  6 variables:
##  $ articles: int  0 0 0 0 0 0 0 0 0 0 ...
##  $ gender  : Factor w/ 2 levels "male","female": 1 2 2 1 2 2 2 1 1 2 ...
##  $ married : Factor w/ 2 levels "no","yes": 2 1 1 2 1 2 1 2 1 2 ...
##  $ kids    : int  0 0 0 1 0 2 0 2 0 0 ...
##  $ prestige: num  2.52 2.05 3.75 1.18 3.75 ...
##  $ mentor  : int  7 6 6 3 26 2 3 4 6 0 ...
##  - attr(*, "datalabel")= chr "Academic Biochemists / S Long"
##  - attr(*, "time.stamp")= chr "30 Jan 2001 10:49"
##  - attr(*, "formats")= chr [1:6] "%9.0g" "%9.0g" "%9.0g" "%9.0g" ...
##  - attr(*, "types")= int [1:6] 98 98 98 98 102 98
##  - attr(*, "val.labels")= chr [1:6] "" "sexlbl" "marlbl" "" ...
##  - attr(*, "var.labels")= chr [1:6] "Articles in last 3 yrs of PhD" "Gender: 1=female 0=male" "Married: 1=yes 0=no" "Number of children < 6" ...
##  - attr(*, "version")= int 6
##  - attr(*, "label.table")=List of 6
##   ..$ marlbl: Named num [1:2] 0 1
##   .. ..- attr(*, "names")= chr [1:2] "Single" "Married"
##   ..$ sexlbl: Named num [1:2] 0 1
##   .. ..- attr(*, "names")= chr [1:2] "Men" "Women"
##   ..$       : NULL
##   ..$       : NULL
##   ..$       : NULL
##   ..$       : NULL

Xem các quan sát đầu của tập dữ liệu

head(p)
##   articles gender married kids prestige mentor
## 1        0   male     yes    0     2.52      7
## 2        0 female      no    0     2.05      6
## 3        0 female      no    0     3.75      6
## 4        0   male     yes    1     1.18      3
## 5        0 female      no    0     3.75     26
## 6        0 female     yes    2     3.59      2

Xem các quan sát cuối của tập dữ liệu

tail(p)
##     articles gender married kids prestige mentor
## 910       10 female     yes    0     3.59     18
## 911       11   male     yes    2     2.86      7
## 912       12   male     yes    1     4.29     35
## 913       12   male     yes    1     1.86      5
## 914       16   male     yes    0     1.74     21
## 915       19   male     yes    0     1.86     42

Đặt tên các biến

names(p) <- c('a','g','ma','k','pr','m')

Lọc dữ liệu

Gán biến a vào sobaibc

Lọc số nghiên cứu sinh có số bài báo cáo từ 5 đến 10 bài

  • Từ kết quả, ta thấy có 32 nghiên cứu sinh có số bài báo nằm trong khoảng này (chiếm 3.5%)
sobaibc <- p$a
sobaibc510 <- sobaibc[sobaibc>5 & sobaibc<10]
sobaibc510
##  [1] 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 8 9 9

Lọc số nghiên cứu sinh có số bài báo cáo nhiều hơn 1 và có hơn 1 con

  • Từ kết quả cho thấy có khá ít người (48 người) có số bài báo cáo nhiều hơn 1 và có hơn 1 con (chiếm 5,24%)
sobaibcs <- p[p$a>1&p$k>1,]
sobaibcs
##      a      g  ma k   pr  m
## 533  2   male yes 2 2.96  8
## 546  2   male yes 2 2.96 46
## 550  2   male yes 2 4.29  8
## 558  2   male yes 2 1.80  6
## 568  2   male yes 2 4.54  2
## 569  2 female yes 2 3.85 47
## 570  2   male yes 2 2.96 21
## 579  2 female yes 2 1.22  4
## 582  2   male yes 2 2.87 20
## 588  2   male yes 2 4.29 10
## 597  2   male yes 2 1.97  0
## 602  2   male yes 3 4.34  7
## 610  2   male yes 2 2.21 12
## 620  2   male yes 2 4.34 17
## 625  2   male yes 2 3.32 27
## 627  2 female yes 2 2.58  3
## 628  2   male yes 2 3.54 16
## 634  2   male yes 2 2.50  5
## 635  2   male yes 3 2.00  8
## 668  2 female yes 2 3.59 11
## 676  2   male yes 2 1.86  6
## 678  2 female yes 2 4.54 48
## 689  2 female yes 2 3.21  2
## 694  2   male yes 2 4.29 30
## 703  3   male yes 2 4.54 31
## 717  3   male yes 2 1.80  6
## 723  3   male yes 2 4.29  0
## 725  3   male yes 2 4.29 25
## 732  3   male yes 2 1.95  3
## 737  3   male yes 2 2.83  7
## 749  3 female yes 2 1.89 16
## 773  3   male yes 2 2.58  2
## 778  3   male yes 2 2.10  4
## 779  3   male yes 2 1.38  8
## 781  3   male yes 3 2.86  3
## 801  4   male yes 2 1.72  2
## 802  4   male yes 2 2.86 15
## 803  4   male yes 2 4.54 66
## 805  4   male yes 2 1.86 15
## 809  4   male yes 2 2.05 13
## 814  4   male yes 2 3.54  2
## 821  4   male yes 2 4.54 21
## 846  4   male yes 2 3.69 16
## 849  4   male yes 2 2.58  6
## 853  5   male yes 2 3.85 15
## 880  6 female yes 2 1.86 38
## 883  6   male yes 2 2.51 11
## 911 11   male yes 2 2.86  7

Lập bảng

Chia biến a thành 4 tổ và lập bảng tần số

  • Số lượng bài báo cáo dưới 5 bài chiếm số lượng nhiều nhất với 850 nghiên cứu sinh (chiếm 93%)

  • Tổ từ 5 đến 10 bài báo cáo có 59 nghiên cứu sinh( chiếm 6.4%)

  • Tổ từ 10 đến 15 bài báo cáo có 4 nghiên cứu sinh (chiếm 0.4%)

  • Số lượng nghiên cứu sinh có từ 15 đến 19 bài báo cáo chiếm số lượng ít nhất với 2 người (chiếm 0.2%)

table(cut(p$a,4))
## 
## (-0.019,4.75]    (4.75,9.5]    (9.5,14.2]     (14.2,19] 
##           850            59             4             2

Lập bảng tần số của số bài báo cáo theo giới tính

  • Ta thấy trong 915 nghiên cứu sinh thì nam chiếm nhiều hơn với 494 người (chiếm 54%) tuy nghiên không có sự cách biệt quá lớn so với nữ (chiếm 46%).

  • Số lượng bài báo cáo dưới 5 chiếm nhiều nhất (93%) với 450 bài là của nam nghiên cứu sinh và 400 bài của nữ nghiên cứu sinh.

table(cut(p$a,4),p$g)
##                
##                 male female
##   (-0.019,4.75]  450    400
##   (4.75,9.5]      39     20
##   (9.5,14.2]       3      1
##   (14.2,19]        2      0

Lập bảng tần số của số bài báo cáo theo số con

  • Từ kết quả cho thấy, số nghiên cứu sinh không có con chiếm số lượng nhiều nhất, 599 người (65%) và số nghiên cứu sinh có 3 con chiếm thấp nhất, chỉ có 16 người (khoảng 1,7%). Như vậy, ta thấy những nghiên cứu sinh càng có nhiều bài báo cáo thì số con họ có càng ít.
table(cut(p$a,4),p$k)
##                
##                   0   1   2   3
##   (-0.019,4.75] 556 177 101  16
##   (4.75,9.5]     40  16   3   0
##   (9.5,14.2]      1   2   1   0
##   (14.2,19]       2   0   0   0