mydata=read.csv('C:/Users/lfult/Documents/titanic/train.csv', stringsAsFactors = TRUE)
mydata[mydata==""]<-NA #replace "" factor levels with NA
Types and Levels, PassengerID & Age
Passenger ID is qualitative measured at the NOMINAL (name only). Age is quantitative measured at the RATIO level.
mydata$PassengerId=as.factor(mydata$PassengerId)
cat(noquote(c('Passenger ID:', ' Nominal, ', class(mydata$PassengerId),', Age: ', class(mydata$Age))))
## Passenger ID: Nominal, factor , Age: numeric
Most missing?
# Most missing column
missing_counts <- colSums(is.na(mydata))
data.frame(Variable = names(which.max(missing_counts)), Missing_Count = max(missing_counts))
## Variable Missing_Count
## 1 Cabin 687
# Compact missing summary function
summarize_missing <- function(df) {
mc <- colSums(is.na(df))
col_sum <- data.frame(column = names(df), missing_count = mc, missing_percent = 100*mc/nrow(df))[order(-mc),]
incomplete <- df[!complete.cases(df),]
if(nrow(incomplete) > 0) {
row_mc <- rowSums(is.na(incomplete))
row_sum <- data.frame(row_number = as.integer(rownames(incomplete)), missing_count = row_mc, missing_percent = 100*row_mc/ncol(df))[order(-row_mc),]
} else row_sum <- data.frame()
list(column_summary = col_sum, incomplete_rows_summary = row_sum)
}
summarize_missing(mydata)
## $column_summary
## column missing_count missing_percent
## Cabin Cabin 687 77.1043771
## Age Age 177 19.8653199
## Embarked Embarked 2 0.2244669
## PassengerId PassengerId 0 0.0000000
## Survived Survived 0 0.0000000
## Pclass Pclass 0 0.0000000
## Name Name 0 0.0000000
## Sex Sex 0 0.0000000
## SibSp SibSp 0 0.0000000
## Parch Parch 0 0.0000000
## Ticket Ticket 0 0.0000000
## Fare Fare 0 0.0000000
##
## $incomplete_rows_summary
## row_number missing_count missing_percent
## 6 6 2 16.666667
## 18 18 2 16.666667
## 20 20 2 16.666667
## 27 27 2 16.666667
## 29 29 2 16.666667
## 30 30 2 16.666667
## 33 33 2 16.666667
## 37 37 2 16.666667
## 43 43 2 16.666667
## 46 46 2 16.666667
## 47 47 2 16.666667
## 48 48 2 16.666667
## 49 49 2 16.666667
## 65 65 2 16.666667
## 66 66 2 16.666667
## 77 77 2 16.666667
## 78 78 2 16.666667
## 83 83 2 16.666667
## 88 88 2 16.666667
## 96 96 2 16.666667
## 102 102 2 16.666667
## 108 108 2 16.666667
## 110 110 2 16.666667
## 122 122 2 16.666667
## 127 127 2 16.666667
## 141 141 2 16.666667
## 155 155 2 16.666667
## 159 159 2 16.666667
## 160 160 2 16.666667
## 169 169 2 16.666667
## 177 177 2 16.666667
## 181 181 2 16.666667
## 182 182 2 16.666667
## 187 187 2 16.666667
## 197 197 2 16.666667
## 199 199 2 16.666667
## 202 202 2 16.666667
## 215 215 2 16.666667
## 224 224 2 16.666667
## 230 230 2 16.666667
## 236 236 2 16.666667
## 241 241 2 16.666667
## 242 242 2 16.666667
## 251 251 2 16.666667
## 257 257 2 16.666667
## 261 261 2 16.666667
## 265 265 2 16.666667
## 271 271 2 16.666667
## 275 275 2 16.666667
## 278 278 2 16.666667
## 296 296 2 16.666667
## 301 301 2 16.666667
## 302 302 2 16.666667
## 305 305 2 16.666667
## 307 307 2 16.666667
## 325 325 2 16.666667
## 331 331 2 16.666667
## 335 335 2 16.666667
## 336 336 2 16.666667
## 348 348 2 16.666667
## 355 355 2 16.666667
## 359 359 2 16.666667
## 360 360 2 16.666667
## 365 365 2 16.666667
## 368 368 2 16.666667
## 369 369 2 16.666667
## 376 376 2 16.666667
## 385 385 2 16.666667
## 389 389 2 16.666667
## 410 410 2 16.666667
## 411 411 2 16.666667
## 412 412 2 16.666667
## 414 414 2 16.666667
## 416 416 2 16.666667
## 421 421 2 16.666667
## 426 426 2 16.666667
## 429 429 2 16.666667
## 432 432 2 16.666667
## 445 445 2 16.666667
## 452 452 2 16.666667
## 455 455 2 16.666667
## 460 460 2 16.666667
## 465 465 2 16.666667
## 467 467 2 16.666667
## 469 469 2 16.666667
## 471 471 2 16.666667
## 482 482 2 16.666667
## 486 486 2 16.666667
## 491 491 2 16.666667
## 496 496 2 16.666667
## 498 498 2 16.666667
## 503 503 2 16.666667
## 508 508 2 16.666667
## 512 512 2 16.666667
## 518 518 2 16.666667
## 523 523 2 16.666667
## 525 525 2 16.666667
## 532 532 2 16.666667
## 534 534 2 16.666667
## 539 539 2 16.666667
## 548 548 2 16.666667
## 553 553 2 16.666667
## 558 558 2 16.666667
## 561 561 2 16.666667
## 564 564 2 16.666667
## 565 565 2 16.666667
## 569 569 2 16.666667
## 574 574 2 16.666667
## 579 579 2 16.666667
## 585 585 2 16.666667
## 590 590 2 16.666667
## 594 594 2 16.666667
## 597 597 2 16.666667
## 599 599 2 16.666667
## 602 602 2 16.666667
## 603 603 2 16.666667
## 612 612 2 16.666667
## 613 613 2 16.666667
## 614 614 2 16.666667
## 630 630 2 16.666667
## 634 634 2 16.666667
## 640 640 2 16.666667
## 644 644 2 16.666667
## 649 649 2 16.666667
## 651 651 2 16.666667
## 654 654 2 16.666667
## 657 657 2 16.666667
## 668 668 2 16.666667
## 675 675 2 16.666667
## 681 681 2 16.666667
## 693 693 2 16.666667
## 698 698 2 16.666667
## 710 710 2 16.666667
## 719 719 2 16.666667
## 728 728 2 16.666667
## 733 733 2 16.666667
## 739 739 2 16.666667
## 740 740 2 16.666667
## 761 761 2 16.666667
## 767 767 2 16.666667
## 769 769 2 16.666667
## 774 774 2 16.666667
## 779 779 2 16.666667
## 784 784 2 16.666667
## 791 791 2 16.666667
## 793 793 2 16.666667
## 794 794 2 16.666667
## 826 826 2 16.666667
## 827 827 2 16.666667
## 829 829 2 16.666667
## 833 833 2 16.666667
## 838 838 2 16.666667
## 847 847 2 16.666667
## 860 860 2 16.666667
## 864 864 2 16.666667
## 869 869 2 16.666667
## 879 879 2 16.666667
## 889 889 2 16.666667
## 1 1 1 8.333333
## 3 3 1 8.333333
## 5 5 1 8.333333
## 8 8 1 8.333333
## 9 9 1 8.333333
## 10 10 1 8.333333
## 13 13 1 8.333333
## 14 14 1 8.333333
## 15 15 1 8.333333
## 16 16 1 8.333333
## 17 17 1 8.333333
## 19 19 1 8.333333
## 21 21 1 8.333333
## 23 23 1 8.333333
## 25 25 1 8.333333
## 26 26 1 8.333333
## 31 31 1 8.333333
## 32 32 1 8.333333
## 34 34 1 8.333333
## 35 35 1 8.333333
## 36 36 1 8.333333
## 38 38 1 8.333333
## 39 39 1 8.333333
## 40 40 1 8.333333
## 41 41 1 8.333333
## 42 42 1 8.333333
## 44 44 1 8.333333
## 45 45 1 8.333333
## 50 50 1 8.333333
## 51 51 1 8.333333
## 52 52 1 8.333333
## 54 54 1 8.333333
## 56 56 1 8.333333
## 57 57 1 8.333333
## 58 58 1 8.333333
## 59 59 1 8.333333
## 60 60 1 8.333333
## 61 61 1 8.333333
## 62 62 1 8.333333
## 64 64 1 8.333333
## 68 68 1 8.333333
## 69 69 1 8.333333
## 70 70 1 8.333333
## 71 71 1 8.333333
## 72 72 1 8.333333
## 73 73 1 8.333333
## 74 74 1 8.333333
## 75 75 1 8.333333
## 79 79 1 8.333333
## 80 80 1 8.333333
## 81 81 1 8.333333
## 82 82 1 8.333333
## 84 84 1 8.333333
## 85 85 1 8.333333
## 86 86 1 8.333333
## 87 87 1 8.333333
## 90 90 1 8.333333
## 91 91 1 8.333333
## 92 92 1 8.333333
## 94 94 1 8.333333
## 95 95 1 8.333333
## 99 99 1 8.333333
## 100 100 1 8.333333
## 101 101 1 8.333333
## 104 104 1 8.333333
## 105 105 1 8.333333
## 106 106 1 8.333333
## 107 107 1 8.333333
## 109 109 1 8.333333
## 112 112 1 8.333333
## 113 113 1 8.333333
## 114 114 1 8.333333
## 115 115 1 8.333333
## 116 116 1 8.333333
## 117 117 1 8.333333
## 118 118 1 8.333333
## 120 120 1 8.333333
## 121 121 1 8.333333
## 123 123 1 8.333333
## 126 126 1 8.333333
## 128 128 1 8.333333
## 129 129 1 8.333333
## 130 130 1 8.333333
## 131 131 1 8.333333
## 132 132 1 8.333333
## 133 133 1 8.333333
## 134 134 1 8.333333
## 135 135 1 8.333333
## 136 136 1 8.333333
## 139 139 1 8.333333
## 142 142 1 8.333333
## 143 143 1 8.333333
## 144 144 1 8.333333
## 145 145 1 8.333333
## 146 146 1 8.333333
## 147 147 1 8.333333
## 148 148 1 8.333333
## 150 150 1 8.333333
## 151 151 1 8.333333
## 153 153 1 8.333333
## 154 154 1 8.333333
## 156 156 1 8.333333
## 157 157 1 8.333333
## 158 158 1 8.333333
## 161 161 1 8.333333
## 162 162 1 8.333333
## 163 163 1 8.333333
## 164 164 1 8.333333
## 165 165 1 8.333333
## 166 166 1 8.333333
## 167 167 1 8.333333
## 168 168 1 8.333333
## 170 170 1 8.333333
## 172 172 1 8.333333
## 173 173 1 8.333333
## 174 174 1 8.333333
## 176 176 1 8.333333
## 179 179 1 8.333333
## 180 180 1 8.333333
## 183 183 1 8.333333
## 185 185 1 8.333333
## 186 186 1 8.333333
## 188 188 1 8.333333
## 189 189 1 8.333333
## 190 190 1 8.333333
## 191 191 1 8.333333
## 192 192 1 8.333333
## 193 193 1 8.333333
## 198 198 1 8.333333
## 200 200 1 8.333333
## 201 201 1 8.333333
## 203 203 1 8.333333
## 204 204 1 8.333333
## 205 205 1 8.333333
## 207 207 1 8.333333
## 208 208 1 8.333333
## 209 209 1 8.333333
## 211 211 1 8.333333
## 212 212 1 8.333333
## 213 213 1 8.333333
## 214 214 1 8.333333
## 217 217 1 8.333333
## 218 218 1 8.333333
## 220 220 1 8.333333
## 221 221 1 8.333333
## 222 222 1 8.333333
## 223 223 1 8.333333
## 226 226 1 8.333333
## 227 227 1 8.333333
## 228 228 1 8.333333
## 229 229 1 8.333333
## 232 232 1 8.333333
## 233 233 1 8.333333
## 234 234 1 8.333333
## 235 235 1 8.333333
## 237 237 1 8.333333
## 238 238 1 8.333333
## 239 239 1 8.333333
## 240 240 1 8.333333
## 243 243 1 8.333333
## 244 244 1 8.333333
## 245 245 1 8.333333
## 247 247 1 8.333333
## 248 248 1 8.333333
## 250 250 1 8.333333
## 254 254 1 8.333333
## 255 255 1 8.333333
## 256 256 1 8.333333
## 259 259 1 8.333333
## 260 260 1 8.333333
## 262 262 1 8.333333
## 266 266 1 8.333333
## 267 267 1 8.333333
## 268 268 1 8.333333
## 272 272 1 8.333333
## 273 273 1 8.333333
## 277 277 1 8.333333
## 279 279 1 8.333333
## 280 280 1 8.333333
## 281 281 1 8.333333
## 282 282 1 8.333333
## 283 283 1 8.333333
## 284 284 1 8.333333
## 285 285 1 8.333333
## 286 286 1 8.333333
## 287 287 1 8.333333
## 288 288 1 8.333333
## 289 289 1 8.333333
## 290 290 1 8.333333
## 291 291 1 8.333333
## 294 294 1 8.333333
## 295 295 1 8.333333
## 297 297 1 8.333333
## 299 299 1 8.333333
## 303 303 1 8.333333
## 304 304 1 8.333333
## 309 309 1 8.333333
## 313 313 1 8.333333
## 314 314 1 8.333333
## 315 315 1 8.333333
## 316 316 1 8.333333
## 317 317 1 8.333333
## 318 318 1 8.333333
## 321 321 1 8.333333
## 322 322 1 8.333333
## 323 323 1 8.333333
## 324 324 1 8.333333
## 327 327 1 8.333333
## 329 329 1 8.333333
## 334 334 1 8.333333
## 339 339 1 8.333333
## 343 343 1 8.333333
## 344 344 1 8.333333
## 345 345 1 8.333333
## 347 347 1 8.333333
## 349 349 1 8.333333
## 350 350 1 8.333333
## 351 351 1 8.333333
## 352 352 1 8.333333
## 353 353 1 8.333333
## 354 354 1 8.333333
## 356 356 1 8.333333
## 358 358 1 8.333333
## 361 361 1 8.333333
## 362 362 1 8.333333
## 363 363 1 8.333333
## 364 364 1 8.333333
## 366 366 1 8.333333
## 372 372 1 8.333333
## 373 373 1 8.333333
## 374 374 1 8.333333
## 375 375 1 8.333333
## 377 377 1 8.333333
## 379 379 1 8.333333
## 380 380 1 8.333333
## 381 381 1 8.333333
## 382 382 1 8.333333
## 383 383 1 8.333333
## 384 384 1 8.333333
## 386 386 1 8.333333
## 387 387 1 8.333333
## 388 388 1 8.333333
## 390 390 1 8.333333
## 392 392 1 8.333333
## 393 393 1 8.333333
## 396 396 1 8.333333
## 397 397 1 8.333333
## 398 398 1 8.333333
## 399 399 1 8.333333
## 400 400 1 8.333333
## 401 401 1 8.333333
## 402 402 1 8.333333
## 403 403 1 8.333333
## 404 404 1 8.333333
## 405 405 1 8.333333
## 406 406 1 8.333333
## 407 407 1 8.333333
## 408 408 1 8.333333
## 409 409 1 8.333333
## 415 415 1 8.333333
## 417 417 1 8.333333
## 418 418 1 8.333333
## 419 419 1 8.333333
## 420 420 1 8.333333
## 422 422 1 8.333333
## 423 423 1 8.333333
## 424 424 1 8.333333
## 425 425 1 8.333333
## 427 427 1 8.333333
## 428 428 1 8.333333
## 433 433 1 8.333333
## 434 434 1 8.333333
## 437 437 1 8.333333
## 438 438 1 8.333333
## 440 440 1 8.333333
## 441 441 1 8.333333
## 442 442 1 8.333333
## 443 443 1 8.333333
## 444 444 1 8.333333
## 447 447 1 8.333333
## 448 448 1 8.333333
## 449 449 1 8.333333
## 451 451 1 8.333333
## 456 456 1 8.333333
## 458 458 1 8.333333
## 459 459 1 8.333333
## 462 462 1 8.333333
## 464 464 1 8.333333
## 466 466 1 8.333333
## 468 468 1 8.333333
## 470 470 1 8.333333
## 472 472 1 8.333333
## 473 473 1 8.333333
## 475 475 1 8.333333
## 476 476 1 8.333333
## 477 477 1 8.333333
## 478 478 1 8.333333
## 479 479 1 8.333333
## 480 480 1 8.333333
## 481 481 1 8.333333
## 483 483 1 8.333333
## 484 484 1 8.333333
## 489 489 1 8.333333
## 490 490 1 8.333333
## 492 492 1 8.333333
## 494 494 1 8.333333
## 495 495 1 8.333333
## 500 500 1 8.333333
## 501 501 1 8.333333
## 502 502 1 8.333333
## 504 504 1 8.333333
## 507 507 1 8.333333
## 509 509 1 8.333333
## 510 510 1 8.333333
## 511 511 1 8.333333
## 514 514 1 8.333333
## 515 515 1 8.333333
## 519 519 1 8.333333
## 520 520 1 8.333333
## 522 522 1 8.333333
## 526 526 1 8.333333
## 527 527 1 8.333333
## 528 528 1 8.333333
## 529 529 1 8.333333
## 530 530 1 8.333333
## 531 531 1 8.333333
## 533 533 1 8.333333
## 535 535 1 8.333333
## 536 536 1 8.333333
## 538 538 1 8.333333
## 542 542 1 8.333333
## 543 543 1 8.333333
## 544 544 1 8.333333
## 546 546 1 8.333333
## 547 547 1 8.333333
## 549 549 1 8.333333
## 550 550 1 8.333333
## 552 552 1 8.333333
## 554 554 1 8.333333
## 555 555 1 8.333333
## 556 556 1 8.333333
## 560 560 1 8.333333
## 562 562 1 8.333333
## 563 563 1 8.333333
## 566 566 1 8.333333
## 567 567 1 8.333333
## 568 568 1 8.333333
## 570 570 1 8.333333
## 571 571 1 8.333333
## 575 575 1 8.333333
## 576 576 1 8.333333
## 577 577 1 8.333333
## 580 580 1 8.333333
## 581 581 1 8.333333
## 583 583 1 8.333333
## 587 587 1 8.333333
## 589 589 1 8.333333
## 591 591 1 8.333333
## 593 593 1 8.333333
## 595 595 1 8.333333
## 596 596 1 8.333333
## 598 598 1 8.333333
## 601 601 1 8.333333
## 604 604 1 8.333333
## 605 605 1 8.333333
## 606 606 1 8.333333
## 607 607 1 8.333333
## 608 608 1 8.333333
## 609 609 1 8.333333
## 611 611 1 8.333333
## 615 615 1 8.333333
## 616 616 1 8.333333
## 617 617 1 8.333333
## 618 618 1 8.333333
## 620 620 1 8.333333
## 621 621 1 8.333333
## 623 623 1 8.333333
## 624 624 1 8.333333
## 625 625 1 8.333333
## 627 627 1 8.333333
## 629 629 1 8.333333
## 632 632 1 8.333333
## 635 635 1 8.333333
## 636 636 1 8.333333
## 637 637 1 8.333333
## 638 638 1 8.333333
## 639 639 1 8.333333
## 641 641 1 8.333333
## 643 643 1 8.333333
## 645 645 1 8.333333
## 647 647 1 8.333333
## 650 650 1 8.333333
## 652 652 1 8.333333
## 653 653 1 8.333333
## 655 655 1 8.333333
## 656 656 1 8.333333
## 658 658 1 8.333333
## 659 659 1 8.333333
## 661 661 1 8.333333
## 662 662 1 8.333333
## 664 664 1 8.333333
## 665 665 1 8.333333
## 666 666 1 8.333333
## 667 667 1 8.333333
## 669 669 1 8.333333
## 670 670 1 8.333333
## 671 671 1 8.333333
## 673 673 1 8.333333
## 674 674 1 8.333333
## 676 676 1 8.333333
## 677 677 1 8.333333
## 678 678 1 8.333333
## 679 679 1 8.333333
## 683 683 1 8.333333
## 684 684 1 8.333333
## 685 685 1 8.333333
## 686 686 1 8.333333
## 687 687 1 8.333333
## 688 688 1 8.333333
## 689 689 1 8.333333
## 692 692 1 8.333333
## 694 694 1 8.333333
## 695 695 1 8.333333
## 696 696 1 8.333333
## 697 697 1 8.333333
## 703 703 1 8.333333
## 704 704 1 8.333333
## 705 705 1 8.333333
## 706 706 1 8.333333
## 707 707 1 8.333333
## 709 709 1 8.333333
## 712 712 1 8.333333
## 714 714 1 8.333333
## 715 715 1 8.333333
## 720 720 1 8.333333
## 721 721 1 8.333333
## 722 722 1 8.333333
## 723 723 1 8.333333
## 724 724 1 8.333333
## 726 726 1 8.333333
## 727 727 1 8.333333
## 729 729 1 8.333333
## 730 730 1 8.333333
## 732 732 1 8.333333
## 734 734 1 8.333333
## 735 735 1 8.333333
## 736 736 1 8.333333
## 737 737 1 8.333333
## 741 741 1 8.333333
## 744 744 1 8.333333
## 745 745 1 8.333333
## 747 747 1 8.333333
## 748 748 1 8.333333
## 750 750 1 8.333333
## 751 751 1 8.333333
## 753 753 1 8.333333
## 754 754 1 8.333333
## 755 755 1 8.333333
## 756 756 1 8.333333
## 757 757 1 8.333333
## 758 758 1 8.333333
## 759 759 1 8.333333
## 762 762 1 8.333333
## 763 763 1 8.333333
## 765 765 1 8.333333
## 768 768 1 8.333333
## 770 770 1 8.333333
## 771 771 1 8.333333
## 772 772 1 8.333333
## 775 775 1 8.333333
## 776 776 1 8.333333
## 777 777 1 8.333333
## 778 778 1 8.333333
## 781 781 1 8.333333
## 785 785 1 8.333333
## 786 786 1 8.333333
## 787 787 1 8.333333
## 788 788 1 8.333333
## 789 789 1 8.333333
## 792 792 1 8.333333
## 795 795 1 8.333333
## 796 796 1 8.333333
## 798 798 1 8.333333
## 799 799 1 8.333333
## 800 800 1 8.333333
## 801 801 1 8.333333
## 802 802 1 8.333333
## 804 804 1 8.333333
## 805 805 1 8.333333
## 806 806 1 8.333333
## 808 808 1 8.333333
## 809 809 1 8.333333
## 811 811 1 8.333333
## 812 812 1 8.333333
## 813 813 1 8.333333
## 814 814 1 8.333333
## 815 815 1 8.333333
## 816 816 1 8.333333
## 817 817 1 8.333333
## 818 818 1 8.333333
## 819 819 1 8.333333
## 820 820 1 8.333333
## 822 822 1 8.333333
## 823 823 1 8.333333
## 825 825 1 8.333333
## 828 828 1 8.333333
## 830 830 1 8.333333
## 831 831 1 8.333333
## 832 832 1 8.333333
## 834 834 1 8.333333
## 835 835 1 8.333333
## 837 837 1 8.333333
## 839 839 1 8.333333
## 840 840 1 8.333333
## 841 841 1 8.333333
## 842 842 1 8.333333
## 843 843 1 8.333333
## 844 844 1 8.333333
## 845 845 1 8.333333
## 846 846 1 8.333333
## 848 848 1 8.333333
## 849 849 1 8.333333
## 850 850 1 8.333333
## 851 851 1 8.333333
## 852 852 1 8.333333
## 853 853 1 8.333333
## 855 855 1 8.333333
## 856 856 1 8.333333
## 857 857 1 8.333333
## 859 859 1 8.333333
## 861 861 1 8.333333
## 862 862 1 8.333333
## 865 865 1 8.333333
## 866 866 1 8.333333
## 867 867 1 8.333333
## 870 870 1 8.333333
## 871 871 1 8.333333
## 874 874 1 8.333333
## 875 875 1 8.333333
## 876 876 1 8.333333
## 877 877 1 8.333333
## 878 878 1 8.333333
## 881 881 1 8.333333
## 882 882 1 8.333333
## 883 883 1 8.333333
## 884 884 1 8.333333
## 885 885 1 8.333333
## 886 886 1 8.333333
## 887 887 1 8.333333
## 891 891 1 8.333333
Impute missing observations for Age, SibSp, and Parch with the median.
colSums(is.na(mydata))
## PassengerId Survived Pclass Name Sex Age
## 0 0 0 0 0 177
## SibSp Parch Ticket Fare Cabin Embarked
## 0 0 0 0 687 2
mydata[c("Age","SibSp","Parch")] <- lapply(mydata[c("Age","SibSp","Parch")], function(x) ifelse(is.na(x), median(x, na.rm=TRUE), x))
cat(paste(rep("=", 120), collapse=""), "\n")
## ========================================================================================================================
colSums(is.na(mydata))
## PassengerId Survived Pclass Name Sex Age
## 0 0 0 0 0 0
## SibSp Parch Ticket Fare Cabin Embarked
## 0 0 0 0 687 2
Descriptive statistics.
psych::describe(mydata[c("Age", "SibSp", "Parch")])
## vars n mean sd median trimmed mad min max range skew kurtosis se
## Age 1 891 29.36 13.02 28 28.83 8.9 0.42 80 79.58 0.51 0.97 0.44
## SibSp 2 891 0.52 1.10 0 0.27 0.0 0.00 8 8.00 3.68 17.73 0.04
## Parch 3 891 0.38 0.81 0 0.18 0.0 0.00 6 6.00 2.74 9.69 0.03
##Q4.
Provide a cross-tabulation of Survived and Sex.
addmargins(table(mydata$Survived, mydata$Sex))
##
## female male Sum
## 0 81 468 549
## 1 233 109 342
## Sum 314 577 891
Provide notched boxplots for Survived and Age. What do you notice?
boxplot(
Age ~ Survived,
data = mydata,
notch = TRUE,
horizontal = TRUE,
col = c("orange", "skyblue"),
main = "Little Discernible Effect",
xlab = "Survived",
ylab = "Age",
names = c("No", "Yes")
)