Tiempo invertido en la actividad en minutos: 1 hora
Grado de dificultad percibida de la actividad: Alto
Comentarios adicionales: no lo pude terminar, no recuerdo todos los códigos y, aunque realicé investigación no pude concluir.
library(readr)
my_data <- read_csv("C:\\Users\\Catalina\\Documents\\tec\\5to semestre\\titanic-1.csv")
## Rows: 891 Columns: 12
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (5): Name, Sex, Ticket, Cabin, Embarked
## dbl (7): PassengerId, Survived, Pclass, Age, SibSp, Parch, Fare
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(my_data)
# 1.- Dimensión de la base de datos y tipo de datos
dim(my_data)
## [1] 891 12
class(my_data)
## [1] "spec_tbl_df" "tbl_df" "tbl" "data.frame"
# 2.- Campos con valores "Null". Si existe un campo nulo, debes de cambiarlo con un NP (No Proporcionado).
colSums(sapply(my_data, is.na)) > 0
## PassengerId Survived Pclass Name Sex Age
## FALSE FALSE FALSE FALSE FALSE TRUE
## SibSp Parch Ticket Fare Cabin Embarked
## FALSE FALSE FALSE FALSE TRUE TRUE
# Los campos con valores nulos son Cabin, Age y Embarked
# 3.- Mostrar nombre y # de ticket de pasajeros.
filtro1<-my_data[,c("Name","Ticket")]
head(filtro1)
## # A tibble: 6 × 2
## Name Ticket
## <chr> <chr>
## 1 Braund, Mr. Owen Harris A/5 21171
## 2 Cumings, Mrs. John Bradley (Florence Briggs Thayer) PC 17599
## 3 Heikkinen, Miss. Laina STON/O2. 3101282
## 4 Futrelle, Mrs. Jacques Heath (Lily May Peel) 113803
## 5 Allen, Mr. William Henry 373450
## 6 Moran, Mr. James 330877
# 4.- Orden alfabético de nombre de usuarios
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
filtro2<-my_data %>%
arrange(Name)
print(filtro2)
## # A tibble: 891 × 12
## PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin
## <dbl> <dbl> <dbl> <chr> <chr> <dbl> <dbl> <dbl> <chr> <dbl> <chr>
## 1 846 0 3 Abbin… male 42 0 0 C.A. … 7.55 <NA>
## 2 747 0 3 Abbot… male 16 1 1 C.A. … 20.2 <NA>
## 3 280 1 3 Abbot… fema… 35 1 1 C.A. … 20.2 <NA>
## 4 309 0 2 Abels… male 30 1 0 P/PP … 24 <NA>
## 5 875 1 2 Abels… fema… 28 1 0 P/PP … 24 <NA>
## 6 366 0 3 Adahl… male 30 0 0 C 7076 7.25 <NA>
## 7 402 0 3 Adams… male 26 0 0 341826 8.05 <NA>
## 8 41 0 3 Ahlin… fema… 40 1 0 7546 9.48 <NA>
## 9 856 1 3 Aks, … fema… 18 0 1 392091 9.35 <NA>
## 10 208 1 3 Albim… male 26 0 0 2699 18.8 <NA>
## # ℹ 881 more rows
## # ℹ 1 more variable: Embarked <chr>
# 5.- Pasajero con mayor y menor edad
#Mayor
mayor<-my_data%>%
slice(which.max(Age))
print(mayor)
## # A tibble: 1 × 12
## PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin
## <dbl> <dbl> <dbl> <chr> <chr> <dbl> <dbl> <dbl> <chr> <dbl> <chr>
## 1 631 1 1 Barkwo… male 80 0 0 27042 30 A23
## # ℹ 1 more variable: Embarked <chr>
#Menor
menor<-my_data%>%
slice(which.min(Age))
print(menor)
## # A tibble: 1 × 12
## PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin
## <dbl> <dbl> <dbl> <chr> <chr> <dbl> <dbl> <dbl> <chr> <dbl> <chr>
## 1 804 1 3 Thomas… male 0.42 0 1 2625 8.52 <NA>
## # ℹ 1 more variable: Embarked <chr>
# 6.- Pasajeros mayores de edad
filtro3<- filter(my_data, Age>= 18)
head(filtro3)
## # A tibble: 6 × 12
## PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin
## <dbl> <dbl> <dbl> <chr> <chr> <dbl> <dbl> <dbl> <chr> <dbl> <chr>
## 1 1 0 3 Braund… male 22 1 0 A/5 2… 7.25 <NA>
## 2 2 1 1 Cuming… fema… 38 1 0 PC 17… 71.3 C85
## 3 3 1 3 Heikki… fema… 26 0 0 STON/… 7.92 <NA>
## 4 4 1 1 Futrel… fema… 35 1 0 113803 53.1 C123
## 5 5 0 3 Allen,… male 35 0 0 373450 8.05 <NA>
## 6 7 0 1 McCart… male 54 0 0 17463 51.9 E46
## # ℹ 1 more variable: Embarked <chr>
# 7.- Pasajeros hombres mayores de 70 años
Filtro4<-filter(my_data, Age>=70 | Sex == "male")
print(filtro3)
## # A tibble: 601 × 12
## PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin
## <dbl> <dbl> <dbl> <chr> <chr> <dbl> <dbl> <dbl> <chr> <dbl> <chr>
## 1 1 0 3 Braun… male 22 1 0 A/5 2… 7.25 <NA>
## 2 2 1 1 Cumin… fema… 38 1 0 PC 17… 71.3 C85
## 3 3 1 3 Heikk… fema… 26 0 0 STON/… 7.92 <NA>
## 4 4 1 1 Futre… fema… 35 1 0 113803 53.1 C123
## 5 5 0 3 Allen… male 35 0 0 373450 8.05 <NA>
## 6 7 0 1 McCar… male 54 0 0 17463 51.9 E46
## 7 9 1 3 Johns… fema… 27 0 2 347742 11.1 <NA>
## 8 12 1 1 Bonne… fema… 58 0 0 113783 26.6 C103
## 9 13 0 3 Saund… male 20 0 0 A/5. … 8.05 <NA>
## 10 14 0 3 Ander… male 39 1 5 347082 31.3 <NA>
## # ℹ 591 more rows
## # ℹ 1 more variable: Embarked <chr>