A) Cread un conjunto de datos inventado con R. Debe contener treinta observaciones (quince para hombres y quince para mujeres) para seis variables con estas características:
| Variable | Nombre | Características |
|---|---|---|
| Identificador | Id | carácter |
| Edad | Edad | numérica |
| Género | Gene | 2 valores (1 = mujer, 2 = hombre) |
| Tratamiento | Trat | Factor. Tres tipos de tratamiento (A, B y C) |
| Peso | Peso | numérica (en kg) |
| Estatura | Alt | numérica (en cm) |
#Primero creamos la semilla generadora de datos reproducibles
set.seed(123)
n <- 30
#Ahora creamos el resto de variables
dataset <- data.frame(
ID = id <- 1:30,
Edad = c(round(rnorm(15, 40, 8)), round(rnorm(15, 50, 10))),
Genero = factor(c(rep(1,15), rep(2,15)),
levels = c(1,2),
labels = c("Mujer", "Hombre")),
Tratamiento = sample(c("A", "B", "C"), size = n, replace = TRUE, prob = c(0.5, 0.3, 0.2)),
Peso_kg = c(round(rnorm(15, 65, 9)), round(rnorm(15, 75, 12))),
Altura_cm = c(round(rnorm(15, 162, 10)), round(rnorm(15, 175, 8)))
)
dataset
## ID Edad Genero Tratamiento Peso_kg Altura_cm
## 1 1 36 Mujer B 55 172
## 2 2 38 Mujer A 61 159
## 3 3 52 Mujer A 61 150
## 4 4 41 Mujer A 72 164
## 5 5 41 Mujer C 64 161
## 6 6 54 Mujer A 67 162
## 7 7 44 Mujer C 65 166
## 8 8 30 Mujer C 65 158
## 9 9 35 Mujer B 77 168
## 10 10 36 Mujer A 63 160
## 11 11 50 Mujer B 79 165
## 12 12 43 Mujer B 51 173
## 13 13 43 Mujer B 70 166
## 14 14 41 Mujer A 66 159
## 15 15 36 Mujer A 67 173
## 16 16 68 Hombre A 80 183
## 17 17 55 Hombre A 69 179
## 18 18 30 Hombre B 71 177
## 19 19 57 Hombre A 63 170
## 20 20 45 Hombre A 62 186
## 21 21 39 Hombre A 79 170
## 22 22 48 Hombre B 80 192
## 23 23 40 Hombre A 76 187
## 24 24 43 Hombre B 86 173
## 25 25 44 Hombre A 100 167
## 26 26 33 Hombre A 69 169
## 27 27 58 Hombre C 47 177
## 28 28 52 Hombre C 87 173
## 29 29 39 Hombre C 66 172
## 30 30 63 Hombre A 67 167
B) Buscad información de vuestro conjunto de datos y de vuestras variables
summary(dataset)
## ID Edad Genero Tratamiento
## Min. : 1.00 Min. :30.00 Mujer :15 Length:30
## 1st Qu.: 8.25 1st Qu.:38.25 Hombre:15 Class :character
## Median :15.50 Median :43.00 Mode :character
## Mean :15.50 Mean :44.47
## 3rd Qu.:22.75 3rd Qu.:51.50
## Max. :30.00 Max. :68.00
## Peso_kg Altura_cm
## Min. : 47.00 Min. :150.0
## 1st Qu.: 63.25 1st Qu.:164.2
## Median : 67.00 Median :169.5
## Mean : 69.50 Mean :169.9
## 3rd Qu.: 76.75 3rd Qu.:173.0
## Max. :100.00 Max. :192.0
plot(dataset)
C) Cread una nueva variable a partir de alguna de las que tengamos. Por ejemplo, podéis calcular el IMC (IMC = peso (kg)/ [estatura (m)]2 e incluid la nueva variable en el conjunto de datos.
dataset <- data.frame(dataset, IMC = dataset$Peso_kg/dataset$Altura_cm^2)
D) Cread dos data frames diferenciados para hombres y mujeres con dos nombres diferentes: Df_Hombres y Df_Mujeres.
dataset_hombre <- subset(dataset, dataset$Genero=="Hombre")
dataset_mujer <- subset(dataset, dataset$Genero=="Mujer")
E) Combinad de nuevo los dos ficheros anteriores y cread el primero de nuevo con el comando rbind().
dataset_combinado = rbind(dataset_mujer, dataset_hombre)
dataset_combinado
## ID Edad Genero Tratamiento Peso_kg Altura_cm IMC
## 1 1 36 Mujer B 55 172 0.001859113
## 2 2 38 Mujer A 61 159 0.002412879
## 3 3 52 Mujer A 61 150 0.002711111
## 4 4 41 Mujer A 72 164 0.002676978
## 5 5 41 Mujer C 64 161 0.002469041
## 6 6 54 Mujer A 67 162 0.002552964
## 7 7 44 Mujer C 65 166 0.002358833
## 8 8 30 Mujer C 65 158 0.002603749
## 9 9 35 Mujer B 77 168 0.002728175
## 10 10 36 Mujer A 63 160 0.002460938
## 11 11 50 Mujer B 79 165 0.002901745
## 12 12 43 Mujer B 51 173 0.001704033
## 13 13 43 Mujer B 70 166 0.002540282
## 14 14 41 Mujer A 66 159 0.002610656
## 15 15 36 Mujer A 67 173 0.002238631
## 16 16 68 Hombre A 80 183 0.002388844
## 17 17 55 Hombre A 69 179 0.002153491
## 18 18 30 Hombre B 71 177 0.002266271
## 19 19 57 Hombre A 63 170 0.002179931
## 20 20 45 Hombre A 62 186 0.001792115
## 21 21 39 Hombre A 79 170 0.002733564
## 22 22 48 Hombre B 80 192 0.002170139
## 23 23 40 Hombre A 76 187 0.002173354
## 24 24 43 Hombre B 86 173 0.002873467
## 25 25 44 Hombre A 100 167 0.003585643
## 26 26 33 Hombre A 69 169 0.002415882
## 27 27 58 Hombre C 47 177 0.001500207
## 28 28 52 Hombre C 87 173 0.002906880
## 29 29 39 Hombre C 66 172 0.002230936
## 30 30 63 Hombre A 67 167 0.002402381