EJERCICIOS DATAFRAME EN R

En el presente informe encontrará ejercicios utilizando dataframe.

Ejercicio 1

La tabla presenta la altura, en metros, de los arboles que se encuentran en 4 áreas de terreno.


a) Crear 4 vectores numéricos, de tal forma que cada uno guarde la altura de los arboles de cada área de terreno.

Paso 1: Creamos 4 vectores llamados Area1, Area2, Area3 y Area4 que contendrán la altura de los árboles de cada área.

Area1 <- c(7.5,12,14.5,NA,NA,NA)
Area1
## [1]  7.5 12.0 14.5   NA   NA   NA
Area2 <- c(12.5,10.5,13,9,18.5,NA)
Area2
## [1] 12.5 10.5 13.0  9.0 18.5   NA
Area3 <- c(11,8,7.5,9.5,19,14)
Area3
## [1] 11.0  8.0  7.5  9.5 19.0 14.0
Area4 <- c(12.5,16,9.5,10,NA,NA)
Area4
## [1] 12.5 16.0  9.5 10.0   NA   NA

b) Agrupar los 4 vectores generados, en una lista (estructura de datos).

Paso 2: Usaremos la funcion list() para unir los vectores creados dentro de una lista.

Areas <- list(Area1,Area2,Area3,Area4)

Paso 3: Usaremos names() para presentar los vectores con una mejor estructura.Y crearemos un dataframe llamado Areas con los vectores anteriormente creados y presentamos.

names(Areas) <- c("Area 1","Area 2","Area 3","Area 4")
Areas <- data.frame(Area1,Area2,Area3,Area4)
Areas
##   Area1 Area2 Area3 Area4
## 1   7.5  12.5  11.0  12.5
## 2  12.0  10.5   8.0  16.0
## 3  14.5  13.0   7.5   9.5
## 4    NA   9.0   9.5  10.0
## 5    NA  18.5  19.0    NA
## 6    NA    NA  14.0    NA

c) Determinar, para cada area de terreno, si la altura del primer arbol es mayor a la del último árbol.

Paso 1: Usaremos los corchetes [] para especificar los datos que buscamos en la lista y también requeriremos de la funcion max() para identificar cual valor es mayor de cada área.

#Area 1
Areas[[1]][[1]]
## [1] 7.5
Areas[[1]][[3]]
## [1] 14.5
max(Areas[[1]][[1]],Areas[[1]][[3]])
## [1] 14.5
#Area 2
Areas[[2]][[1]]
## [1] 12.5
Areas[[2]][[5]]
## [1] 18.5
max(Areas[[2]][[1]],Areas[[2]][[5]])
## [1] 18.5
#Area 3
Areas[[3]][[1]]
## [1] 11
Areas[[3]][[6]]
## [1] 14
max(Areas[[3]][[1]],Areas[[3]][[6]])
## [1] 14
#Area 4
Areas[[4]][[1]]
## [1] 12.5
Areas[[4]][[4]]
## [1] 10
max(Areas[[4]][[1]],Areas[[4]][[4]])
## [1] 12.5

____________________________________________________________________

Ejercicio 2

La tabla recopila información de 5 pacientes (sexo, presión arterial y pulsos por minuto), atendidos en un hospital.

Sexo Presión Arterial Pulso x min
Hombre 119 59
Mujer 99 89
Hombre 102 107
Hombre 78 76
Mujer 78 91

Calcular:

a) Elaborar un archivo de tipo texto (txt) que contenga los datos de la tabla anterior. Utilizar el tabulador para separar estos datos respecto de cada variable. Por favor, guardar este archivo en el escritorio de windows y llamarlo hospital.txt.

Paso 1: Creamos el archivo hospital en txt.


b) Desde R leer el archivo antes mencionado y almacenar su contenido en una variable llamado datos.

Paso 2: Importamos el archivo que creamos anteriormente a R, para ello utilizamos la función file.choose, la cual nos devuelve la ruta del archivo en la consola,la copiamos y la asignamos a una variable datos.

file.choose()
## [1] "C:\\Users\\hp\\Documents\\HOSPITAL.txt"
datos <- read.delim("C:\\Users\\hp\\Documents\\HOSPITAL.txt",header = FALSE, sep = "", dec =".")
datos
##       V1  V2  V3
## 1 Hombre 119  59
## 2  Mujer  99  89
## 3 Hombre 102 107
## 4 Hombre  78  76
## 5  Mujer  78  91

Con la función names le colocamos los respectivos nombres a cada variable.

names(datos) <- c("Sexo","Presión Arterial","Pulso x min")
datos
##     Sexo Presión Arterial Pulso x min
## 1 Hombre              119          59
## 2  Mujer               99          89
## 3 Hombre              102         107
## 4 Hombre               78          76
## 5  Mujer               78          91

c) Visualizar los valores para las 3 variables para el primer individuo y el cuarto individuo.

Paso 3: Concatenamos dos vectores indicando lo que queremos mostrar en pantalla, siendo el primero las filas y el segundo las columnas.

datos[c(1,4),c(1,2,3)]
##     Sexo Presión Arterial Pulso x min
## 1 Hombre              119          59
## 4 Hombre               78          76

d) Determine si la primera mujer (posision 2) tiene una presion arterial mayor que la seguna mujer (ubicada en en la misma posicion 5 )

Paso 1: Seleccionamos cada una de la ubicación de nuestras variables a ser comparadas en la cual se determinará cual es mayor.

datos[[2]][[2]] > datos[[2]][[5]]
## [1] TRUE

e) Determinar la media del pulso de los Hombres

Paso 1: Creamos 3 variables las cuales representan a los hombres, utilizamos a su vez el comando PRINT.

x<-print(datos[[3]][1])
## [1] 59
y<-print(datos[[3]][3])
## [1] 107
z<-print(datos[[3]][4])
## [1] 76

Paso 2: Procedemos a almacenar las 3 variables en una sola de nombre “hombres”.

hombres<-c(x,y,z)

Paso 3: Utilizamos el comando Mean para obtener la media de nuestras variables.

mean(hombres,na.rm = TRUE)
## [1] 80.66667

f) Calcular la raiz cuadrada de la presion arterial del cuarto paciente

Paso 1: Definimos las posiciones de nuestros datos de fila y columna utilizamos el comando Sqrt para obtener la raíz cuadrada de la presión arterial.

sqrt(datos[[2]][[4]])
## [1] 8.831761