DATA FRAME

INTRODUCCIÓN.

En el presente artículo realizaremos una serie de ejercicios con funciones y cálculos básicos en el tema de data frame, realizados por estudiantes de la Facultad de Ciencias Económicas, carrera de Estadística de la Universidad Central del Ecuador, estos programas nos será de ayuda para nuestro aprendizaje.

1er. DATA FRAME.

La tabla presenta la altura, en metros, de los árboles que se encuentran en 4 áreas de terreno.

  • a) Crear 4 vectores númericos, de tal forma que cada uno guarde la altura de los árboles de cada área de terreno.
Area1<- c(7.5, 12, 14.5, " ", " ", " ")
Area2<- c(12.5, 10.5, 13, 9, 18.5, " ")
Area3<- c(11, 8, 7.5, 9.5, 19, 14)
Area4<- c(12.5, 16, 9.5, 10, " ", " ")
  • b) Agrupar los 4 vectores generados, en una lista(estructura de datos)
#Agrupamos los 4 vectores en una lista.
arboles<-list(Area1,Area2, Area3, Area4)
#Convertimos la lista en un data frame.
arboles<-data.frame(Area1, Area2, Area3, Area4)
arboles
##   Area1 Area2 Area3 Area4
## 1   7.5  12.5  11.0  12.5
## 2    12  10.5   8.0    16
## 3  14.5    13   7.5   9.5
## 4           9   9.5    10
## 5        18.5  19.0      
## 6              14.0
  • c) Determinar, para cada área de terreno, si la altura del primer árbol es mayor a la del último árbol.

Area 1

arboles$Area1[1]>arboles$Area1[3]
## [1] TRUE

Area 2

arboles$Area2[1]>arboles$Area2[5]
## [1] FALSE

Area 3

arboles$Area3[1]>arboles$Area3[6]
## [1] FALSE

Area 4

arboles$Area4[1]>arboles$Area4[4]
## [1] TRUE
  • d) Determinar el logaritmo decimal de la altura del tercer árbol del área del terreno 3.
#Convertimos la variable Area3 a tipo númerico.
arboles$Area3<-as.numeric(arboles$Area3)
#Extraemos las alturas de los primeros 3 árboles.
arboles$Area3[3]
## [1] 7.5
#Calculamos su  algoritmo decimal.
log(arboles$Area3[3])
## [1] 2.014903
  • e) Determinar la suma de las alturas de los 3 primeros árboles del área de terreno 4.
#Convertimos la variable Area4 a tipo númerico.
arboles$Area4<-as.numeric(arboles$Area4)
#Extraemos las alturas de los 3 primeros árboles.
head(arboles$Area4, 3)
## [1] 12.5 16.0  9.5
#Sumamos las alturas.
sum(head(arboles$Area4, 3))
## [1] 38
  • f) Determinar la altura media de los árboles del área de terreno 1.
#Convertimos la variable Area1 a tipo númerico.
arboles$Area1<-as.numeric(arboles$Area1)
#Extraemoslas alturas de los árboles del área del terreno 1.
arboles$Area1[1:3]
## [1]  7.5 12.0 14.5
#Calculamos su media.
mean(arboles$Area1[1:3])
## [1] 11.33333

2do. DATA FRAME.

La tabla recopila información de 5 pacientes (sexo, presión arterial y pulsos por minuto), atendidos en un hospital.

  • a) Elaborar un archivo de tipo texto (txt) que contenga los datos de la tabla anterior. Utilizar el tabulador para separar estos datos respecto de cada variable. Por favor, guardar este archivo en el escritorio de windows y llamarlo hospital.txt
"C:/Users/USER/Desktop/UCE/TERCERO/PROGRAMACION/TALLERES/TALLER#08/hospital.txt"
## [1] "C:/Users/USER/Desktop/UCE/TERCERO/PROGRAMACION/TALLERES/TALLER#08/hospital.txt"
  • b) Desde R leer el archivo antes mencionado y almacenar su contenido en una variable llamada datos.
datos <- data.frame(read.table(file = "hospital.txt", header = TRUE, sep = "\t"))
names(datos)<-c("Sexo", "Presión arterial","Pulso x min")
datos
##     Sexo Presión arterial Pulso x min
## 1 Hombre              119          59
## 2  Mujer               99          89
## 3 Hombre              102         107
## 4 Hombre               78          76
## 5  Mujer               78          91
  • c) Visualizar los valores para las 3 variables para el primer individuo y el cuarto individuo.
datos[c(1,4),c("Sexo", "Presión arterial", "Pulso x min")]
##     Sexo Presión arterial Pulso x min
## 1 Hombre              119          59
## 4 Hombre               78          76
#OTRA FORMA:
datos[c(1,4), ]
##     Sexo Presión arterial Pulso x min
## 1 Hombre              119          59
## 4 Hombre               78          76
  • d) Determine si la primera mujer (posición 2) tiene una presión arterial mayor que la segunda mujer (ubicada en la posición 5)
#Extraemos la presián arterial de la mujer de la posición 2.
datos$`Presión arterial`[2]
## [1] 99
#Extraemos la presián arterial de la mujer de la posición 5.
datos$`Presión arterial`[5]
## [1] 78
#Realizamos la proposición.
datos$`Presión arterial`[2] > datos$`Presión arterial`[5]
## [1] TRUE
  • e) Determinar la media del pulso de los hombres.
datos[c(1,3,4),3]
## [1]  59 107  76
mean(datos[c(1,3,4),3])
## [1] 80.66667
#OTRA FORMA
datos$`Pulso x min`[c(1,3,4)]
## [1]  59 107  76
mean(datos$`Pulso x min`[c(1,3,4)])
## [1] 80.66667
  • f) Calcular la raíz cuadrada de la presión arterial del cuarto paciente.
datos$`Presión arterial`[4]
## [1] 78
sqrt(datos$`Presión arterial`[4])
## [1] 8.831761