UNIVERSIDAD CENTRAL DEL ECUADOR

Facultad de Ciencias Económicas

Carrera de Estadística

Autores: Fernanda Chipantaxi, Ayleen Rubio, Marlon Llugsha, Cristhian Diaz

Fecha: 15-07-2022

Colaborador: Ing. Francisco Valverde, PHD en informática

EJERCICIOS SOBRE DATA FRAMES EN R

Resolver los siguientes ejercicios:

EJERCICIO 1

La tabla presenta la altura, en metros, de los arboles que se encuentran en 4 áreas del terreno.
a) Crear los 4 vectores numéricos, de tal forma que cada uno guarde la altura de los arboles de cada área de terreno.

Paso 1: Asignamos a Area1, la función c para crear un vector que contenga la altura de los arboles de la primera área de terreno y ejecutamos.

Area1 <- c(7.5,12,14.5)
Area1
## [1]  7.5 12.0 14.5

Paso 2: Asignamos a Area2, la función c para crear un vector que contenga la altura de los arboles de la segunda área de terreno y ejecutamos.

Area2 <- c(12.5,10.5,13,9,18.5)
Area2
## [1] 12.5 10.5 13.0  9.0 18.5

Paso 3: Asignamos a Area3, la función c para crear un vector que contenga la altura de los arboles de la tercera área de terreno.

Area1 <- c(7.5,12,14.5)
Area2 <- c(12.5,10.5,13,9,18.5)
Area3 <- c(11,8,7.5,9.5,19,14)
Area4 <- c(12.5,16,9.5,10)

Paso 4: Asignamos a Area1, la función c para crear un vector que contenga la altura de los arboles de la cuarta área de terreno.

Area4 <- c(12.5,16,9.5,10)
Area4
## [1] 12.5 16.0  9.5 10.0
b) Agrupar los 4 vectores generado, en una lista(estructura de datos).

Paso 1: Asignamos a Altura_terre, la función list para crear una lista que contenga los vectores de las cuatro areas de terreno creadas anteriormente y ejecutamos.

Altura_terre<-list(Area1 <- c(7.5,12,14.5),
                   Area2 <- c(12.5,10.5,13,9,18.5),
                   Area3 <- c(11,8,7.5,9.5,19,14),
                   Area4 <- c(12.5,16,9.5,10))
Altura_terre
## [[1]]
## [1]  7.5 12.0 14.5
## 
## [[2]]
## [1] 12.5 10.5 13.0  9.0 18.5
## 
## [[3]]
## [1] 11.0  8.0  7.5  9.5 19.0 14.0
## 
## [[4]]
## [1] 12.5 16.0  9.5 10.0
c) Determinar, para cada área del terreno, si la altura del primer árbol es mayor a la del último árbol.

Paso 1: Para determinar de la primera área del terreno, si la altura del primer árbol es mayor a la del último árbol escogemos la lista creada anteriormente llamada Altura_terr, selecionamos con el símbolo de dólar la columna perteneciente al Area1 y usando corchetes seleccionamos la posición de la altura del primer árbol. En la misma línea de código utilizamos el símobolo mayor que >, escogemos la misma lista y con el simbolo de dólar seleccionamos la misma columna perteneciente al Area1, usando corchetes seleccionamos la posición del último árbol, y por último ejecutamos.

Altura_terre$Area1[1] > Altura_terre$Area1[3]
## logical(0)

Paso 2: Para determinar de la segunda área del terreno, si la altura del primer árbol es mayor a la del último árbol escogemos la lista llamada Altura_terr, selecionamos con el símbolo de dólar la columna perteneciente al Area2 y usando corchetes seleccionamos la posición de la altura del primer árbol. En la misma línea de código utilizamos el símbolo mayor que >, escogemos la misma lista y con el simbolo de dólar seleccionamos la misma columna perteneciente al Area2, usando corchetes seleccionamos la posición del último árbol, y por último ejecutamos.

Altura_terre$Area2[1] > Altura_terre$Area2[5]
## logical(0)

Paso 3: Para determinar de la tercera área del terreno, si la altura del primer árbol es mayor a la del último árbol escogemos la lista llamada Altura_terr, selecionamos con el símbolo de dólar la columna perteneciente al Area3 y usando corchetes seleccionamos la posición de la altura del primer árbol. En la misma línea de código utilizamos el símbolo mayor que >, escogemos la misma lista y con el simbolo de dólar seleccionamos la misma columna perteneciente al Area3, usando corchetes seleccionamos la posición del último árbol, y por último ejecutamos.

Altura_terre$Area3[1] > Altura_terre$Area3[6]
## logical(0)

Paso 4: Para determinar de la cuarta área de terreno, si la altura del primer árbol es mayor a la del último árbol escogemos la lista llamada Altura_terr, selecionamos con el símbolo de dólar la columna perteneciente al Area4 y usando corchetes seleccionamos la posición de la altura del primer árbol. En la misma línea de código utilizamos el símbolo mayor que >, escogemos la misma lista y con el simbolo de dólar seleccionamos la misma columna perteneciente al Area4, usando corchetes seleccionamos la posición del último árbol, y por último ejecutamos.

Altura_terre$Area4[1] > Altura_terre$Area4[4]
## logical(0)
d) Determinar el logaritmo decimal de la altura del tercer árbol del área de terreno 3.

Paso 1: Asignamos a log_natural, la función log10 para sacar el logaritmo decimal de la altura del tercer árbol del área de terreno 3, seguido de esta función asignamos dentro de unos parentesis la lista llamada Altura_terre, donde seleccionaremos la posición de la columna del Area3 con ayuda de los dobles corhcetes, y seguido de está, usamos nuevamente corchetes para seleccionar la posición en la que se encuentra el tercer árbol. Por último ejecutamos.

log_natural<-log10(Altura_terre[[3]][3])
log_natural
## [1] 0.8750613
e) Determinar la suma de las alturas de los 3 primeros arboles del área del terreno 4.

Paso 1: Utilizamos la función sum para realizar la suma de las alturas de los tres primeros arboles del área del terreno 4. Dentro de la función escogemos la lista llamada Altura_terre y con ayuda del simbolo de dólar seleccionamos la columna del Area4, luego usamos corchetes para escoger las alturas de los tres primeros arboles. Por último ejecutamos.

sum(Altura_terre$Area4[1:3])
## [1] 0
f) Determinar la altura media de los arboles del área del terreno 1.

Paso 1: Asignamos a Altura_Area1, la función mean para determinar la altura media de los arboles del área del terreno 1. Dentro de la función escogemos la lista llamada Altura_terre y con ayuda del simbolo de dólar seleccionamos la columna del Area1. Por último ejecutamos.

Altura_Area1 <- mean(Altura_terre$Area1)
## Warning in mean.default(Altura_terre$Area1): argument is not numeric or logical:
## returning NA
Altura_Area1
## [1] NA

EJERCICIO 2

La tabla recopila información de 5 pacientes (sexo, presión arterial y pulsos por minuto) atendidos en un hospital.

a) Elaborar un archivo tipo (txt) que contenga datos de la tabla anterior. Utilizar el tabulador para separar estos datos respecto de cada variable. Por favor guardar este archivo en el escritorio de windows y llamarlo hospital.txt.
b) Desde R leer el archivo antes mencionado y almacenar su contenido en una variable llamado datos.

Paso 1: Usamos el comando library para utilizar las funciones que contiene el paquete readr.

library(readr)

Paso 2: Asignamos a DATOS, la función read_delim para leer el archivo de tipo txt con la información de los 5 pacientes atentidos en un hospital. Dentro de la función agregamo el url donde se encuentra guardado el archivo dentro de su windows. Delimitamos las variables delim como escape_double como FALSE* y trim_ws como TRUE. Por último ejecutamos.

DATOS <- read_delim("C:/Users/Usuario/Downloads/Hospital2.txt", 
                        delim = "\t", escape_double = FALSE, 
                        trim_ws = TRUE)
## Rows: 5 Columns: 3
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: "\t"
## chr (1): Sexo
## dbl (2): Presion_Arterial, Pulso_X_min
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
DATOS
## # A tibble: 5 × 3
##   Sexo   Presion_Arterial Pulso_X_min
##   <chr>             <dbl>       <dbl>
## 1 Hombre              119          59
## 2 Mujer                99          89
## 3 Hombre              102         107
## 4 Hombre               78          76
## 5 Mujer                78          91
c) Visualizar los valores para las 3 variables para el primer individuo y para el cuarto individuo.

Paso 1: Asignamos a DATOS, la posicion 1 del primer individuo dejando una coma con un espacio para tomar solo los datos de la fila del primer individuo, esto realizado dentro de unos corchetes y ejecutamos.

DATOS[1, ]
## # A tibble: 1 × 3
##   Sexo   Presion_Arterial Pulso_X_min
##   <chr>             <dbl>       <dbl>
## 1 Hombre              119          59

Paso 2: Asignamos a DATOS, la posicion 4 del cuarto individuo dejando una coma con un espacio para tomar solo los datos de la fila del cuarto individuo, esto realizado dentro de unos corchetes y ejecutamos.

DATOS[4, ]
## # A tibble: 1 × 3
##   Sexo   Presion_Arterial Pulso_X_min
##   <chr>             <dbl>       <dbl>
## 1 Hombre               78          76
d) Determine si la primera mujer(posición 2) tiene una presión arterial mayor que la segunda mujer(Posición 5).

Paso 1: Para determinar si la primera mujer(posición 2) tiene una presión arterial mayor que la segunda mujer(Posición 5) escogemos la variable DATO, selecionamos con el símbolo de dólar la columna perteneciente a la Presion_Arterial y usando corchetes seleccionamos la posición de la primer mujer. En la misma línea de código utilizamos el símobolo mayor que >, escogemos la misma variable DATO y con el simbolo de dólar seleccionamos la misma columna perteneciente a la Presion_Arterial, usando corchetes seleccionamos la posición de la segunda mujer, y por último ejecutamos.

DATOS$Presion_Arterial[2]>DATOS$Presion_Arterial[5]
## [1] TRUE
e) Determinar la media del pulso de los hombres.

Para realizar el siguiente ejercicio, crearemos tres variables que nos ayudarán a determinar la media del pulso de los hombres:

Paso 1: Primero asignamos a “a”, la función print para imprimir un argumento, en este caso para escoger el dato del pulso del primer hombre. Para escoger la posición correcta dentro de la tabla utilizamos la variable DATO, que con ayuda de doble corchete escogemos la posición en la que se encuentra el pulso, seguido de un corchete para ingresar la posición del primer hombre y ejecutamos.

a<-print(DATOS[[3]][1])
## [1] 59
a 
## [1] 59

Paso 2: Segundo asignamos a “b”, la función print para imprimir un argumento, en este caso para escoger el dato del pulso del segundo hombre. Para escoger la posición correcta dentro de la tabla utilizamos la variable DATO, que con ayuda de doble corchete escogemos la posición en la que se encuentra el pulso, seguido de un corchete para ingresar la posición del segundo hombre y ejecutamos.

b<-print(DATOS[[3]][3])
## [1] 107
b
## [1] 107

Paso 3: Tercero asignamos a “c”, la función print para imprimir un argumento, en este caso para escoger el dato del pulso del tercer hombre. Para escoger la posición correcta dentro de la tabla utilizamos la variable DATO, que con ayuda de doble corchete escogemos la posición en la que se encuentra el pulso, seguido de un corchete para ingresar la posición del tercer hombre y ejecutamos.

c<-print(DATOS[[3]][4])
## [1] 76
c
## [1] 76

Paso 4: Una vez creadas nuestras variables, asignamos a hombres, la función c para crear un vector que contengan las tres variables y ejecutamos.

hombres<-c(a,b,c)

Paso 5: Por último, utilizamos la función mean para sacar la media de la variable hombres que contiene el pulso de los hombres y ejecutamos.

mean(hombres)
## [1] 80.66667
f) Calcular la raíz cuadrada de la presión arterial del cuarto paciente.

Paso 1: Para este ejercicio, utilizamos la función sqrt para calcular la raíz cuadrada de la presión arterial del cuarto paciente. Dentro de la función escogemos la variable DATO, selecionamos con el símbolo de dólar la columna perteneciente a la Presion_Arterial y usando corchetes seleccionamos la posición del cuarto paciente. Por último ejecutamos.

sqrt(DATOS$Presion_Arterial[4])
## [1] 8.831761