Curso básico de R

2 Operaciones sobre dataframes

CC

DataIntelligence
fecha: 27-10-2021

1 Dataframes.

El texto original en inglés está aquí y cubre los aspectos más esenciales del trabajo con R sobre dataframes:

https://www.r-exercises.com/tag/dataframes/

Las respuestas están en el misma página pero en un primer esfuerzo intentar no ocuparlas.

Crea un Rpubs con las respuestas por favor y se la envías a Patricio que necesita ver el estado de avance.

Cualquier duda me preguntas, pero luego de agotar una rápida búsqueda en google por favor.


1.1 Parte I:

Ejercicio 1 Cree el siguiente marco de datos, luego invierta el sexo para todos los individuos.

Ejercicio 2 Cree este marco de datos (asegúrese de importar la variable Trabajando como carácter y no como factor).

Agregue este marco de datos en columnas al anterior.
a) ¿Cuántas filas y columnas tiene el nuevo marco de datos?
b) ¿Qué clase de datos hay en cada columna?

Ejercicio 3 Compruebe qué clase de datos es el (conjunto de datos integrado) state.center y conviértalo en un marco de datos.

Ejercicio 4 Cree un marco de datos simple a partir de 3 vectores. Ordene todo el marco de datos por la primera columna.

Ejercicio 5 Cree un marco de datos a partir de una matriz de su elección, cambie los nombres de fila para que cada fila diga id_i (donde i es el número de fila) y cambie los nombres de columna a variable_i (donde i es el número de columna). Es decir, para la columna 1 dirá variable_1, y para la fila 2 dirá id_2 y así sucesivamente.

Ejercicio 6 Para este ejercicio, usaremos el conjunto de datos (integrado) VADeaths.

  1. Asegúrese de que el objeto sea un marco de datos, si no, cámbielo a un marco de datos.
  2. Cree una nueva variable, denominada Total, que es la suma de cada fila.
  3. Cambie el orden de las columnas para que el total sea la primera variable.

Ejercicio 7 Para este ejercicio, usaremos el conjunto de datos (integrado) state.x77.

  1. Asegúrese de que el objeto sea un marco de datos, si no, cámbielo a un marco de datos.
  2. Averigüe cuántos estados tienen ingresos inferiores a 4300.
  3. Averigüe cuál es el estado con mayores ingresos.

Ejercicio 8 Con el conjunto de datos suizo, cree un marco de datos de solo las filas 1, 2, 3, 10, 11, 12 y 13, y solo las variables Examen, Educación y Mortalidad infantil.
a) La mortalidad infantil de Sarine está mal, debería ser una NA, cámbiala.
b) Cree una fila que será la suma total de la columna, asígnele el nombre Total.
c) Cree una nueva variable que será la proporción de Examen (Examen / Total)

Ejercicio 9 Cree un marco de datos con los conjuntos de datos state.abb, state.area, state.division, state.name, state.region. Los nombres de las filas deben ser los nombres de los estados.

  1. Cambie el nombre de los nombres de las columnas de modo que solo aparezcan las primeras 3 letras después del punto final (por ejemplo, States.abb será abb).

Ejercicio 10
Agregue el marco de datos anterior en columnas a state.x77
a) Elimina la variable div.
b) También elimine las variables Life Exp, HS Grad, Frost, abb y are.
c) Agregar una variable al marco de datos que debe categorizar el nivel de analfabetismo: [0,1) es bajo, [1,2) es algo, [2, inf) es alto.
d) Averigüe qué estado del oeste, con bajo analfabetismo, tiene los ingresos más altos y cuáles son esos ingresos.


1.2 Parte II:

Ejercicio 1

Considere dos vectores:
x = seq (1,43, junto con = Id)
y = seq (-20,0, junto con = Id)
Cree un data.frame df:

Ejercicio 2

Desde el marco de datos anterior df. Crea este marco de datos:

Id x.a y.a x.b y.b x.c y.c
1 1 1,00000 -20,000000 4,818182 -18,181818 8,636364 -16,363636
4 2 12.45455 -14.545455 16.272727 -12.727273 20.090909 -10.909091
7 3 23.90909 -9.090909 27.727273 -7.272727 31.545455 -5.454545
10 4 35,36364 -3,636364 39,181818 -1,818182 43,000000 0,000000

Ejercicio 3

Cree dos marcos de datos df1 y df2:

df1
Id Edad
1 1 14
2 2 12
3 3 15
4 4 10

df2
Id Código de sexo
1 1 F a
2 2 M b
3 3 M c
4 4 F d

Desde df1 y df2 crea M:

M
Id Edad Sexo Código
1 1 14 F a
2 2 12 M b
3 3 15 M c
4 4 10 F d

Ejercicio 4

Cree un marco de datos df3:

df3
puntuación id2
1 4 100
2 3 98
3 2 94
4 1 99

De M y df3 cree N:

Id Edad Puntuación del código de sexo
1 1 14 F a 99
2 2 12 M b 94
3 3 15 M c 98
4 4 10 F d 100

Ejercicio 5

Considere el marco de datos anterior N:
1) Eliminar las variables Sexo y Código
2) Desde N, cree un marco de datos:

valores ind

1 1 Identificación
2 2 Identificación
3 3 Identificación
4 4 Identificación
5 14 Edad
6 12 años
7 15 años
8 10 Edad
9 99 puntaje
10 94 puntaje
11 98 puntaje
12100 puntaje

Ejercicio 6

Para este ejercicio, usaremos los árboles de conjuntos de datos (integrados). a) Asegúrese de que el objeto sea un marco de datos, si no, cámbielo a un marco de datos. b) Cree un nuevo marco de datos A:

A
circunferencia Volumen altura
mean_tree 13.24839 76 30.17097
árbol_mín 8.30000 63 10.20000
max_tree 20.60000 87 77.00000
suma_árbol 410.70000 2356935.30000

Ejercicio 7

Considere el marco de datos A:
1) Ordene todo el marco de datos por la primera columna.
2) Cambie el nombre de los nombres de las filas de la siguiente manera: mean, min, max, tree

Ejercicio 8

Cree un marco de datos vacío con tipos de columna:

df
Ints Logicals Doubles Characters
(or 0-length row.names)

Ejercicio 9

Crea un marco de datos XY

X = c (1,2,3,1,4,5,2)
Y = c (0,3,2,0,5,9,3)
> XY
X Y
1 1 0
2 2 3
3 3 2
4 1 0
5 4 5
6 5 9
7 2 3

  1. analiza los elementos duplicados utilizando una función R proporcionada.
  2. mantiene solo las líneas únicas en XY usando una función R proporcionada.

Ejercicio 10 Para este ejercicio, usaremos el conjunto de datos (integrado) Titanic.
a) Asegúrese de que el objeto sea un marco de datos, si no, cámbielo a un marco de datos.
b) Defina un marco de datos con el valor 1st en la variable de clase y el valor NO en la variable de supervivencia y variables Sexo, Edad y Frecuencia.

Sex Age Freq
1 niño varón 0
5 Niña 0
9 Masculino Adulto 118
13 Mujer adulta 4


2 Los datasets por defecto en R:

https://stat.ethz.ch/R-manual/R-devel/library/datasets/html/00Index.html

Solo se llaman:

Agrandar