Marzo, 2024

Quien cuenta historias, domina el mundo

Proverbio Hopi

Campo Hopi

Un efecto especial es una herramienta, un medio para contar una historia. Un efecto especial sin una historia es algo bastante aburrido

George Lucas

Contenido

  • Sobre el Software
    • Que es R
    • Que es GIT
    • Directorios de Trabajo
    • Paquetes
    • Ayuda

Contenido

  • Como utilizar R
    • Operadores
    • Objetos
    • Indexacion
    • Generacion de Datos
    • Graficos
    • Tidyverse
  • Practica

Como trabajar

Que es R?

R es un lenguaje de programación y un entorno de software diseñado específicamente para estadísticas y análisis de datos. Fue desarrollado por Ross Ihaka y Robert Gentleman en la Universidad de Auckland, Nueva Zelanda, en la década de 1990. Desde entonces, R se ha convertido en uno de los lenguajes más populares en el ámbito de la estadística y la ciencia de datos

Características Clave

  1. Estadísticas y Análisis de Datos: R es potente para realizar análisis estadísticos y exploración de datos, se pueden realizar tareas como regresión, análisis de varianza, machine learning, y más.

  2. Gráficos: R tiene excelentes capacidades para la visualización de datos. Puedes crear una variedad de gráficos de alta calidad para explorar y comunicar patrones en los datos.

  3. Comunidad y Paquetes: R tiene una comunidad activa de usuarios y desarrolladores. Además, cuenta con un extenso sistema de paquetes que amplían sus capacidades.

  4. Investigación Académica y Empresarial: R se utiliza en entornos académicos, de investigación y empresariales

  5. Integración con Otros Lenguajes y Herramientas: R se puede integrar con otros lenguajes de programación como C, C++, y Python.

Que es GIT?

Git es un sistema de control de versiones distribuido ampliamente utilizado. Fue creado por Linus Torvalds en 2005 y se ha convertido en una herramienta esencial para el desarrollo de software colaborativo.

Beneficios de Git:

  1. Trabajo Colaborativo: Git permite a varios desarrolladores trabajar en un proyecto simultáneamente sin temor a conflictos. Cada desarrollador puede trabajar en su propia rama y fusionar los cambios de manera eficiente.

  2. Historial y Auditoría: El historial completo de cambios en un proyecto proporciona una trazabilidad clara y facilita la identificación de errores o problemas.

  3. Ramificación: La capacidad de crear ramas fácilmente facilita el desarrollo de nuevas características y la corrección de errores sin afectar la rama principal del proyecto.

  4. Flexibilidad: Git es flexible y se adapta a diversos flujos de trabajo, pequeños o grandes

  5. Respaldo y Recuperación: La distribución y duplicación de repositorios proporciona una forma robusta de respaldar y recuperar proyectos en caso de fallos.

Crear usuario en GIT

Instalacion de R & GIT

Instalacion de R & GIT

macOS:

1. R:

  • Puedes instalar R usando Homebrew con el siguiente comando en la terminal: bash brew install r

2. Git:

  • Puedes instalar Git usando Homebrew con el siguiente comando en la terminal: bash brew install git

Patalla de R

Directorios de trabajo

y comentarios

En R, el directorio de trabajo es el lugar en el sistema de archivos donde R buscará y guardará archivos por defecto.

Comentarios: Proporciona información adicional sobre el propósito o funcionamiento del código #

###### Directorios de trabajo
#setwd("~/Users/lio/Git/Intro_R_2023")  #Mac
getwd() #Donde estamos trabajando?
## [1] "/Users/lio/Git/Intro_R_2023"
# Comentarios
# comentario

Paquetes

Los “paquetes” son un conjuntos de herramientas, funciones y datos que extienden la funcionalidad básica del lenguaje.

Paquetes

Los paquetes no se instalan automáticamente con R. Para utilizar un paquete, primero debes instalarlo.

Una vez instalado, debes cargar un paquete en tu sesión de R para poder utilizar sus funciones.

#install.packages("tidyverse")
#install.packages("dplyr")
library(tidyverse)
library(dplyr) 
#update.packages() #actualiza todos los paquetes que tengas instalados

¿Por qué debemos instalar los paquetes?

Ayuda

En R, el signo de interrogación (?) se utiliza para acceder a la documentación de una función o de un paquete. Al colocar el signo de interrogación seguido del nombre de una función o paquete y ejecutar esa línea de código, R abrirá la documentación correspondiente en la ventana de ayuda.

?print()
?lm #Busqueda Simple
??lm #Busqueda Amplia 

Tipos básicos de datos:

  • character: Almacena cadenas de caracteres, como letras, palabras o frases. Ejemplo: “Hola mundo”.
  • numeric: Almacena números reales, incluyendo decimales. Ejemplo: 3.14.
  • integer: Almacena números enteros. Ejemplo: 5.
  • complex: Almacena números complejos, que tienen una parte real y una parte imaginaria. Ejemplo: 1+2i.
  • logical: Almacena valores booleanos, que pueden ser TRUE o FALSE. Ejemplo: TRUE.
  • date: Almacena fechas. Ejemplo: as.Date(“2023-12-01”).

Operadores

Los operadores son símbolos o palabras clave que realizan operaciones en variables y valores.

  • Operadores de asignación:
  • Operadores aritméticos
  • Operadores de comparación
  • Operadores lógicos

Operadores

Operadores de asignación

  • Asignación de variables: <- o =
variable <- 42
variable
## [1] 42

Operadores

Operadores aritméticos

  • Suma: +
  • Resta: -
  • Multiplicación: *
  • División: /
  • Potenciación: ^ o **
  • Resto de la división entera: %%
  • Cociente de la división entera: %/%

Operadores

Operadores aritméticos

a <- 10
b <- 3
suma <- a + b
resta <- a - b
multiplicacion <- a * b
division <- a / b

print(suma)
## [1] 13
division
## [1] 3.333333

Operadores

Operadores de comparación

  • Igual a: ==
  • No igual a: !=
  • Menor que: <
  • Mayor que: >
  • Menor o igual que: <=
  • Mayor o igual que: >=
x <- 5
y <- 10
resultado <- x > y
print(resultado)
## [1] FALSE

Operadores

Operadores lógicos

  • AND lógico: &
  • OR lógico: |
  • NOT lógico: !
condicion1 <- TRUE
condicion2 <- FALSE
resultado <- condicion1 & condicion2
print(resultado)
## [1] FALSE

Funciones

Objetos

En el contexto de R, “objetos” se refiere a las estructuras de datos que almacenan información.

  • vector: Es una colección ordenada de objetos del mismo tipo. Ejemplo: c(1, 2, 3).
  • matrix: Es una matriz bidimensional de objetos del mismo tipo. Ejemplo: matrix(c(1, 2, 3, 4), nrow = 2, ncol = 2).
  • array: Es una matriz multidimensional de objetos del mismo tipo. Ejemplo: array(c(1, 2, 3, 4), dim = c(2, 2, 2)).
  • data.frame: Es una estructura de datos similar a una tabla, con filas y columnas. - Cada columna puede tener un tipo de dato diferente. Ejemplo: data.frame(x = c(1, 2, 3), y = c(“a”, “b”, “c”)).
  • list: Es una colección ordenada de objetos de cualquier tipo. Ejemplo: list(1, “a”, TRUE)

Objetos

## Recuerda que R es un lenguaje sensible a mayúsculas y minúsculas
(10 + 2) * 5
## [1] 60
x <- (10 + 2) * 5  # <- es equivalente a =
x <- NA
x <- c(8,9,10,12,14,10,13,10,9)

print(x)
## [1]  8  9 10 12 14 10 13 10  9

Objetos

Funciones

Objetos que contienen código ejecutable.

Informacion Aritmética Estadistica Orden
summary(x) min(x) sd(x) rev(x)
mode(x) max(x) var(x) unique(x)
length(x) log(x) median(x) sort(x)
range(x) sum(x) mean(x) rev(sort(x))

#¿Donde podemos encontrar más funciones?

Objetos

Vectores: Clase genérica que permite almacenar una colección de objetos del mismo tipo

  • Numericos: Almacenan números reales.
  • Enteros: Almacenan números enteros.
  • Lógicos: Almacenan valores booleanos (TRUE o FALSE).
  • Caracteres: Almacenan texto
# Ejemplos de vectores
numeric_vector <- c(1.5, 2.3, 4.0)
entero_vector <- c(1, 2, 3)
logico_vector <- c(TRUE, FALSE, TRUE)
caracteres_vector <- c("uno", "dos", "tres")

Objetos

Vectores

peso <- c(60, 72, 57, 90, 95, 72) 
altura <- c(1.75, 1.80, 1.65, 1.90, 1.74, 1.91)
imc <- peso/altura^2

print(imc)
## [1] 19.59184 22.22222 20.93664 24.93075 31.37799 19.73630

Objetos

Matrices: Arreglos bidimensionales de elementos del mismo tipo.

X <- matrix(c(1, 2, 3, 11, 12, 13), nrow=2, ncol=3, byrow=TRUE, 
            dimnames=list(c("fila1", "fila2"), c("C.1", "C.2", "C.3")))

X
##       C.1 C.2 C.3
## fila1   1   2   3
## fila2  11  12  13
X <- matrix(c(10, 10, 10, 10, 10, 10), nrow=2, ncol=3, byrow=TRUE, 
            dimnames=list(c("fila1", "fila2"), c("C.1", "C.2", "C.3")))

Objetos

Matrices

rownames(X) #nombre de filas
## [1] "fila1" "fila2"
colnames(X) #nombre de columnas
## [1] "C.1" "C.2" "C.3"
nrow(X) #Numero de filas
## [1] 2
ncol(X) #numero de columnas
## [1] 3
dim(X) #dimensiones
## [1] 2 3
t(X) #trasponer
##     fila1 fila2
## C.1    10    10
## C.2    10    10
## C.3    10    10

¿Por qué se muestra la segunda matriz y no la primera?

Objetos

Matrices

Manipulacion de Matrices

C.4 <- c(100, 1000) #crear vector para 4ta columna 
X1 <- cbind(X, C.4) #Agregar 4ta columna a X
fila3 <- c(10, 100, 1000) #crear fila 3
X2 <- rbind(X, fila3) #agregar fila 3 a X

X2
##       C.1 C.2  C.3
## fila1  10  10   10
## fila2  10  10   10
## fila3  10 100 1000

Objetos

Matrices

Manipulacion de Matrices

#Donde se fue la Columna 4 (C.4)?
X2 <- rbind(X, fila3) #agregar fila 3 a X
fila3 <- c(10, 100, 1000, 10000) #crear fila 3
X3 <- rbind(X1, fila3) #agregar fila 3 a X

X3
##       C.1 C.2  C.3   C.4
## fila1  10  10   10   100
## fila2  10  10   10  1000
## fila3  10 100 1000 10000

Objetos

Lista

Listas: Colecciones ordenadas de objetos de diferentes tipos.

## Lista (grupos de cualquier tipo de objeto R)

lista_ejemplo <- list(numeric_vector, entero_vector, logico_vector, caracteres_vector)


lista_ejemplo
## [[1]]
## [1] 1.5 2.3 4.0
## 
## [[2]]
## [1] 1 2 3
## 
## [[3]]
## [1]  TRUE FALSE  TRUE
## 
## [[4]]
## [1] "uno"  "dos"  "tres"
lista_ejemplo[[4]]
## [1] "uno"  "dos"  "tres"

Objetos

Data Frames

Estructuras de datos bidimensionales similares a las matrices, pero pueden contener columnas de diferentes tipos.

# Ejemplo de data frame
data_frame_ejemplo <- data.frame(
  Nombre = c("Juan", "Maria", "Carlos"),
  Edad = c(25, 30, 22),
  Casado = c(FALSE, TRUE, FALSE)
)
data_frame_ejemplo
##   Nombre Edad Casado
## 1   Juan   25  FALSE
## 2  Maria   30   TRUE
## 3 Carlos   22  FALSE

Objetos

Data Frames

Manipulacion de Datos

## Marco de datos (Data Frame)
data <- data.frame(alpha=1:3, 
                   beta=4:6, gamma=7:9)
names(data)[3] <- "tres"
data$tres <- NULL

# Reordenar marco de datos
data <- data.frame(id=1:3, peso=c(50, 90, 75), 
                   tamaño=c("pequeño", "grande", "mediano"))
data[c(1, 3, 2)]
##   id  tamaño peso
## 1  1 pequeño   50
## 2  2  grande   90
## 3  3 mediano   75
data[c("tamaño", "id", "peso")]
##    tamaño id peso
## 1 pequeño  1   50
## 2  grande  2   90
## 3 mediano  3   75

Objetos

Factores

Vectores que representan variables categóricas con niveles predefinidos.

x <- factor(c("alpha", "beta", "gamma", "alpha", "beta"))
levels(x) #Distintos Valores unicos que puede tomar un factor
## [1] "alpha" "beta"  "gamma"
levels(x)[levels(x)=="beta"] <- "dos" #cambiamos beta por dos
levels(x)[3] <- "tres"  #cambiamos el tercer nivel por tres
levels(x) <- c("uno", "dos", "tres") #cambiamos todos los niveles por el vector

Objetos

Manipulaciones

# Convertir objetos
data <- as.matrix(data) #Para convertir en Matriz

data
##      id  peso tamaño   
## [1,] "1" "50" "pequeño"
## [2,] "2" "90" "grande" 
## [3,] "3" "75" "mediano"

¿Que tipos de datos hay en la matriz?

Objetos

Manipulaciones

# Convertir objetos
data
##      id  peso tamaño   
## [1,] "1" "50" "pequeño"
## [2,] "2" "90" "grande" 
## [3,] "3" "75" "mediano"
data_1 <- as.numeric(data) 
## Warning: NAs introduced by coercion
#Para convertir en Matriz

data_1 
## [1]  1  2  3 50 90 75 NA NA NA
#Que paso con nuestros datos? 

Objetos

Manipulaciones

# Convertir objetos

typeof(data)
## [1] "character"
data[,3] <- c(1,3,2)

data
##      id  peso tamaño
## [1,] "1" "50" "1"   
## [2,] "2" "90" "3"   
## [3,] "3" "75" "2"
# Convertir toda la matriz a tipo numérico
data_numeric <- as.numeric(data)

# Remodelar la matriz a sus dimensiones originales
dim(data_numeric) <- dim(data)

data_numeric
##      [,1] [,2] [,3]
## [1,]    1   50    1
## [2,]    2   90    3
## [3,]    3   75    2

Objetos

Manipulaciones

x <- 1:20 #Creamos un Objeto
x[3] <- 100 #introducir 100 en el lugar 3

x
##  [1]   1   2 100   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18  19
## [20]  20
x[c(2, 4)] <- 111 #Introcir 111 en el lugar 2 y 4

x
##  [1]   1 111 100 111   5   6   7   8   9  10  11  12  13  14  15  16  17  18  19
## [20]  20
#Que tipo de objeto es x?

Indexacion

La indexación en R se refiere a la forma en que accedemos a elementos específicos en un objeto de datos, como vectores, matrices, listas o data frames.

https://rpubs.com/adiedrichs/basicIndexInR

iris
##     Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
## 1            5.1         3.5          1.4         0.2     setosa
## 2            4.9         3.0          1.4         0.2     setosa
## 3            4.7         3.2          1.3         0.2     setosa
## 4            4.6         3.1          1.5         0.2     setosa
## 5            5.0         3.6          1.4         0.2     setosa
## 6            5.4         3.9          1.7         0.4     setosa
## 7            4.6         3.4          1.4         0.3     setosa
## 8            5.0         3.4          1.5         0.2     setosa
## 9            4.4         2.9          1.4         0.2     setosa
## 10           4.9         3.1          1.5         0.1     setosa
## 11           5.4         3.7          1.5         0.2     setosa
## 12           4.8         3.4          1.6         0.2     setosa
## 13           4.8         3.0          1.4         0.1     setosa
## 14           4.3         3.0          1.1         0.1     setosa
## 15           5.8         4.0          1.2         0.2     setosa
## 16           5.7         4.4          1.5         0.4     setosa
## 17           5.4         3.9          1.3         0.4     setosa
## 18           5.1         3.5          1.4         0.3     setosa
## 19           5.7         3.8          1.7         0.3     setosa
## 20           5.1         3.8          1.5         0.3     setosa
## 21           5.4         3.4          1.7         0.2     setosa
## 22           5.1         3.7          1.5         0.4     setosa
## 23           4.6         3.6          1.0         0.2     setosa
## 24           5.1         3.3          1.7         0.5     setosa
## 25           4.8         3.4          1.9         0.2     setosa
## 26           5.0         3.0          1.6         0.2     setosa
## 27           5.0         3.4          1.6         0.4     setosa
## 28           5.2         3.5          1.5         0.2     setosa
## 29           5.2         3.4          1.4         0.2     setosa
## 30           4.7         3.2          1.6         0.2     setosa
## 31           4.8         3.1          1.6         0.2     setosa
## 32           5.4         3.4          1.5         0.4     setosa
## 33           5.2         4.1          1.5         0.1     setosa
## 34           5.5         4.2          1.4         0.2     setosa
## 35           4.9         3.1          1.5         0.2     setosa
## 36           5.0         3.2          1.2         0.2     setosa
## 37           5.5         3.5          1.3         0.2     setosa
## 38           4.9         3.6          1.4         0.1     setosa
## 39           4.4         3.0          1.3         0.2     setosa
## 40           5.1         3.4          1.5         0.2     setosa
## 41           5.0         3.5          1.3         0.3     setosa
## 42           4.5         2.3          1.3         0.3     setosa
## 43           4.4         3.2          1.3         0.2     setosa
## 44           5.0         3.5          1.6         0.6     setosa
## 45           5.1         3.8          1.9         0.4     setosa
## 46           4.8         3.0          1.4         0.3     setosa
## 47           5.1         3.8          1.6         0.2     setosa
## 48           4.6         3.2          1.4         0.2     setosa
## 49           5.3         3.7          1.5         0.2     setosa
## 50           5.0         3.3          1.4         0.2     setosa
## 51           7.0         3.2          4.7         1.4 versicolor
## 52           6.4         3.2          4.5         1.5 versicolor
## 53           6.9         3.1          4.9         1.5 versicolor
## 54           5.5         2.3          4.0         1.3 versicolor
## 55           6.5         2.8          4.6         1.5 versicolor
## 56           5.7         2.8          4.5         1.3 versicolor
## 57           6.3         3.3          4.7         1.6 versicolor
## 58           4.9         2.4          3.3         1.0 versicolor
## 59           6.6         2.9          4.6         1.3 versicolor
## 60           5.2         2.7          3.9         1.4 versicolor
## 61           5.0         2.0          3.5         1.0 versicolor
## 62           5.9         3.0          4.2         1.5 versicolor
## 63           6.0         2.2          4.0         1.0 versicolor
## 64           6.1         2.9          4.7         1.4 versicolor
## 65           5.6         2.9          3.6         1.3 versicolor
## 66           6.7         3.1          4.4         1.4 versicolor
## 67           5.6         3.0          4.5         1.5 versicolor
## 68           5.8         2.7          4.1         1.0 versicolor
## 69           6.2         2.2          4.5         1.5 versicolor
## 70           5.6         2.5          3.9         1.1 versicolor
## 71           5.9         3.2          4.8         1.8 versicolor
## 72           6.1         2.8          4.0         1.3 versicolor
## 73           6.3         2.5          4.9         1.5 versicolor
## 74           6.1         2.8          4.7         1.2 versicolor
## 75           6.4         2.9          4.3         1.3 versicolor
## 76           6.6         3.0          4.4         1.4 versicolor
## 77           6.8         2.8          4.8         1.4 versicolor
## 78           6.7         3.0          5.0         1.7 versicolor
## 79           6.0         2.9          4.5         1.5 versicolor
## 80           5.7         2.6          3.5         1.0 versicolor
## 81           5.5         2.4          3.8         1.1 versicolor
## 82           5.5         2.4          3.7         1.0 versicolor
## 83           5.8         2.7          3.9         1.2 versicolor
## 84           6.0         2.7          5.1         1.6 versicolor
## 85           5.4         3.0          4.5         1.5 versicolor
## 86           6.0         3.4          4.5         1.6 versicolor
## 87           6.7         3.1          4.7         1.5 versicolor
## 88           6.3         2.3          4.4         1.3 versicolor
## 89           5.6         3.0          4.1         1.3 versicolor
## 90           5.5         2.5          4.0         1.3 versicolor
## 91           5.5         2.6          4.4         1.2 versicolor
## 92           6.1         3.0          4.6         1.4 versicolor
## 93           5.8         2.6          4.0         1.2 versicolor
## 94           5.0         2.3          3.3         1.0 versicolor
## 95           5.6         2.7          4.2         1.3 versicolor
## 96           5.7         3.0          4.2         1.2 versicolor
## 97           5.7         2.9          4.2         1.3 versicolor
## 98           6.2         2.9          4.3         1.3 versicolor
## 99           5.1         2.5          3.0         1.1 versicolor
## 100          5.7         2.8          4.1         1.3 versicolor
## 101          6.3         3.3          6.0         2.5  virginica
## 102          5.8         2.7          5.1         1.9  virginica
## 103          7.1         3.0          5.9         2.1  virginica
## 104          6.3         2.9          5.6         1.8  virginica
## 105          6.5         3.0          5.8         2.2  virginica
## 106          7.6         3.0          6.6         2.1  virginica
## 107          4.9         2.5          4.5         1.7  virginica
## 108          7.3         2.9          6.3         1.8  virginica
## 109          6.7         2.5          5.8         1.8  virginica
## 110          7.2         3.6          6.1         2.5  virginica
## 111          6.5         3.2          5.1         2.0  virginica
## 112          6.4         2.7          5.3         1.9  virginica
## 113          6.8         3.0          5.5         2.1  virginica
## 114          5.7         2.5          5.0         2.0  virginica
## 115          5.8         2.8          5.1         2.4  virginica
## 116          6.4         3.2          5.3         2.3  virginica
## 117          6.5         3.0          5.5         1.8  virginica
## 118          7.7         3.8          6.7         2.2  virginica
## 119          7.7         2.6          6.9         2.3  virginica
## 120          6.0         2.2          5.0         1.5  virginica
## 121          6.9         3.2          5.7         2.3  virginica
## 122          5.6         2.8          4.9         2.0  virginica
## 123          7.7         2.8          6.7         2.0  virginica
## 124          6.3         2.7          4.9         1.8  virginica
## 125          6.7         3.3          5.7         2.1  virginica
## 126          7.2         3.2          6.0         1.8  virginica
## 127          6.2         2.8          4.8         1.8  virginica
## 128          6.1         3.0          4.9         1.8  virginica
## 129          6.4         2.8          5.6         2.1  virginica
## 130          7.2         3.0          5.8         1.6  virginica
## 131          7.4         2.8          6.1         1.9  virginica
## 132          7.9         3.8          6.4         2.0  virginica
## 133          6.4         2.8          5.6         2.2  virginica
## 134          6.3         2.8          5.1         1.5  virginica
## 135          6.1         2.6          5.6         1.4  virginica
## 136          7.7         3.0          6.1         2.3  virginica
## 137          6.3         3.4          5.6         2.4  virginica
## 138          6.4         3.1          5.5         1.8  virginica
## 139          6.0         3.0          4.8         1.8  virginica
## 140          6.9         3.1          5.4         2.1  virginica
## 141          6.7         3.1          5.6         2.4  virginica
## 142          6.9         3.1          5.1         2.3  virginica
## 143          5.8         2.7          5.1         1.9  virginica
## 144          6.8         3.2          5.9         2.3  virginica
## 145          6.7         3.3          5.7         2.5  virginica
## 146          6.7         3.0          5.2         2.3  virginica
## 147          6.3         2.5          5.0         1.9  virginica
## 148          6.5         3.0          5.2         2.0  virginica
## 149          6.2         3.4          5.4         2.3  virginica
## 150          5.9         3.0          5.1         1.8  virginica

Indexacion

Indexacion

head(iris[3]) #columna 3
##   Petal.Length
## 1          1.4
## 2          1.4
## 3          1.3
## 4          1.5
## 5          1.4
## 6          1.7
head(iris[c(1, 2)])
##   Sepal.Length Sepal.Width
## 1          5.1         3.5
## 2          4.9         3.0
## 3          4.7         3.2
## 4          4.6         3.1
## 5          5.0         3.6
## 6          5.4         3.9
head(iris[1,]) #Numero de fila
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
head(iris[,4])#Datos en Columna 4
## [1] 0.2 0.2 0.2 0.2 0.2 0.4
head(iris[15,3])  #Numero de fila y columna
## [1] 1.2

Indexacion

Creamos dos vectores

Sepalos_largo <- iris$Sepal.Length #en cm
Petalos_largo <- iris$Petal.Length #en cm

#Selleccionar vectores
Sepalos_largo > 6
##   [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [25] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [37] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [49] FALSE FALSE  TRUE  TRUE  TRUE FALSE  TRUE FALSE  TRUE FALSE  TRUE FALSE
##  [61] FALSE FALSE FALSE  TRUE FALSE  TRUE FALSE FALSE  TRUE FALSE FALSE  TRUE
##  [73]  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE
##  [85] FALSE FALSE  TRUE  TRUE FALSE FALSE FALSE  TRUE FALSE FALSE FALSE FALSE
##  [97] FALSE  TRUE FALSE FALSE  TRUE FALSE  TRUE  TRUE  TRUE  TRUE FALSE  TRUE
## [109]  TRUE  TRUE  TRUE  TRUE  TRUE FALSE FALSE  TRUE  TRUE  TRUE  TRUE FALSE
## [121]  TRUE FALSE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE
## [133]  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE FALSE  TRUE  TRUE  TRUE FALSE  TRUE
## [145]  TRUE  TRUE  TRUE  TRUE  TRUE FALSE
Sepalos_largo[Sepalos_largo > 6]
##  [1] 7.0 6.4 6.9 6.5 6.3 6.6 6.1 6.7 6.2 6.1 6.3 6.1 6.4 6.6 6.8 6.7 6.7 6.3 6.1
## [20] 6.2 6.3 7.1 6.3 6.5 7.6 7.3 6.7 7.2 6.5 6.4 6.8 6.4 6.5 7.7 7.7 6.9 7.7 6.3
## [39] 6.7 7.2 6.2 6.1 6.4 7.2 7.4 7.9 6.4 6.3 6.1 7.7 6.3 6.4 6.9 6.7 6.9 6.8 6.7
## [58] 6.7 6.3 6.5 6.2

Indexacion

Petalos_largo[Petalos_largo > 5]
##  [1] 5.1 6.0 5.1 5.9 5.6 5.8 6.6 6.3 5.8 6.1 5.1 5.3 5.5 5.1 5.3 5.5 6.7 6.9 5.7
## [20] 6.7 5.7 6.0 5.6 5.8 6.1 6.4 5.6 5.1 5.6 6.1 5.6 5.5 5.4 5.6 5.1 5.1 5.9 5.7
## [39] 5.2 5.2 5.4 5.1
Petalos_largo[Sepalos_largo > 6 & Petalos_largo > 6]
## [1] 6.6 6.3 6.1 6.7 6.9 6.7 6.1 6.4 6.1
Petalos_largo[Sepalos_largo > 6 & Petalos_largo > 6]
## [1] 6.6 6.3 6.1 6.7 6.9 6.7 6.1 6.4 6.1

Generacion de Datos

1:10
##  [1]  1  2  3  4  5  6  7  8  9 10
seq(from=1, to=10, by=1)
##  [1]  1  2  3  4  5  6  7  8  9 10
seq(1, 10, 1)
##  [1]  1  2  3  4  5  6  7  8  9 10
seq(length=9, from=1, to=5)
## [1] 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0
seq(1, 3, length=7)
## [1] 1.000000 1.333333 1.666667 2.000000 2.333333 2.666667 3.000000
c(1, 2, 3, 4, 5)
## [1] 1 2 3 4 5
rep(1, 30)
##  [1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
rep(1:3, 10)
##  [1] 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3

Generacion de Datos

Relevamiento de rindes, (50 parcelas, media de 2,8 t/ha, sd=0,8)

rnorm(50,2.8,0.8) #n = observaciones, mean = media, sd = desviacion standart
##  [1] 3.525677 2.575987 3.527002 3.692652 3.268523 3.222684 4.554351 3.478351
##  [9] 2.565685 2.776961 3.497171 2.709013 3.527374 3.329812 3.444229 2.705014
## [17] 2.823283 4.200838 2.764078 3.547242 3.391375 2.968762 4.145333 2.564213
## [25] 3.134165 2.884411 3.189377 3.187749 3.724214 3.227607 2.935469 2.949064
## [33] 2.239694 3.224180 1.728662 1.342107 2.858067 2.767897 3.922292 2.962369
## [41] 4.645406 3.520002 2.319709 3.239568 3.958626 2.490397 3.442343 1.740713
## [49] 3.223356 2.045497
#https://www.tutorialspoint.com/r/r_normal_distribution.htm

Generacion de Datos

Graficos

plot(Sepalos_largo)

Graficos

plot(Sepalos_largo, type="p")

Graficos

Relacion Lineal

plot(Sepalos_largo~Petalos_largo, main="Iris", xlab="Sepalos (cm)", ylab="Petalos (cm)")

Graficos

histograma

hist(rnorm(50,2.8,0.8))

tidyverse

tidyverse es un conjunto de paquetes de R diseñados para trabajar de manera integrada y coherente en el análisis de datos.

Paquetes

tidyverse

Principales paquetes incluidos en tidyverse:

  1. ggplot2: Para la creación de gráficos y visualizaciones.

  2. dplyr: Para manipulación y transformación de datos.

  3. tidyr: Para trabajar con datos en formato “tidy” (ordenados y estructurados).

  4. readr: Para la importación limpia y eficiente de datos.

  5. purrr: Para trabajar con funciones y listas de manera más eficiente.

  6. tibble: Para crear y trabajar con data frames mejorados.

Beneficios de usar tidyverse:

  1. Sintaxis coherente: Los paquetes en tidyverse comparten una sintaxis coherente, lo que facilita aprender y recordar cómo realizar tareas comunes.

  2. Flujo de trabajo eficiente: tidyverse está diseñado para proporcionar un flujo de trabajo eficiente y fácil de entender, desde la importación de datos hasta la visualización de resultados.

  3. Compatibilidad con piped operations: La tubería %>% (pipe) facilita la aplicación de operaciones en secuencia, lo que mejora la legibilidad del código.

tidyverse:

# Instalar y cargar tidyverse
#install.packages("tidyverse")
library(tidyverse)

# Crear un data frame de ejemplo
data <- data.frame(
  ID = c(1, 2, 3, 4, 5),
  Nombre = c("Juan", "María", "Carlos", "Ana", "Pedro"),
  Edad = c(25, 30, 22, 28, 35)
)

tidyverse:

# Filtrar personas mayores de 25 años y seleccionar solo las columnas de ID y Nombre
resultado <- data %>%
  filter(Edad > 25) %>%
  select(ID, Nombre)

# Imprimir el resultado
print(resultado)
##   ID Nombre
## 1  2  María
## 2  4    Ana
## 3  5  Pedro
#https://rpubs.com/paraneda/tidyverse

Practica

Leer Datos

## La separación decimal en R es . y no ,
#Datos en Millones de Guaranies
Ingreso <- read.csv("Datos/IngresoPromPoblacion_py.csv")
Ingreso <- read.table("Datos/IngresoPromPoblacion_py.csv", header=T,
                    na.strings = "4/", sep= ";", check.names = FALSE)

Ingreso
##     Departamento  1998  1999  2001  2002  2003  2004  2005  2006  2007  2008
## 1  Alto Paraguay    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA
## 2    Alto Parana 3.467 2.716 2.829 2.345 2.392 2.512 2.511 2.136 2.649 2.760
## 3        Amambay    NA    NA    NA    NA 1.545 1.633    NA    NA    NA    NA
## 4       Asuncion 3.964 3.772 3.660 2.978 3.248 3.251 2.978 3.171 2.943 2.749
## 5       Boqueron    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA
## 6       Caaguazu 1.398 1.488 1.484 1.480 1.734 1.444 1.325 1.336 1.355 1.545
## 7        Caazapa    NA    NA    NA    NA 1.334 1.195    NA    NA    NA    NA
## 8      Canindeyu    NA    NA    NA    NA 2.013 1.871    NA    NA    NA    NA
## 9        Central 2.886 2.624 2.385 1.905 1.959 1.879 2.003 1.956 1.934 2.073
## 10    Concepcion    NA    NA    NA    NA 1.504 1.619    NA    NA    NA    NA
## 11    Cordillera    NA    NA    NA    NA 1.317 1.074    NA    NA    NA    NA
## 12        Guaira    NA    NA    NA    NA 1.209 1.309    NA    NA    NA    NA
## 13        Itapua 2.071 2.277 1.576 1.356 1.868 2.141 1.726 1.477 1.403 2.050
## 14      Misiones    NA    NA    NA    NA 1.394 1.039    NA    NA    NA    NA
## 15      Neembucu    NA    NA    NA    NA 1.006 1.006    NA    NA    NA    NA
## 16     Paraguari    NA    NA    NA    NA 1.150 1.150    NA    NA    NA    NA
## 17    Pte. Hayes    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA
## 18     San Pedro 1.056 1.114 1.230 1.244 1.290 1.260 1.537 1.342 1.447 1.534
##     2009  2010  2011  2012  2013  2014  2015  2016  2017  2018
## 1     NA    NA    NA    NA    NA    NA 2.190 2.317 1.950    NA
## 2  2.332 2.734 2.863 2.476 2.572 2.887 2.813 2.622 2.664 2.663
## 3     NA    NA    NA    NA    NA    NA 2.232 2.580 2.422    NA
## 4  2.688 3.115 3.385 3.274 3.890 4.241 4.300 3.889 4.343 3.529
## 5     NA    NA    NA    NA    NA    NA 5.159 4.443 4.060    NA
## 6  1.786 1.658 1.438 1.553 1.934 2.727 1.706 1.762 2.479 1.921
## 7     NA    NA    NA    NA    NA    NA 2.056 1.555 1.407 1.494
## 8     NA    NA    NA    NA    NA    NA 1.912 2.624 2.206    NA
## 9  2.048 2.152 2.583 2.450 2.705 2.746 2.854 2.591 2.441 2.697
## 10    NA    NA    NA    NA    NA    NA 1.788 1.763 1.518    NA
## 11    NA    NA    NA    NA    NA    NA 1.872 1.780 1.609    NA
## 12    NA    NA    NA    NA    NA    NA 1.715 1.385 1.504    NA
## 13 1.676 1.845 2.350 1.770 1.816 1.891 2.020 1.976 2.073 2.175
## 14    NA    NA    NA    NA    NA    NA 1.862 1.928 1.938    NA
## 15    NA    NA    NA    NA    NA    NA 1.613 1.617 1.806    NA
## 16    NA    NA    NA    NA    NA    NA 1.772 1.515 1.531    NA
## 17    NA    NA    NA    NA    NA    NA 2.586 2.838 2.271    NA
## 18 1.352 1.445 1.572 1.599 2.046 1.898 1.474 1.600 1.818 2.478

Examinar Datos

##Revisar Datos
head(Ingreso) #Primeros datos
tail(Ingreso) #Ultimos Datos
dim(Ingreso) #Tamaño 
names(Ingreso) #Nombre de Columnas
summary(Ingreso) #Sumario de Datos 

¿Que departamento tiene el mayor ingreso promedio?

¿Que departamento tiene el mayor ingreso promedio?

#Cambiar a datos largos
dato_largo <- Ingreso %>%
  gather(key = "year", value = "Cantidad", -Departamento) %>%
  mutate(year = as.integer(year))

dato_largo
##      Departamento year Cantidad
## 1   Alto Paraguay 1998       NA
## 2     Alto Parana 1998    3.467
## 3         Amambay 1998       NA
## 4        Asuncion 1998    3.964
## 5        Boqueron 1998       NA
## 6        Caaguazu 1998    1.398
## 7         Caazapa 1998       NA
## 8       Canindeyu 1998       NA
## 9         Central 1998    2.886
## 10     Concepcion 1998       NA
## 11     Cordillera 1998       NA
## 12         Guaira 1998       NA
## 13         Itapua 1998    2.071
## 14       Misiones 1998       NA
## 15       Neembucu 1998       NA
## 16      Paraguari 1998       NA
## 17     Pte. Hayes 1998       NA
## 18      San Pedro 1998    1.056
## 19  Alto Paraguay 1999       NA
## 20    Alto Parana 1999    2.716
## 21        Amambay 1999       NA
## 22       Asuncion 1999    3.772
## 23       Boqueron 1999       NA
## 24       Caaguazu 1999    1.488
## 25        Caazapa 1999       NA
## 26      Canindeyu 1999       NA
## 27        Central 1999    2.624
## 28     Concepcion 1999       NA
## 29     Cordillera 1999       NA
## 30         Guaira 1999       NA
## 31         Itapua 1999    2.277
## 32       Misiones 1999       NA
## 33       Neembucu 1999       NA
## 34      Paraguari 1999       NA
## 35     Pte. Hayes 1999       NA
## 36      San Pedro 1999    1.114
## 37  Alto Paraguay 2001       NA
## 38    Alto Parana 2001    2.829
## 39        Amambay 2001       NA
## 40       Asuncion 2001    3.660
## 41       Boqueron 2001       NA
## 42       Caaguazu 2001    1.484
## 43        Caazapa 2001       NA
## 44      Canindeyu 2001       NA
## 45        Central 2001    2.385
## 46     Concepcion 2001       NA
## 47     Cordillera 2001       NA
## 48         Guaira 2001       NA
## 49         Itapua 2001    1.576
## 50       Misiones 2001       NA
## 51       Neembucu 2001       NA
## 52      Paraguari 2001       NA
## 53     Pte. Hayes 2001       NA
## 54      San Pedro 2001    1.230
## 55  Alto Paraguay 2002       NA
## 56    Alto Parana 2002    2.345
## 57        Amambay 2002       NA
## 58       Asuncion 2002    2.978
## 59       Boqueron 2002       NA
## 60       Caaguazu 2002    1.480
## 61        Caazapa 2002       NA
## 62      Canindeyu 2002       NA
## 63        Central 2002    1.905
## 64     Concepcion 2002       NA
## 65     Cordillera 2002       NA
## 66         Guaira 2002       NA
## 67         Itapua 2002    1.356
## 68       Misiones 2002       NA
## 69       Neembucu 2002       NA
## 70      Paraguari 2002       NA
## 71     Pte. Hayes 2002       NA
## 72      San Pedro 2002    1.244
## 73  Alto Paraguay 2003       NA
## 74    Alto Parana 2003    2.392
## 75        Amambay 2003    1.545
## 76       Asuncion 2003    3.248
## 77       Boqueron 2003       NA
## 78       Caaguazu 2003    1.734
## 79        Caazapa 2003    1.334
## 80      Canindeyu 2003    2.013
## 81        Central 2003    1.959
## 82     Concepcion 2003    1.504
## 83     Cordillera 2003    1.317
## 84         Guaira 2003    1.209
## 85         Itapua 2003    1.868
## 86       Misiones 2003    1.394
## 87       Neembucu 2003    1.006
## 88      Paraguari 2003    1.150
## 89     Pte. Hayes 2003       NA
## 90      San Pedro 2003    1.290
## 91  Alto Paraguay 2004       NA
## 92    Alto Parana 2004    2.512
## 93        Amambay 2004    1.633
## 94       Asuncion 2004    3.251
## 95       Boqueron 2004       NA
## 96       Caaguazu 2004    1.444
## 97        Caazapa 2004    1.195
## 98      Canindeyu 2004    1.871
## 99        Central 2004    1.879
## 100    Concepcion 2004    1.619
## 101    Cordillera 2004    1.074
## 102        Guaira 2004    1.309
## 103        Itapua 2004    2.141
## 104      Misiones 2004    1.039
## 105      Neembucu 2004    1.006
## 106     Paraguari 2004    1.150
## 107    Pte. Hayes 2004       NA
## 108     San Pedro 2004    1.260
## 109 Alto Paraguay 2005       NA
## 110   Alto Parana 2005    2.511
## 111       Amambay 2005       NA
## 112      Asuncion 2005    2.978
## 113      Boqueron 2005       NA
## 114      Caaguazu 2005    1.325
## 115       Caazapa 2005       NA
## 116     Canindeyu 2005       NA
## 117       Central 2005    2.003
## 118    Concepcion 2005       NA
## 119    Cordillera 2005       NA
## 120        Guaira 2005       NA
## 121        Itapua 2005    1.726
## 122      Misiones 2005       NA
## 123      Neembucu 2005       NA
## 124     Paraguari 2005       NA
## 125    Pte. Hayes 2005       NA
## 126     San Pedro 2005    1.537
## 127 Alto Paraguay 2006       NA
## 128   Alto Parana 2006    2.136
## 129       Amambay 2006       NA
## 130      Asuncion 2006    3.171
## 131      Boqueron 2006       NA
## 132      Caaguazu 2006    1.336
## 133       Caazapa 2006       NA
## 134     Canindeyu 2006       NA
## 135       Central 2006    1.956
## 136    Concepcion 2006       NA
## 137    Cordillera 2006       NA
## 138        Guaira 2006       NA
## 139        Itapua 2006    1.477
## 140      Misiones 2006       NA
## 141      Neembucu 2006       NA
## 142     Paraguari 2006       NA
## 143    Pte. Hayes 2006       NA
## 144     San Pedro 2006    1.342
## 145 Alto Paraguay 2007       NA
## 146   Alto Parana 2007    2.649
## 147       Amambay 2007       NA
## 148      Asuncion 2007    2.943
## 149      Boqueron 2007       NA
## 150      Caaguazu 2007    1.355
## 151       Caazapa 2007       NA
## 152     Canindeyu 2007       NA
## 153       Central 2007    1.934
## 154    Concepcion 2007       NA
## 155    Cordillera 2007       NA
## 156        Guaira 2007       NA
## 157        Itapua 2007    1.403
## 158      Misiones 2007       NA
## 159      Neembucu 2007       NA
## 160     Paraguari 2007       NA
## 161    Pte. Hayes 2007       NA
## 162     San Pedro 2007    1.447
## 163 Alto Paraguay 2008       NA
## 164   Alto Parana 2008    2.760
## 165       Amambay 2008       NA
## 166      Asuncion 2008    2.749
## 167      Boqueron 2008       NA
## 168      Caaguazu 2008    1.545
## 169       Caazapa 2008       NA
## 170     Canindeyu 2008       NA
## 171       Central 2008    2.073
## 172    Concepcion 2008       NA
## 173    Cordillera 2008       NA
## 174        Guaira 2008       NA
## 175        Itapua 2008    2.050
## 176      Misiones 2008       NA
## 177      Neembucu 2008       NA
## 178     Paraguari 2008       NA
## 179    Pte. Hayes 2008       NA
## 180     San Pedro 2008    1.534
## 181 Alto Paraguay 2009       NA
## 182   Alto Parana 2009    2.332
## 183       Amambay 2009       NA
## 184      Asuncion 2009    2.688
## 185      Boqueron 2009       NA
## 186      Caaguazu 2009    1.786
## 187       Caazapa 2009       NA
## 188     Canindeyu 2009       NA
## 189       Central 2009    2.048
## 190    Concepcion 2009       NA
## 191    Cordillera 2009       NA
## 192        Guaira 2009       NA
## 193        Itapua 2009    1.676
## 194      Misiones 2009       NA
## 195      Neembucu 2009       NA
## 196     Paraguari 2009       NA
## 197    Pte. Hayes 2009       NA
## 198     San Pedro 2009    1.352
## 199 Alto Paraguay 2010       NA
## 200   Alto Parana 2010    2.734
## 201       Amambay 2010       NA
## 202      Asuncion 2010    3.115
## 203      Boqueron 2010       NA
## 204      Caaguazu 2010    1.658
## 205       Caazapa 2010       NA
## 206     Canindeyu 2010       NA
## 207       Central 2010    2.152
## 208    Concepcion 2010       NA
## 209    Cordillera 2010       NA
## 210        Guaira 2010       NA
## 211        Itapua 2010    1.845
## 212      Misiones 2010       NA
## 213      Neembucu 2010       NA
## 214     Paraguari 2010       NA
## 215    Pte. Hayes 2010       NA
## 216     San Pedro 2010    1.445
## 217 Alto Paraguay 2011       NA
## 218   Alto Parana 2011    2.863
## 219       Amambay 2011       NA
## 220      Asuncion 2011    3.385
## 221      Boqueron 2011       NA
## 222      Caaguazu 2011    1.438
## 223       Caazapa 2011       NA
## 224     Canindeyu 2011       NA
## 225       Central 2011    2.583
## 226    Concepcion 2011       NA
## 227    Cordillera 2011       NA
## 228        Guaira 2011       NA
## 229        Itapua 2011    2.350
## 230      Misiones 2011       NA
## 231      Neembucu 2011       NA
## 232     Paraguari 2011       NA
## 233    Pte. Hayes 2011       NA
## 234     San Pedro 2011    1.572
## 235 Alto Paraguay 2012       NA
## 236   Alto Parana 2012    2.476
## 237       Amambay 2012       NA
## 238      Asuncion 2012    3.274
## 239      Boqueron 2012       NA
## 240      Caaguazu 2012    1.553
## 241       Caazapa 2012       NA
## 242     Canindeyu 2012       NA
## 243       Central 2012    2.450
## 244    Concepcion 2012       NA
## 245    Cordillera 2012       NA
## 246        Guaira 2012       NA
## 247        Itapua 2012    1.770
## 248      Misiones 2012       NA
## 249      Neembucu 2012       NA
## 250     Paraguari 2012       NA
## 251    Pte. Hayes 2012       NA
## 252     San Pedro 2012    1.599
## 253 Alto Paraguay 2013       NA
## 254   Alto Parana 2013    2.572
## 255       Amambay 2013       NA
## 256      Asuncion 2013    3.890
## 257      Boqueron 2013       NA
## 258      Caaguazu 2013    1.934
## 259       Caazapa 2013       NA
## 260     Canindeyu 2013       NA
## 261       Central 2013    2.705
## 262    Concepcion 2013       NA
## 263    Cordillera 2013       NA
## 264        Guaira 2013       NA
## 265        Itapua 2013    1.816
## 266      Misiones 2013       NA
## 267      Neembucu 2013       NA
## 268     Paraguari 2013       NA
## 269    Pte. Hayes 2013       NA
## 270     San Pedro 2013    2.046
## 271 Alto Paraguay 2014       NA
## 272   Alto Parana 2014    2.887
## 273       Amambay 2014       NA
## 274      Asuncion 2014    4.241
## 275      Boqueron 2014       NA
## 276      Caaguazu 2014    2.727
## 277       Caazapa 2014       NA
## 278     Canindeyu 2014       NA
## 279       Central 2014    2.746
## 280    Concepcion 2014       NA
## 281    Cordillera 2014       NA
## 282        Guaira 2014       NA
## 283        Itapua 2014    1.891
## 284      Misiones 2014       NA
## 285      Neembucu 2014       NA
## 286     Paraguari 2014       NA
## 287    Pte. Hayes 2014       NA
## 288     San Pedro 2014    1.898
## 289 Alto Paraguay 2015    2.190
## 290   Alto Parana 2015    2.813
## 291       Amambay 2015    2.232
## 292      Asuncion 2015    4.300
## 293      Boqueron 2015    5.159
## 294      Caaguazu 2015    1.706
## 295       Caazapa 2015    2.056
## 296     Canindeyu 2015    1.912
## 297       Central 2015    2.854
## 298    Concepcion 2015    1.788
## 299    Cordillera 2015    1.872
## 300        Guaira 2015    1.715
## 301        Itapua 2015    2.020
## 302      Misiones 2015    1.862
## 303      Neembucu 2015    1.613
## 304     Paraguari 2015    1.772
## 305    Pte. Hayes 2015    2.586
## 306     San Pedro 2015    1.474
## 307 Alto Paraguay 2016    2.317
## 308   Alto Parana 2016    2.622
## 309       Amambay 2016    2.580
## 310      Asuncion 2016    3.889
## 311      Boqueron 2016    4.443
## 312      Caaguazu 2016    1.762
## 313       Caazapa 2016    1.555
## 314     Canindeyu 2016    2.624
## 315       Central 2016    2.591
## 316    Concepcion 2016    1.763
## 317    Cordillera 2016    1.780
## 318        Guaira 2016    1.385
## 319        Itapua 2016    1.976
## 320      Misiones 2016    1.928
## 321      Neembucu 2016    1.617
## 322     Paraguari 2016    1.515
## 323    Pte. Hayes 2016    2.838
## 324     San Pedro 2016    1.600
## 325 Alto Paraguay 2017    1.950
## 326   Alto Parana 2017    2.664
## 327       Amambay 2017    2.422
## 328      Asuncion 2017    4.343
## 329      Boqueron 2017    4.060
## 330      Caaguazu 2017    2.479
## 331       Caazapa 2017    1.407
## 332     Canindeyu 2017    2.206
## 333       Central 2017    2.441
## 334    Concepcion 2017    1.518
## 335    Cordillera 2017    1.609
## 336        Guaira 2017    1.504
## 337        Itapua 2017    2.073
## 338      Misiones 2017    1.938
## 339      Neembucu 2017    1.806
## 340     Paraguari 2017    1.531
## 341    Pte. Hayes 2017    2.271
## 342     San Pedro 2017    1.818
## 343 Alto Paraguay 2018       NA
## 344   Alto Parana 2018    2.663
## 345       Amambay 2018       NA
## 346      Asuncion 2018    3.529
## 347      Boqueron 2018       NA
## 348      Caaguazu 2018    1.921
## 349       Caazapa 2018    1.494
## 350     Canindeyu 2018       NA
## 351       Central 2018    2.697
## 352    Concepcion 2018       NA
## 353    Cordillera 2018       NA
## 354        Guaira 2018       NA
## 355        Itapua 2018    2.175
## 356      Misiones 2018       NA
## 357      Neembucu 2018       NA
## 358     Paraguari 2018       NA
## 359    Pte. Hayes 2018       NA
## 360     San Pedro 2018    2.478

¿Que departamento tiene el mayor ingreso promedio?

#Limpiar Datos
# Recortar espacios en blanco en columnas
dato_largo$Departamento <- str_trim(dato_largo$Departamento) 

# Reemplzar espacios en blanco en columnas
dato_largo$Departamento <- str_replace(dato_largo$Departamento, ' ', '_') 

# Reemplazar ciertos valores
any(is.na(dato_largo))  # Verificar valores faltantes (NAs)
## [1] TRUE
#dato_largo[is.na(dato_largo)] <- 0  # Reemplazar NAs con 0s

¿Que departamento tiene el mayor ingreso promedio?

# Agrupar los datos por departamento y encontrar el departamento con el mayor ingreso promedio
Mayor_Departamento <- dato_largo %>%
  group_by(Departamento) %>%
  summarize(Cantidad_total = mean(Cantidad, na.rm = TRUE)) %>%
  slice(which.max(Cantidad_total)) %>%
  ungroup()

¿Que departamento tiene el mayor ingreso promedio?

## # A tibble: 1 × 2
##   Departamento Cantidad_total
##   <chr>                 <dbl>
## 1 Boqueron               4.55

Otras Preguntas

#Departamentos con ingresos mayor a 2.5 luego del 2000
resultados <- dato_largo %>%
  filter(Cantidad > 2.5 & year > 2000) %>%
  select(Departamento, year, Cantidad)

resultados
##    Departamento year Cantidad
## 1   Alto_Parana 2001    2.829
## 2      Asuncion 2001    3.660
## 3      Asuncion 2002    2.978
## 4      Asuncion 2003    3.248
## 5   Alto_Parana 2004    2.512
## 6      Asuncion 2004    3.251
## 7   Alto_Parana 2005    2.511
## 8      Asuncion 2005    2.978
## 9      Asuncion 2006    3.171
## 10  Alto_Parana 2007    2.649
## 11     Asuncion 2007    2.943
## 12  Alto_Parana 2008    2.760
## 13     Asuncion 2008    2.749
## 14     Asuncion 2009    2.688
## 15  Alto_Parana 2010    2.734
## 16     Asuncion 2010    3.115
## 17  Alto_Parana 2011    2.863
## 18     Asuncion 2011    3.385
## 19      Central 2011    2.583
## 20     Asuncion 2012    3.274
## 21  Alto_Parana 2013    2.572
## 22     Asuncion 2013    3.890
## 23      Central 2013    2.705
## 24  Alto_Parana 2014    2.887
## 25     Asuncion 2014    4.241
## 26     Caaguazu 2014    2.727
## 27      Central 2014    2.746
## 28  Alto_Parana 2015    2.813
## 29     Asuncion 2015    4.300
## 30     Boqueron 2015    5.159
## 31      Central 2015    2.854
## 32   Pte._Hayes 2015    2.586
## 33  Alto_Parana 2016    2.622
## 34      Amambay 2016    2.580
## 35     Asuncion 2016    3.889
## 36     Boqueron 2016    4.443
## 37    Canindeyu 2016    2.624
## 38      Central 2016    2.591
## 39   Pte._Hayes 2016    2.838
## 40  Alto_Parana 2017    2.664
## 41     Asuncion 2017    4.343
## 42     Boqueron 2017    4.060
## 43  Alto_Parana 2018    2.663
## 44     Asuncion 2018    3.529
## 45      Central 2018    2.697

Graficar

Otras Preguntas

#Seleccionar Solo datos de Itapua
dato_largo_itapua <- dato_largo[dato_largo$Departamento == "Itapua", ]
Ingreso_Promedio_itapua <-  dato_largo_itapua$Cantidad

#Seleccionar Solo datos de Itapua
dato_largo_Boqueron <- dato_largo[dato_largo$Departamento == "Boqueron", ]
Ingreso_Promedio_Boqueron <-  dato_largo_Boqueron$Cantidad