Para comenzar se debe descargar R, esta descarga incluye R básico y un editor de textos para escribir código. Después de descargar R se recomienda descargar RStudio (gratis y libre).
Rstudio es un ambiente de desarrollo integrado para R: incluye una consola, un editor de texto y un conjunto de herramientas para administrar el espacio de trabajo cuando se utiliza R.
R tiene incorporada muchas funciones para el analisis, pero podemos agregar algunas liberías que no serán de gran apoyo como:
readxl para manipular archivos excel.lattice para graficar facilmente y con muchas
opcionesggplot2 otra herramienta de visualizaciónFlexdasboardSharinganTambien nos podemos apoyar con librerías de otros lengujes de progamación cómo python que tambien se puede ejecutar en R, con librerías cómo:
seabornfolliumR es un lenguaje enfocado en estaditica, es por eso que los objetos de R que nos importa son:
Un vector en R es un conjunto de objetos del mismo
tipo concatenados con la función c . Puedes crear vectores
con componentes lógicos, de caracteres, numéricos o complejos, entre
otros. Los diferentes términos del vector se denominan componentes.
notas <- c(14,15,18,20,13,12)
notas
sexo <- c("M","F","M","F","F","F")
sexo
[1] 14 15 18 20 13 12
[1] "M" "F" "M" "F" "F" "F"
Las matrices y arrays pueden ser descritas como vectores multidimensionales. Al igual que un vector, únicamente pueden contener datos de un sólo tipo, pero además de largo, tienen más dimensiones.
En un sentido estricto, las matrices son una caso especial de un array, que se distingue por tener específicamente dos dimensiones, un “largo”” y un “alto”. Las matrices son, por lo tanto, una estructura con forma rectangular, con renglones y columnas.
# Tres filas y cuatro columnas
matrix(1:12, nrow = 3, ncol = 4)
[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12
Los data frames son estructuras de datos de dos dimensiones (rectangulares) que pueden contener datos de diferentes tipos, por lo tanto, son heterogéneas. Esta estructura de datos es la más usada para realizar análisis de datos y seguro te resultará familiar si has trabajado con otros paquetes estadísticos.
mi_df <- data.frame(
"entero" = 1:4,
"factor" = c("a", "b", "c", "d"),
"numero" = c(1.2, 3.4, 4.5, 5.6),
"cadena" = as.character(c("a", "b", "c", "d"))
)
mi_df
entero factor numero cadena
1 1 a 1.2 a
2 2 b 3.4 b
3 3 c 4.5 c
4 4 d 5.6 d
En el menú superior de la interfaz vamos a FILE y
hacemos click en IMPORT DATASET > FROM EXCEL
Se abre una ventana en donde podemos buscar el archivo haciendo click en browse y nos muestra una vista de los datos. En las opciones de importación podemos ajustar cosas como el nombre de la variable en R, la hoja, el rango, y otras opciones más avanzadas.
Instalar paquete readxl Ahora, necesitamos instalar el paquete readxl para importar datos de Excel. Éste es, en mi opinión, el paquete más sencillo de usar para importar este tipo de datos.
Instalamos el paquete con el siguiente código:
`install.package(“readxl”)
Antes de cargar los datos a R, veamos cuales son las hojas que tiene este Excel. Luego, podemos utilizar el código
1 excel_sheets(ruta_excel)
Según si tiene hojas o está o no bien organizado usaremos
caso_ideal <- read_excel(ruta_excel) # si es que solo hay una hoja en excel y empieza los datos en A1
caso_medio <- read_excel(ruta_excel,
sheet = 'Hoja2') # Si es que está pegado a A1 pero hay varias hojas
final_boss <- read_excel(ruta_excel,
sheet = 'Hoja3',
range = 'C7:E13')
Un fichero en formato CSV es un archivo de texto que guarda datos en columnas separadas por comas CSV significa “comma separated values”.
Luego cuando queremos importar a R estamos interesados en convertir este texto en un dataframe.
Para esto necesitamos instalar el paquete de R para leer csv: readr.
install.packages("readr")
# cargar paquete readr
library(readr)
Obtener la ruta del archivo para importar a r Ruta del archivo para importar de R a excel Primero, veremos cómo sacar esta ruta con una función muy chévere de R (Es de esos secretos que revelamos aquí para ser mejores con R).
Así, la función se llama file.choose(). Luego, esta función te permite abrir una ventana de Windows para buscar un archivo y regresa una variable tipo carácter con la ruta del archivo.
En la ventana, buscamos el archivo y hacemos click en «open» o «abrir»Guardamos en una variable tipo caracter que con nombre ruta_excel
1 ruta_excel <- "C:\\LA\\RUTA\\DE\\TU\\ARCHIVO.xlsx
data("mtcars")
barplot(table(mtcars$cyl))
barplot(table(mtcars$cyl),
col = 'green',
border = 'red',
main = 'G2 grafica de barras',
sub = 'subtitulo',
xlab = 'cilindros',
ylab = 'cantidad')
barplot(table(mtcars$cyl),
horiz = 'TRUE',
col = 'green',
border = 'red',
main = 'grafica de barras',
sub = 'subtitulo',
xlab = 'cilindros',
ylab = 'cantidad'
---
title: "Intorducción a R y Rmarkdown"
date: " `r Sys.Date()`"
email: "clayton.iliquin@gmail.com"
output:
flexdashboard::flex_dashboard:
orientation: columns
vertical_layout: fill
source: embed
social: ['facebook','linkedin','twitter']
theme: "readable"
---
```{r setup, include=FALSE}
library(flexdashboard)
library(readxl)
library(lattice)
library(RColorBrewer)
library(prettydoc)
excel_anuario<-"C:\\Users\\clayton jhordan\\Downloads\\AM2020.xlsx"
```
side_bar{.sidebar}
===============================
Este es un resumen del curso de [Data Science Research Perú](https://www.datascience.pe/), impartido por [Renzo Caceres Rozzi](https://pe.linkedin.com/in/andrescaceresrossi), curso el cuál me parece que está impartido de manera excelente y por eso me animé a hacer este resumen, esperando que les sirva para usar R y R Markdown
Recursos usados en curso:
1.[Instalar Paquetes en R](https://gonzalezgouveia.com/instalar-paquetes-en-r/)
2.[Descargar R, página oficial](https://cran.r-project.org/bin/windows/base/)
3.[Descargar R Studio, entorno de desarrollo R](https://www.rstudio.com/products/rstudio/download/)
4.[Aprender a graficar en R](https://r-coder.com/graficos-r/)
5.[Referencias para iconos](https://fontawesome.com/icons/)
# Introducción {data-icon="fa-info"}
##
### ¿Que es R?
- R es un lenguaje de programación y un ambiente de cómputo estadístico
- R es software libre (no dice qué puedes o no hacer con el software), de código abierto (todo el código de R se puede inspeccionar - y se inspecciona).
- Cuando instalamos R, instala la base de R. Mucha de la funcionalidad adicional está en paquetes (conjunto de funciones y datos documentados) que la comunidad contribuye.

### ¿Porque R?
- R funciona en casi todas las plataformas (Mac, Windows, Linux e incluso en Playstation 3).
- R es un lenguaje de programación completo, permite desarrollo de DSLs.
- R promueve la investigación reproducible.
- R está actualizado gracias a que tiene una activa comunidad. Solo en CRAN hay cerca de 10,000 paquetes (funcionalidad adicional de R creadas creada por la comunidad).
- R se puede combinar con otras herramientas.
- R tiene capacidades gráficas muy sofisticadas.
- R es popular (Revolutions blog).
##
### R Y R studio
Para comenzar se debe descargar R, esta descarga incluye R básico y un editor de textos para escribir código. Después de descargar R se recomienda descargar RStudio (gratis y libre).
Rstudio es un ambiente de desarrollo integrado para R: incluye una consola, un editor de texto y un conjunto de herramientas para administrar el espacio de trabajo cuando se utiliza R.
### Paquetes importantes para descarga
R tiene incorporada muchas funciones para el analisis, pero podemos agregar algunas liberías que no serán de gran apoyo como:
- `readxl` para manipular archivos excel.
- `lattice` para graficar facilmente y con muchas opciones
- `ggplot2` otra herramienta de visualización
### Paquetes adicionales para presentación de datos
- `Flexdasboard`
- `Sharingan`
Tambien nos podemos apoyar con librerías de otros lengujes de progamación cómo python que tambien se puede ejecutar en R, con librerías cómo:
- `seaborn`
- `follium`
# Introducción a R y R Sutdio{data-icon='fa-r-project'}
## {.tabset}
### Objetos básico de R
R es un lenguaje enfocado en estaditica, es por eso que los objetos de R que nos importa son:
#### Vectores
Un **vector en R** es un conjunto de objetos del mismo tipo concatenados con la función `c` .
Puedes crear vectores con componentes lógicos, de caracteres, numéricos o complejos, entre otros.
Los diferentes términos del vector se denominan componentes.
```
notas <- c(14,15,18,20,13,12)
notas
sexo <- c("M","F","M","F","F","F")
sexo
```
```{r vectores}
notas <- c(14,15,18,20,13,12)
notas
sexo <- c("M","F","M","F","F","F")
sexo
```
#### Matrices
Las **matrices y arrays** pueden ser descritas como vectores multidimensionales. Al igual que un **vector**, únicamente pueden contener datos de un sólo tipo, pero además de largo, tienen más dimensiones.
En un sentido estricto, las *matrices son una caso especial de un array*, que se distingue por tener específicamente dos dimensiones, un “largo”" y un “alto”. Las matrices son, por lo tanto, una estructura con forma rectangular, con renglones y columnas.
```
# Tres filas y cuatro columnas
matrix(1:12, nrow = 3, ncol = 4)
```
```{r matrix1}
matrix(1:12, nrow = 3, ncol = 4)
```
#### Data Frames
Los **data frames** son estructuras de datos de dos dimensiones (rectangulares) que pueden contener datos de diferentes tipos, por lo tanto, son heterogéneas. Esta estructura de datos es la **más usada para realizar análisis de datos** y seguro te resultará familiar si has trabajado con otros paquetes estadísticos.
```
mi_df <- data.frame(
"entero" = 1:4,
"factor" = c("a", "b", "c", "d"),
"numero" = c(1.2, 3.4, 4.5, 5.6),
"cadena" = as.character(c("a", "b", "c", "d"))
)
mi_df
```
```{r}
mi_df <- data.frame(
"entero" = 1:4,
"factor" = c("a", "b", "c", "d"),
"numero" = c(1.2, 3.4, 4.5, 5.6),
"cadena" = as.character(c("a", "b", "c", "d"))
)
mi_df
```
# Importar datos {data-icon="fa-file-import"}
## {.tabset}
### Importar datos desde Excel
#### Importar de excel a R con interfáz
En el menú superior de la interfaz vamos a `FILE` y hacemos click en `IMPORT DATASET > FROM EXCEL`

Se abre una ventana en donde podemos buscar el archivo haciendo click en browse y nos muestra una vista de los datos. En las opciones de importación podemos ajustar cosas como el nombre de la variable en R, la hoja, el rango, y otras opciones más avanzadas.

### Importar Datos con código R
#### Antes de imporat nuestros datos debemos tener en cuenta
***Instalar paquete readxl***
Ahora, necesitamos instalar el paquete readxl para importar datos de Excel. Éste es, en mi opinión, el paquete más sencillo de usar para importar este tipo de datos.
Instalamos el paquete con el siguiente código:
> `install.package("readxl")
Antes de cargar los datos a R, veamos cuales son las hojas que tiene este Excel. Luego, podemos utilizar el código
`1 excel_sheets(ruta_excel)`
#### Importando Datos
Según si tiene hojas o está o no bien organizado usaremos
```
caso_ideal <- read_excel(ruta_excel) # si es que solo hay una hoja en excel y empieza los datos en A1
caso_medio <- read_excel(ruta_excel,
sheet = 'Hoja2') # Si es que está pegado a A1 pero hay varias hojas
final_boss <- read_excel(ruta_excel,
sheet = 'Hoja3',
range = 'C7:E13')
```
### Pasos para Leer documentos CSV
Un fichero en formato CSV es un archivo de texto que guarda datos en columnas separadas por comas CSV significa “comma separated values”.
Luego cuando queremos importar a R estamos interesados en convertir este texto en un dataframe.
***Para esto necesitamos instalar el paquete de R para leer csv: readr.***
```
install.packages("readr")
# cargar paquete readr
library(readr)
```
##
### Rutas para leer documentos
***Obtener la ruta del archivo para importar a r***
Ruta del archivo para importar de R a excel
Primero, veremos cómo sacar esta ruta con una función muy chévere de R (Es de esos secretos que revelamos aquí para ser mejores con R).
Así, la función se llama file.choose(). Luego, esta función te permite abrir una ventana de Windows para buscar un archivo y regresa una variable tipo carácter con la ruta del archivo.
En la ventana, buscamos el archivo y hacemos click en «open» o «abrir»

Guardamos en una variable tipo caracter que con nombre ruta_excel
` 1 ruta_excel <- "C:\\LA\\RUTA\\DE\\TU\\ARCHIVO.xlsx`
# Visualización de datos {data-icon="fa-chart-pie"}
##
### Creando con barplot()
```{r mtcars, include=TRUE}
barplot(table(mtcars$cyl))
barplot(table(mtcars$cyl),
col = 'green',
border = 'red',
main = 'G2 grafica de barras',
sub = 'subtitulo',
xlab = 'cilindros',
ylab = 'cantidad')
barplot(table(mtcars$cyl),
horiz = 'TRUE',
col = 'green',
border = 'red',
main = 'G3 grafica horizontal',
sub = 'subtitulo',
xlab = 'cilindros',
ylab = 'cantidad')
```
##
### Código
#### Datos
```
data("mtcars")
```
#### grafico Simple
```
barplot(table(mtcars$cyl))
```
#### grafico de barras mejorado
```
barplot(table(mtcars$cyl),
col = 'green',
border = 'red',
main = 'G2 grafica de barras',
sub = 'subtitulo',
xlab = 'cilindros',
ylab = 'cantidad')
```
#### grafico Horizontal
```
barplot(table(mtcars$cyl),
horiz = 'TRUE',
col = 'green',
border = 'red',
main = 'grafica de barras',
sub = 'subtitulo',
xlab = 'cilindros',
ylab = 'cantidad'
```