Básicos de R

Temario de la sesión 1

1.-Conociendo el entorno de R Studio
2.-Algunos atajos del teclado
3.-Importación de archivos CSV

-Desde una ruta
-Desde un directorio
-Desde navegador
-Desde la nube

3.1.- Importar archivos xlsx y bibliotecas
4.-Inspeccionar datos
5.-Manipular datos
6.-Regresión Lineal Simple

1.-Conociendo el entorno de R Studio

# View-- panes --pane layout
# Diferencias entre consola y fuente
a=10
b=15
a+b

## [1] 25

a<-10
b<-15
a+b

## [1] 25

c<-a+b
print(c)

## [1] 25

a<-10
b<-15
c<-a+b
print(c)

## [1] 25

2.-Algunos atajos del teclado

# Comentarios
# ctrl + shif + c   Comentario multilinea
# ctrl + enter Ejecutar código seleccionado
# ctrl + l Limpiar la consola
# ctrl + s Guardar
# alt 126 ~
# alt +91 +93 []
# alt +123  125 {}
# alt +38 &
# alt +124 |

3.-Importacion de archivos CSV

# Importar Archivos desde ruta
datos1= read.csv("C:/Users/Armando/Documents/borrar/iris.csv")
#print(datos1)
#View(datos1)

# Importar archivo desde directorio

# ver directorio
#getwd()

# Cambiar directorio
#setwd("C:/Users/Armando/Desktop/Proyectos Github/basicos_r_parte_I")

# Estando en el directorio solo se llama por el nombre del archivo
#datos1=read.csv("iris.csv")

#View(datos1)

# Importar archivos desde navegador windows

#datos1 <- read.csv(file.choose(), stringsAsFactors = TRUE)
#View(datos1)

# Importar desde la nube

myurl="https://docs.google.com/spreadsheets/d/1_3FfbYFKWrUQWb8inaFe6D2uharQfAbcPXDGVmXERSY/pub?gid=0&single=true&output=csv"
datos1<-read.csv(url(myurl))
#View(datos1)

# Obtener links desde la nube
# Importar una Spreadsheet de Google
# 1.-Se da click en Archivo-> Publicar en la web (no se toma el link que da)
# 2.-Se copia este link y se reemplaza por el key del original (puede ser csv o xlsx)
# https://docs.google.com/spreadsheets/d/KEY/pub?gid=0&single=true&output=csv
# https://docs.google.com/spreadsheets/d/KEY/pub?gid=0&single=true&output=xlsx


# Traer archivos desde DropBox
# 1.-Darle click en compartir
# 2.-Darle click en copiar vínculo
# 3.-Cambiar "dl=0" por "dl=1"

3.1.- Importar archivos xlsx y librerias

# Instalar la biblioteca
#install.packages('readxl') #Se Instala 1 sola vez

# Asi se llama a la biblioteca
#library(readxl)

# Llamamos la base igual que las veces anteriores (read_excel por read.csv)
#Datos1<-read_excel(file.choose())

4.-Inspeccionar datos

# Inspeccionar datos

#print(datos1)
#View(head(datos1))
head(datos1,7)

##   Tratamiento Presion
## 1           a     180
## 2           a     173
## 3           a     175
## 4           a     182
## 5           a     181
## 6           b     172
## 7           b     158

tail(datos1)

##    Tratamiento Presion
## 20           d     155
## 21           e     147
## 22           e     152
## 23           e     143
## 24           e     155
## 25           e     160

summary(datos1)

##  Tratamiento           Presion     
##  Length:25          Min.   :143.0  
##  Class :character   1st Qu.:158.0  
##  Mode  :character   Median :162.0  
##                     Mean   :163.7  
##                     3rd Qu.:172.0  
##                     Max.   :182.0

str(datos1)

## 'data.frame':    25 obs. of  2 variables:
##  $ Tratamiento: chr  "a" "a" "a" "a" ...
##  $ Presion    : int  180 173 175 182 181 172 158 167 160 175 ...

5.-Manipular datos

myurl="https://www.dropbox.com/s/rvhtipiaru8c3gz/atitanic.csv?dl=1"
datos7<-read.csv(url(myurl))
#View(datos7)

# Nuevo data Frame solo edad y sexo
Datos8<- datos7[,c(3,5)]
#View(Datos8)

# También se pueden especificar las variables por nombre
# Igual se pueden reordenar
Datos9<- datos7[,c("Age","Sex")]
#View(Datos9)

# Eliminar columnas
Datos10<-datos7[,c(-3,-5)]
#View(Datos10)

# Eliminar columna
Datos10$EPassengerId<-NULL
Datos10$Name<-NULL

# Seleccionar filas
Datos11<- datos7[5:9,]
#View(Datos11)

# Filtrar por condiciones
Datos12<- datos7[datos7$Age>=40,]
Datos13<- datos7[datos7$Age>=40&datos7$Sex=="male",]
Datos14<- datos7[datos7$Age>=50|datos7$Sex=="male",]
#View(Datos14)

6.-Regresión Lineal Simple

# Instalando las bibliotecas
#install.packages("lmtest")
#install.packages("readxl")
#install.packages("ggplot2")

# Lammamos las bibliotecas
# library(readxl)
# library(lmtest)
# library(ggplot2)

# Buscamos el archivo
#Datos1<-read_excel(file.choose())
# Datos1<-read_excel("C:/Users/Armando/Documents/borrar/gasto_crecimiento.xlsx")

# Ejecutamos la regresión simple
# regresion1<-lm(Tasa_Crecimiento~Gasto_Publico, Datos1)
# summary(regresion1)
# plot(Tasa_Crecimiento ~ Gasto_Publico, data=Datos1)
# plot(regresion1)

#Gráfico con ggplot


# ggplot(Datos1, aes(x=Gasto_Publico, y=Tasa_Crecimiento)) +
#   geom_point(size=2) + 
#   geom_smooth(method=lm, se=FALSE, fullrange=TRUE)