3.1.- Importar archivos xlsx y bibliotecas
4.-Inspeccionar datos
5.-Manipular datos
6.-Regresión Lineal Simple
# View-- panes --pane layout
# Diferencias entre consola y fuente
a=10
b=15
a+b
## [1] 25
a<-10
b<-15
a+b
## [1] 25
c<-a+b
print(c)
## [1] 25
a<-10
b<-15
c<-a+b
print(c)
## [1] 25
# Comentarios
# ctrl + shif + c Comentario multilinea
# ctrl + enter Ejecutar código seleccionado
# ctrl + l Limpiar la consola
# ctrl + s Guardar
# alt 126 ~
# alt +91 +93 []
# alt +123 125 {}
# alt +38 &
# alt +124 |
# Importar Archivos desde ruta
datos1= read.csv("C:/Users/Armando/Documents/borrar/iris.csv")
#print(datos1)
#View(datos1)
# Importar archivo desde directorio
# ver directorio
#getwd()
# Cambiar directorio
#setwd("C:/Users/Armando/Desktop/Proyectos Github/basicos_r_parte_I")
# Estando en el directorio solo se llama por el nombre del archivo
#datos1=read.csv("iris.csv")
#View(datos1)
# Importar archivos desde navegador windows
#datos1 <- read.csv(file.choose(), stringsAsFactors = TRUE)
#View(datos1)
# Importar desde la nube
myurl="https://docs.google.com/spreadsheets/d/1_3FfbYFKWrUQWb8inaFe6D2uharQfAbcPXDGVmXERSY/pub?gid=0&single=true&output=csv"
datos1<-read.csv(url(myurl))
#View(datos1)
# Obtener links desde la nube
# Importar una Spreadsheet de Google
# 1.-Se da click en Archivo-> Publicar en la web (no se toma el link que da)
# 2.-Se copia este link y se reemplaza por el key del original (puede ser csv o xlsx)
# https://docs.google.com/spreadsheets/d/KEY/pub?gid=0&single=true&output=csv
# https://docs.google.com/spreadsheets/d/KEY/pub?gid=0&single=true&output=xlsx
# Traer archivos desde DropBox
# 1.-Darle click en compartir
# 2.-Darle click en copiar vínculo
# 3.-Cambiar "dl=0" por "dl=1"
# Instalar la biblioteca
#install.packages('readxl') #Se Instala 1 sola vez
# Asi se llama a la biblioteca
#library(readxl)
# Llamamos la base igual que las veces anteriores (read_excel por read.csv)
#Datos1<-read_excel(file.choose())
# Inspeccionar datos
#print(datos1)
#View(head(datos1))
head(datos1,7)
## Tratamiento Presion
## 1 a 180
## 2 a 173
## 3 a 175
## 4 a 182
## 5 a 181
## 6 b 172
## 7 b 158
tail(datos1)
## Tratamiento Presion
## 20 d 155
## 21 e 147
## 22 e 152
## 23 e 143
## 24 e 155
## 25 e 160
summary(datos1)
## Tratamiento Presion
## Length:25 Min. :143.0
## Class :character 1st Qu.:158.0
## Mode :character Median :162.0
## Mean :163.7
## 3rd Qu.:172.0
## Max. :182.0
str(datos1)
## 'data.frame': 25 obs. of 2 variables:
## $ Tratamiento: chr "a" "a" "a" "a" ...
## $ Presion : int 180 173 175 182 181 172 158 167 160 175 ...
myurl="https://www.dropbox.com/s/rvhtipiaru8c3gz/atitanic.csv?dl=1"
datos7<-read.csv(url(myurl))
#View(datos7)
# Nuevo data Frame solo edad y sexo
Datos8<- datos7[,c(3,5)]
#View(Datos8)
# También se pueden especificar las variables por nombre
# Igual se pueden reordenar
Datos9<- datos7[,c("Age","Sex")]
#View(Datos9)
# Eliminar columnas
Datos10<-datos7[,c(-3,-5)]
#View(Datos10)
# Eliminar columna
Datos10$EPassengerId<-NULL
Datos10$Name<-NULL
# Seleccionar filas
Datos11<- datos7[5:9,]
#View(Datos11)
# Filtrar por condiciones
Datos12<- datos7[datos7$Age>=40,]
Datos13<- datos7[datos7$Age>=40&datos7$Sex=="male",]
Datos14<- datos7[datos7$Age>=50|datos7$Sex=="male",]
#View(Datos14)
# Instalando las bibliotecas
#install.packages("lmtest")
#install.packages("readxl")
#install.packages("ggplot2")
# Lammamos las bibliotecas
# library(readxl)
# library(lmtest)
# library(ggplot2)
# Buscamos el archivo
#Datos1<-read_excel(file.choose())
# Datos1<-read_excel("C:/Users/Armando/Documents/borrar/gasto_crecimiento.xlsx")
# Ejecutamos la regresión simple
# regresion1<-lm(Tasa_Crecimiento~Gasto_Publico, Datos1)
# summary(regresion1)
# plot(Tasa_Crecimiento ~ Gasto_Publico, data=Datos1)
# plot(regresion1)
#Gráfico con ggplot
# ggplot(Datos1, aes(x=Gasto_Publico, y=Tasa_Crecimiento)) +
# geom_point(size=2) +
# geom_smooth(method=lm, se=FALSE, fullrange=TRUE)