La data elegida del presente trabajo es acme parte del paquete csv. La data es el resumen del exceso mensual de devoluciones de la ____Corporación Acme Cleveland_. El rendimiento en exceso de la Corporación Acme Cleveland__ se registra junto con los de todas las acciones que figuran en las Bolsas de Valores de Nueva York y de Estados Unidos durante un período de cinco años. Estos rendimientos excesivos son relativos al rendimiento de una inversión sin riesgo, como las letras del Tesoro de los Estados Unidos.
library(tidyverse) # parte de los paquetes que queremos usar
setwd("C:/Users/ROCIO/Desktop/practicando") # activamos este paquete para usar una data que nos gusta
acme<-read.csv("acme (1).csv")
Esta data lo pueden encontrar [aquí] (https://vincentarelbundock.github.io/Rdatasets/datasets.html)
Para esta primera práctica usaré las funciones aprendidas de los paquetes de R desarrollado en la primera clase !
dim(acme)
## [1] 60 4
class(acme)
## [1] "data.frame"
sapply(acme,class)
## X month market acme
## "integer" "factor" "numeric" "numeric"
class(acme)
## [1] "data.frame"
summary(acme)
## X month market acme
## Min. : 1.00 1/86 : 1 Min. :-0.26208 Min. :-0.28480
## 1st Qu.:15.75 1/87 : 1 1st Qu.:-0.07901 1st Qu.:-0.13305
## Median :30.50 1/88 : 1 Median :-0.04487 Median :-0.08999
## Mean :30.50 1/89 : 1 Mean :-0.05117 Mean :-0.06897
## 3rd Qu.:45.25 1/90 : 1 3rd Qu.:-0.01159 3rd Qu.:-0.03149
## Max. :60.00 10/86 : 1 Max. : 0.07340 Max. : 0.24262
## (Other):54
Veamos si queremos saber cuantos periodos de market tiene segun el month.
acme %>% # se lee asi a la base de datos acme
group_by(month) %>% # agrupala por month
summarise(mediana_market=median(market,na.rm = T)) %>% # crea la variable median_market que se calcula como la mediana de la variable market.
arrange(desc(mediana_market)) # ordena de forma descendiente segun la variable mediana_market
## # A tibble: 60 x 2
## month mediana_market
## <fct> <dbl>
## 1 1/87 0.0734
## 2 12/87 0.0350
## 3 8/86 0.0302
## 4 5/90 0.0239
## 5 1/88 0.0127
## 6 2/86 0.00822
## 7 7/89 0.00344
## 8 10/86 0.00132
## 9 6/87 -0.00173
## 10 2/88 -0.00217
## # ... with 50 more rows
Veamos si queremos saber cuantos periodos de market y acme tiene segun el month.
acme %>% # se lee asi a la base de datos acme
group_by(month) %>% # agrupala por sexo
summarise(mediana_market=median(market,na.rm = T),
mediana_acme=median(acme,na.rm = T),
numero=n())# crea las variables median_market que se calcula como la mediana de la variable market; mediana_month que se calcula como la mediana de la variable month; y numero que se calcula como contar el numero de observaciones.
## # A tibble: 60 x 4
## month mediana_market mediana_acme numero
## <fct> <dbl> <dbl> <int>
## 1 1/86 -0.0611 0.0302 1
## 2 1/87 0.0734 0.0502 1
## 3 1/88 0.0127 -0.0635 1
## 4 1/89 -0.0115 -0.0157 1
## 5 1/90 -0.140 -0.120 1
## 6 10/86 0.00132 0.0348 1
## 7 10/87 -0.262 -0.285 1
## 8 10/88 -0.0453 -0.0841 1
## 9 10/89 -0.105 -0.126 1
## 10 10/90 -0.0760 -0.0705 1
## # ... with 50 more rows
Usemos mutate para crear nuevas variables, en este caso, el acme_market
acme %>% # se lee asi a la base de datos acme
mutate (acme_market = acme*10 ) %>%
group_by(acme,market) %>% # agrupala por acme y market
summarise(mediana_market=median(market,na.rm = T),
mediana_acme_market=median(acme_market,na.rm = T),
numero=n()) %>% # crea las variables median_educacion que se calcula como la mediana de la variable market; mediana_acme que se calcula como la mediana de la variable market; y numero que se calcula como contar el numero de observaciones.
arrange(desc(mediana_acme_market))# ordena de forma descendiente segun la variable mediana_acme_market
## # A tibble: 60 x 5
## # Groups: acme [60]
## acme market mediana_market mediana_acme_market numero
## <dbl> <dbl> <dbl> <dbl> <int>
## 1 0.243 0.0350 0.0350 2.43 1
## 2 0.236 -0.00890 -0.00890 2.36 1
## 3 0.202 -0.0735 -0.0735 2.02 1
## 4 0.150 -0.0362 -0.0362 1.50 1
## 5 0.111 -0.0116 -0.0116 1.11 1
## 6 0.0801 -0.00738 -0.00738 0.801 1
## 7 0.0734 0.0302 0.0302 0.734 1
## 8 0.0657 -0.0433 -0.0433 0.657 1
## 9 0.0545 -0.0404 -0.0404 0.545 1
## 10 0.0502 0.0734 0.0734 0.502 1
## # ... with 50 more rows