Descripcion de la data

La data elegida del presente trabajo es acme parte del paquete csv. La data es el resumen del exceso mensual de devoluciones de la ____Corporación Acme Cleveland_. El rendimiento en exceso de la Corporación Acme Cleveland__ se registra junto con los de todas las acciones que figuran en las Bolsas de Valores de Nueva York y de Estados Unidos durante un período de cinco años. Estos rendimientos excesivos son relativos al rendimiento de una inversión sin riesgo, como las letras del Tesoro de los Estados Unidos.

library(tidyverse) # parte de los paquetes que queremos usar
setwd("C:/Users/ROCIO/Desktop/practicando") # activamos este paquete para usar una data que nos gusta
acme<-read.csv("acme (1).csv")

Principales datos

Esta data lo pueden encontrar [aquí] (https://vincentarelbundock.github.io/Rdatasets/datasets.html)

  1. Paquete: boot
  2. Nombre corto de la data: acme
  3. Nombre largo y original de la data: Monthly Excess Returns

Analisis descriptivo usando R

Para esta primera práctica usaré las funciones aprendidas de los paquetes de R desarrollado en la primera clase !

Codigo de R

dim(acme)
## [1] 60  4
class(acme)
## [1] "data.frame"
sapply(acme,class)
##         X     month    market      acme 
## "integer"  "factor" "numeric" "numeric"
class(acme)
## [1] "data.frame"
summary(acme)
##        X             month        market              acme         
##  Min.   : 1.00   1/86   : 1   Min.   :-0.26208   Min.   :-0.28480  
##  1st Qu.:15.75   1/87   : 1   1st Qu.:-0.07901   1st Qu.:-0.13305  
##  Median :30.50   1/88   : 1   Median :-0.04487   Median :-0.08999  
##  Mean   :30.50   1/89   : 1   Mean   :-0.05117   Mean   :-0.06897  
##  3rd Qu.:45.25   1/90   : 1   3rd Qu.:-0.01159   3rd Qu.:-0.03149  
##  Max.   :60.00   10/86  : 1   Max.   : 0.07340   Max.   : 0.24262  
##                  (Other):54

Formato

  • month: Una cadena de caracteres que representa el mes de la observación.
  • ___market:___ El exceso de rentabilidad del mercado en su conjunto.
  • acme: Edad de las personas encuestadas.

Usando el tidyverse!

Veamos si queremos saber cuantos periodos de market tiene segun el month.

acme %>% # se lee asi a la base de datos acme
  group_by(month) %>% # agrupala por month
  summarise(mediana_market=median(market,na.rm = T)) %>%  # crea la variable median_market que se calcula como la mediana de la variable market.
  arrange(desc(mediana_market)) # ordena de forma descendiente segun la variable mediana_market
## # A tibble: 60 x 2
##    month mediana_market
##    <fct>          <dbl>
##  1 1/87         0.0734 
##  2 12/87        0.0350 
##  3 8/86         0.0302 
##  4 5/90         0.0239 
##  5 1/88         0.0127 
##  6 2/86         0.00822
##  7 7/89         0.00344
##  8 10/86        0.00132
##  9 6/87        -0.00173
## 10 2/88        -0.00217
## # ... with 50 more rows

Veamos si queremos saber cuantos periodos de market y acme tiene segun el month.

acme %>% # se lee asi a la base de datos acme
  group_by(month) %>% # agrupala por sexo
  summarise(mediana_market=median(market,na.rm = T),
            mediana_acme=median(acme,na.rm = T),
            numero=n())# crea las variables median_market que se calcula como la mediana de la variable market; mediana_month que se calcula como la mediana de la variable month; y numero que se calcula como contar el numero de observaciones.
## # A tibble: 60 x 4
##    month mediana_market mediana_acme numero
##    <fct>          <dbl>        <dbl>  <int>
##  1 1/86        -0.0611        0.0302      1
##  2 1/87         0.0734        0.0502      1
##  3 1/88         0.0127       -0.0635      1
##  4 1/89        -0.0115       -0.0157      1
##  5 1/90        -0.140        -0.120       1
##  6 10/86        0.00132       0.0348      1
##  7 10/87       -0.262        -0.285       1
##  8 10/88       -0.0453       -0.0841      1
##  9 10/89       -0.105        -0.126       1
## 10 10/90       -0.0760       -0.0705      1
## # ... with 50 more rows

Usemos mutate para crear nuevas variables, en este caso, el acme_market

acme %>% # se lee asi a la base de datos acme
  mutate (acme_market = acme*10 ) %>% 
  group_by(acme,market) %>% # agrupala por acme y market
  summarise(mediana_market=median(market,na.rm = T),
            mediana_acme_market=median(acme_market,na.rm = T),
            numero=n()) %>% # crea las variables median_educacion que se calcula como la mediana de la variable market; mediana_acme que se calcula como la mediana de la variable market; y numero que se calcula como contar el numero de observaciones.
  arrange(desc(mediana_acme_market))# ordena de forma descendiente segun la variable mediana_acme_market
## # A tibble: 60 x 5
## # Groups:   acme [60]
##      acme   market mediana_market mediana_acme_market numero
##     <dbl>    <dbl>          <dbl>               <dbl>  <int>
##  1 0.243   0.0350         0.0350                2.43       1
##  2 0.236  -0.00890       -0.00890               2.36       1
##  3 0.202  -0.0735        -0.0735                2.02       1
##  4 0.150  -0.0362        -0.0362                1.50       1
##  5 0.111  -0.0116        -0.0116                1.11       1
##  6 0.0801 -0.00738       -0.00738               0.801      1
##  7 0.0734  0.0302         0.0302                0.734      1
##  8 0.0657 -0.0433        -0.0433                0.657      1
##  9 0.0545 -0.0404        -0.0404                0.545      1
## 10 0.0502  0.0734         0.0734                0.502      1
## # ... with 50 more rows