Tarea Libre - Usando base de dato del SP500 y Fallecidos Covid en la primera parte de la pandemia

Ilan Ben-Dov, Edwyn Turner, Florencia Olbertz

Primera parte utilizaremos datos del SP500.

Primero limpiamos el enviroment Instalamos packetes necesarios, y los corremos con library

library(data.table)
library(tidyverse)
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.1 ──
## ✓ ggplot2 3.3.3     ✓ purrr   0.3.4
## ✓ tibble  3.1.0     ✓ dplyr   1.0.5
## ✓ tidyr   1.1.3     ✓ stringr 1.4.0
## ✓ readr   1.4.0     ✓ forcats 0.5.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## x dplyr::between()   masks data.table::between()
## x dplyr::filter()    masks stats::filter()
## x dplyr::first()     masks data.table::first()
## x dplyr::lag()       masks stats::lag()
## x dplyr::last()      masks data.table::last()
## x purrr::transpose() masks data.table::transpose()
library(leaflet)
library(sp)
library(broom)
library(janitor)
## 
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
## 
##     chisq.test, fisher.test
library(rgbif)
library(sf)
## Linking to GEOS 3.8.1, GDAL 3.1.4, PROJ 6.3.1
library(chilemapas)
## Registered S3 method overwritten by 'geojsonlint':
##   method         from 
##   print.location dplyr

Cargamos el packete que tiene la información del Censo

sp500 <- fread("/Users/kiwixx/Desktop/Data Science/financials.csv")
as.data.table(sp500)
##      Symbol                   Name                 Sector  Price Price/Earnings
##   1:    MMM             3M Company            Industrials 222.89          24.31
##   2:    AOS        A.O. Smith Corp            Industrials  60.24          27.76
##   3:    ABT    Abbott Laboratories            Health Care  56.27          22.51
##   4:   ABBV            AbbVie Inc.            Health Care 108.48          19.41
##   5:    ACN          Accenture plc Information Technology 150.51          25.47
##  ---                                                                           
## 501:    XYL             Xylem Inc.            Industrials  70.24          30.94
## 502:    YUM        Yum! Brands Inc Consumer Discretionary  76.30          27.25
## 503:    ZBH Zimmer Biomet Holdings            Health Care 115.53          14.32
## 504:   ZION          Zions Bancorp             Financials  50.71          17.73
## 505:    ZTS                 Zoetis            Health Care  71.51          32.80
##      Dividend Yield Earnings/Share 52 Week Low 52 Week High   Market Cap
##   1:      2.3328617           7.92      259.77      175.490 138721055226
##   2:      1.1479592           1.70       68.39       48.925  10783419933
##   3:      1.9089824           0.26       64.60       42.280 102121042306
##   4:      2.4995599           3.29      125.86       60.050 181386347059
##   5:      1.7144699           5.44      162.60      114.820  98765855553
##  ---                                                                    
## 501:      1.1700794           1.83       76.81       46.860  12915021000
## 502:      1.7970798           4.07       86.93       62.850  27003303098
## 503:      0.7948336           9.01      133.49      108.170  24454698119
## 504:      1.4809330           2.60       55.61       38.430  10670678640
## 505:      0.6823720           1.65       80.13       52.000  35991109776
##           EBITDA Price/Sales Price/Book
##   1:  9048000000    4.390271      11.34
##   2:   601000000    3.575483       6.35
##   3:  5744000000    3.740480       3.19
##   4: 10310000000    6.291571      26.14
##   5:  5643228000    2.604117      10.62
##  ---                                   
## 501:   722000000    2.726209       5.31
## 502:  2289000000    6.313636     212.08
## 503:  2007400000    3.164895       2.39
## 504:           0    3.794579       1.42
## 505:  1734000000    9.280896      18.09
##                                                             SEC Filings
##   1:  http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=MMM
##   2:  http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=AOS
##   3:  http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=ABT
##   4: http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=ABBV
##   5:  http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=ACN
##  ---                                                                   
## 501:  http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=XYL
## 502:  http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=YUM
## 503:  http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=ZBH
## 504: http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=ZION
## 505:  http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=ZTS

Agregar un $ antes de todo los marketcaps

sp500 <- sp500[order(-`Market Cap`)]
#sp500[, `Market Cap` := ifelse(`Market Cap`, paste0("$",sp500$`Market Cap`), sp500$`Market Cap`)] 

Crear una nueva tabla que demuestre los top 10 Market Cap de la lista

top10 <- sp500[, .(`Market Cap`), by = "Name"]
top10 <- top10[1:10]
top10
##                     Name   Market Cap
##  1:           Apple Inc. 809508034020
##  2: Alphabet Inc Class A 733823966137
##  3: Alphabet Inc Class C 728535558140
##  4:      Microsoft Corp. 689978437468
##  5:       Amazon.com Inc 685873374731
##  6:       Facebook, Inc. 523423036576
##  7: JPMorgan Chase & Co. 386613611000
##  8:    Johnson & Johnson 353062464971
##  9:    Exxon Mobil Corp. 326148660000
## 10: Bank of America Corp 321478200969

Crear un pie chart que represente la represenaticón de las 10 compañias mas grandes

number <- as.numeric(top10$`Market Cap`)
ggplot(data = top10, aes(x = Name, y = number, fill = Name)) +
  geom_bar(stat = "identity") +
  labs(title = "10 principales Capitalicaciónes Burstatiles del SP500 (Scientific Notation / Billones)", x = "Compañia", y="Capitalización Bursátil ") +
  scale_fill_discrete(name = "Name") +
  theme(axis.text.x = element_text(angle=90, vjust=0.5))

Filtrar el SP500 para obtener la cantidad de compañias por industrias

cantidad_industria <- sp500[, .N, by= Sector]

Crear un bar graph que nos muestre cual es la indsutria con mas compañias dentro del SP500

ggplot(data = cantidad_industria, aes(x = Sector, y = N, fill = Sector)) +
  geom_bar(stat = "identity") +
  labs(title = "Cantidad de compañias por sector en el SP500", x = "Industria", y="Cantidad de Compañias") +
  scale_fill_discrete(name = "Sector") +
  theme(axis.text.x = element_text(angle=90, vjust=0.5))

Concluciones de la información vista en los graficos anteriores

En el primer grafico podemos ver que APPLE es la compañia con el MARKET CAP mas alto. A la misma vez nos damos cuenta que en las primeras 10 compañias se pueden ver grandes diferencias dentro de sus valores bursatiles.

En si, sabiendo que esta información no es nueva ya que muestra que APPLE esta en 800 billones, cuando hoy en día ya paso los trillones, nos damos cuenta de la misma manera que ya lleva varios años como la compañia con la mayor capitalisacion bursatil.

En segundo lugar, en el segundo grafico podemos ver la diferencia dentro de las indsutrias presentes en el SP500. Sabemos a raiz de el filtro, y el grafico que la industria de “Consumer Discretionary” es la indsutria con mayores compañias dentro del SP500, mientras que la industria de “Telecomunication Services”, es la industria con la menor cantidad dentro del SP500.

Segunda base de dato - Esta base de dato no se relaciona con la primera parte y va a ser utilizada para analizar algo completmanete distinto.

Primero cargamos la nueva base de datos de datos COVID en Chile. Esta base de datos esta desactualizada pero nos muestra los datos de fallecidos desde 19-03-2020 hasta 28-08-2020

covid_fallecidos <- fread("/Users/kiwixx/Desktop/Data Science/fallecidos_hosp_region.csv")

Al ver la base de datos nos damos cuenta que ante cada region vemos “Regin de” y otras cosas raras y debemos eliminarlo. Para esto vamos agregar una variable y a esa ponerle el nombre adecuado.

covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Antofagasta", Region:= "Antofagasta"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Arica y Parinacota", Region:= "Arica y Parinacota"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Atacama", Region:= "Atacama"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Coquimbo", Region:= "Coquimbo"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de la Araucan<ed>a", Region:= "La Araucania"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Los Lagos", Region:= "Los Lagos"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Los R<ed>os", Region:= "Los Rios"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Magallanes y la Ant<e1>rtica Chilena", Region:= "Magallanes y la Antartica Chilena"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Tarapac<e1>", Region:= "Tarapaca"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Valpara<ed>so", Region:= "Valparaiso"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n del Biob<ed>o", Region:= "Bio-Bio"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n del Libertador General Bernardo OHiggins", Region:= "libertador General Bernardo OHiggins"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n del Maule", Region:= "Maule"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n del <d1>uble", Region:= "Ñuble"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n Metropolitana de Santiago", Region:= "Metropolitana de Santiago"]

Ahora filtramos por region

Al tener el filtro de fallecidos por region, vamos a crear un mapa para poder ver donde se centra esto mayoritariamente Para esto debemos hacer varias costas distintas que nos daran el acceso a los mapas y sus formas

library(chilemapas)
library(leaflet)
library(tidyverse)
library(sf)
library(maps)
## 
## Attaching package: 'maps'
## The following object is masked from 'package:purrr':
## 
##     map

Despues de varios intentos de conectar fallecidos_region con chile mapas, o con muchos otros metodos para crear un mapa, no pudimos lograrlo. Por esto mismo decidimos dejar esta parte hasta aqui para poder preguntar en clase como hacerlo.