Primero limpiamos el enviroment Instalamos packetes necesarios, y los corremos con library
library(data.table)
library(tidyverse)
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.1 ──
## ✓ ggplot2 3.3.3 ✓ purrr 0.3.4
## ✓ tibble 3.1.0 ✓ dplyr 1.0.5
## ✓ tidyr 1.1.3 ✓ stringr 1.4.0
## ✓ readr 1.4.0 ✓ forcats 0.5.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## x dplyr::between() masks data.table::between()
## x dplyr::filter() masks stats::filter()
## x dplyr::first() masks data.table::first()
## x dplyr::lag() masks stats::lag()
## x dplyr::last() masks data.table::last()
## x purrr::transpose() masks data.table::transpose()
library(leaflet)
library(sp)
library(broom)
library(janitor)
##
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
##
## chisq.test, fisher.test
library(rgbif)
library(sf)
## Linking to GEOS 3.8.1, GDAL 3.1.4, PROJ 6.3.1
library(chilemapas)
## Registered S3 method overwritten by 'geojsonlint':
## method from
## print.location dplyr
Cargamos el packete que tiene la información del Censo
sp500 <- fread("/Users/kiwixx/Desktop/Data Science/financials.csv")
as.data.table(sp500)
## Symbol Name Sector Price Price/Earnings
## 1: MMM 3M Company Industrials 222.89 24.31
## 2: AOS A.O. Smith Corp Industrials 60.24 27.76
## 3: ABT Abbott Laboratories Health Care 56.27 22.51
## 4: ABBV AbbVie Inc. Health Care 108.48 19.41
## 5: ACN Accenture plc Information Technology 150.51 25.47
## ---
## 501: XYL Xylem Inc. Industrials 70.24 30.94
## 502: YUM Yum! Brands Inc Consumer Discretionary 76.30 27.25
## 503: ZBH Zimmer Biomet Holdings Health Care 115.53 14.32
## 504: ZION Zions Bancorp Financials 50.71 17.73
## 505: ZTS Zoetis Health Care 71.51 32.80
## Dividend Yield Earnings/Share 52 Week Low 52 Week High Market Cap
## 1: 2.3328617 7.92 259.77 175.490 138721055226
## 2: 1.1479592 1.70 68.39 48.925 10783419933
## 3: 1.9089824 0.26 64.60 42.280 102121042306
## 4: 2.4995599 3.29 125.86 60.050 181386347059
## 5: 1.7144699 5.44 162.60 114.820 98765855553
## ---
## 501: 1.1700794 1.83 76.81 46.860 12915021000
## 502: 1.7970798 4.07 86.93 62.850 27003303098
## 503: 0.7948336 9.01 133.49 108.170 24454698119
## 504: 1.4809330 2.60 55.61 38.430 10670678640
## 505: 0.6823720 1.65 80.13 52.000 35991109776
## EBITDA Price/Sales Price/Book
## 1: 9048000000 4.390271 11.34
## 2: 601000000 3.575483 6.35
## 3: 5744000000 3.740480 3.19
## 4: 10310000000 6.291571 26.14
## 5: 5643228000 2.604117 10.62
## ---
## 501: 722000000 2.726209 5.31
## 502: 2289000000 6.313636 212.08
## 503: 2007400000 3.164895 2.39
## 504: 0 3.794579 1.42
## 505: 1734000000 9.280896 18.09
## SEC Filings
## 1: http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=MMM
## 2: http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=AOS
## 3: http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=ABT
## 4: http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=ABBV
## 5: http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=ACN
## ---
## 501: http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=XYL
## 502: http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=YUM
## 503: http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=ZBH
## 504: http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=ZION
## 505: http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=ZTS
Agregar un $ antes de todo los marketcaps
sp500 <- sp500[order(-`Market Cap`)]
#sp500[, `Market Cap` := ifelse(`Market Cap`, paste0("$",sp500$`Market Cap`), sp500$`Market Cap`)]
Crear una nueva tabla que demuestre los top 10 Market Cap de la lista
top10 <- sp500[, .(`Market Cap`), by = "Name"]
top10 <- top10[1:10]
top10
## Name Market Cap
## 1: Apple Inc. 809508034020
## 2: Alphabet Inc Class A 733823966137
## 3: Alphabet Inc Class C 728535558140
## 4: Microsoft Corp. 689978437468
## 5: Amazon.com Inc 685873374731
## 6: Facebook, Inc. 523423036576
## 7: JPMorgan Chase & Co. 386613611000
## 8: Johnson & Johnson 353062464971
## 9: Exxon Mobil Corp. 326148660000
## 10: Bank of America Corp 321478200969
Crear un pie chart que represente la represenaticón de las 10 compañias mas grandes
number <- as.numeric(top10$`Market Cap`)
ggplot(data = top10, aes(x = Name, y = number, fill = Name)) +
geom_bar(stat = "identity") +
labs(title = "10 principales Capitalicaciónes Burstatiles del SP500 (Scientific Notation / Billones)", x = "Compañia", y="Capitalización Bursátil ") +
scale_fill_discrete(name = "Name") +
theme(axis.text.x = element_text(angle=90, vjust=0.5))
Filtrar el SP500 para obtener la cantidad de compañias por industrias
cantidad_industria <- sp500[, .N, by= Sector]
Crear un bar graph que nos muestre cual es la indsutria con mas compañias dentro del SP500
ggplot(data = cantidad_industria, aes(x = Sector, y = N, fill = Sector)) +
geom_bar(stat = "identity") +
labs(title = "Cantidad de compañias por sector en el SP500", x = "Industria", y="Cantidad de Compañias") +
scale_fill_discrete(name = "Sector") +
theme(axis.text.x = element_text(angle=90, vjust=0.5))
En el primer grafico podemos ver que APPLE es la compañia con el MARKET CAP mas alto. A la misma vez nos damos cuenta que en las primeras 10 compañias se pueden ver grandes diferencias dentro de sus valores bursatiles.
En si, sabiendo que esta información no es nueva ya que muestra que APPLE esta en 800 billones, cuando hoy en día ya paso los trillones, nos damos cuenta de la misma manera que ya lleva varios años como la compañia con la mayor capitalisacion bursatil.
En segundo lugar, en el segundo grafico podemos ver la diferencia dentro de las indsutrias presentes en el SP500. Sabemos a raiz de el filtro, y el grafico que la industria de “Consumer Discretionary” es la indsutria con mayores compañias dentro del SP500, mientras que la industria de “Telecomunication Services”, es la industria con la menor cantidad dentro del SP500.
Primero cargamos la nueva base de datos de datos COVID en Chile. Esta base de datos esta desactualizada pero nos muestra los datos de fallecidos desde 19-03-2020 hasta 28-08-2020
covid_fallecidos <- fread("/Users/kiwixx/Desktop/Data Science/fallecidos_hosp_region.csv")
Al ver la base de datos nos damos cuenta que ante cada region vemos “Regin de” y otras cosas raras y debemos eliminarlo. Para esto vamos agregar una variable y a esa ponerle el nombre adecuado.
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Antofagasta", Region:= "Antofagasta"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Arica y Parinacota", Region:= "Arica y Parinacota"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Atacama", Region:= "Atacama"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Coquimbo", Region:= "Coquimbo"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de la Araucan<ed>a", Region:= "La Araucania"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Los Lagos", Region:= "Los Lagos"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Los R<ed>os", Region:= "Los Rios"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Magallanes y la Ant<e1>rtica Chilena", Region:= "Magallanes y la Antartica Chilena"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Tarapac<e1>", Region:= "Tarapaca"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n de Valpara<ed>so", Region:= "Valparaiso"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n del Biob<ed>o", Region:= "Bio-Bio"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n del Libertador General Bernardo OHiggins", Region:= "libertador General Bernardo OHiggins"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n del Maule", Region:= "Maule"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n del <d1>uble", Region:= "Ñuble"]
covid_fallecidos <- covid_fallecidos[region_residencia == "Regi<f3>n Metropolitana de Santiago", Region:= "Metropolitana de Santiago"]
Ahora filtramos por region
Al tener el filtro de fallecidos por region, vamos a crear un mapa para poder ver donde se centra esto mayoritariamente Para esto debemos hacer varias costas distintas que nos daran el acceso a los mapas y sus formas
library(chilemapas)
library(leaflet)
library(tidyverse)
library(sf)
library(maps)
##
## Attaching package: 'maps'
## The following object is masked from 'package:purrr':
##
## map