Calcule el sesgo de la variable Casos Totales. Modifique este sesgo utilizando una transformación logarĆtmica y observe las diferencias analĆtica y grĆ”ficamente.
# Deshabilitar notacion cientifica
options(scipen=999)
data = read.csv("Covid_Worldmeters_May_3_2021.csv", sep=";")
variable = data$Total.Cases
mediana = median(variable)
media = mean(variable)
sd = sd(variable)
sesgo = (3* (media - mediana)) / sd
print(sesgo)
## [1] 0.8033219
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.0.4
qplot(variable, geom="histogram", bins=50, xlab=c("Casos Totales"), ylab="Frecuencia", main="Histograma Cantidad de casos totales")
data$variable_t = log10(variable)
qplot(data$variable_t, geom="histogram", bins=50, xlab=c("Casos Totales Transformada"), ylab="Frecuencia", main="Histograma Cantidad de casos totales Transformada")
mediana_t = median(data$variable_t)
media_t = mean(data$variable_t)
sd_t = sd(data$variable_t)
sesgo_t = (3* (media_t - mediana_t)) / sd_t
print(sesgo_t)
## [1] -0.3223895
Calcule quĆ© porcentaje de la población representan los casos totales de cada paĆs y utilice una discretización de igual frecuencia con de 5 etiquetas.
# Calculo el porcentaje de casos sobre la población
data$Porcentaje = round((data$Total.Cases/data$Population) * 100,2)
library(arules)
## Warning: package 'arules' was built under R version 4.0.4
## Loading required package: Matrix
##
## Attaching package: 'arules'
## The following objects are masked from 'package:base':
##
## abbreviate, write
variable = data$Porcentaje
breaks = 5
# discretización de igual frecuencia
data$disc_variable_frequency = arules::discretize(variable, method = "frequency", breaks = breaks, labels=c("muy_bajo", "bajo", "medio", "alto", "muy_alto"))
Visualice quƩ paises caen en el intervalo de mayor porcentaje de casos. Pertenece Argentina a dicho conjunto?
paises = read.csv("CountryCodes.csv", sep=";")
top_paises <- merge(data,paises,by.x="Country.Other",by.y="Country")
top_casos_porc = top_paises[top_paises$disc_variable_frequency == "muy_alto", ]
library(highcharter)
## Warning: package 'highcharter' was built under R version 4.0.5
## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
hcmap(
map = "custom/world-highres3", # Plantilla Mapa mundial
data = top_casos_porc, # Dataset
value = "Porcentaje", # El valor que quiero dibujar
name = "% casos en población", # Nombre de la serie
showInLegend = TRUE) %>%
hc_mapNavigation(enabled = TRUE) %>% # Para hacer zoom
hc_title(text = "Paises con 'Muy Alta' cantidad de casos")