R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.

##Variables cualitativas y cuantitativas ##Variables cualitativas ##Variables categóricas y se dividen en dos: ordinales y nominales

##Variables cuantitativas ##Expresar numéricamente y se dividen en dos: discretas y continuas

##Paquetes

library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Adjuntando el paquete: ‘dplyr’

library(dslabs)
library(viridisLite)
library(RColorBrewer)

DATASET

data("murders")

Gráficos Diagramas de barras

levels(murders$region) #Cualitativa nominal
## [1] "Northeast"     "South"         "North Central" "West"
tabla <- table(murders$region)
tabla
## 
##     Northeast         South North Central          West 
##             9            17            12            13
# Crear el gráfico de barras
barplot_heights <- barplot(tabla, main = "Diagrama de barras", ylab = "Frecuencia", xlab = "Regiones",ylim = c(0,20),col="purple")

# Añadir etiquetas a las barras
text(barplot_heights, 
     tabla, 
     labels = tabla, 
     pos = 3, 
     cex = 0.8, 
     col = "black")

##1. Poner el valor sobre cada columna

#help(“barplot”)

##DIAGRAMA DE TORTA

# Crear una tabla de frecuencias por región
tabla <- tapply(murders$total, murders$region, sum)

# Calcular porcentajes
porcentajes <- 100 * tabla / sum(tabla)

# Definir nombres de las regiones
nombres <- names(porcentajes)
# Definir colores para el gráfico
colores <- rainbow(length(porcentajes))

# Crear el diagrama circular
pie(porcentajes, 
    labels = paste(nombres, "\n", round(porcentajes, 1), "%"), 
    col = colores, 
    main = "Diagrama Circular de Asesinatos por Región", 
    border = colores)

# Añadir una leyenda
legend("bottomright", 
       legend = paste(nombres, "\n", round(porcentajes, 1), "%"), 
       cex = 0.75, 
       fill = colores)

##2.Crear tabla de porcentajes y gráficar mostrando el dato

Variables ordinales que requieren un orden específico.

region<-factor(murders$region,levels=c("South","West","North Central","Northeast"))
tabla1<-table(region)
barplot(tabla1)

# Cargar los paquetes necesarios
library(dslabs)
library(dplyr)
library(RColorBrewer)

# Cargar el conjunto de datos
data("murders")

# Calcular la tasa de asesinatos
murders <- murders %>% mutate(rate = total / population * 100000)

# Crear el histograma
hist_data <- hist(murders$rate, 
                  main = "Histograma de la tasa de asesinatos en EEUU", 
                  xlim = c(0, 20), 
                  ylim = c(0, 25), 
                  col = brewer.pal(3, "Paired")[1:3], 
                  xlab = "Tasa de asesinatos", 
                  border = brewer.pal(3, "Paired")[1:3], 
                  xaxt = "n")  # Desactiva los ejes X predeterminados

# Añadir etiquetas a las barras
text(hist_data$mids, 
     hist_data$counts, 
     labels = hist_data$counts, 
     pos = 3, 
     cex = 0.8, 
     col = "black")

# Personalizar las marcas del eje X
axis(1, at = seq(0, 20, by = 1))  # Ajusta el eje X para mostrar marcas de 1 en 1

Boxplot

# Cargar los paquetes necesarios
library(dslabs)
library(dplyr)

# Cargar el conjunto de datos
data("murders")

# Calcular la tasa de asesinatos
murders <- murders %>% mutate(rate = total / population * 100000)

# Crear el boxplot
boxplot(murders$rate, 
        col = "Blue", 
        ylab = "Tasa de asesinatos", 
        outline = FALSE, 
        main = "Boxplot", 
        ylim = c(0, 6))

# Calcular estadísticas de resumen
media <- mean(murders$rate)
mediana <- median(murders$rate)
cuartil1 <- quantile(murders$rate, 0.25)
cuartil3 <- quantile(murders$rate, 0.75)

# Adicionar la media y la mediana al boxplot
points(x = 1, y = media, col = "black", pch = 20)  # Media
points(x = 1, y = mediana, col = "red", pch = 17)  # Mediana

# Añadir texto para la media y la mediana
text(x = 1.1, y = media, labels = paste("Media:", round(media, 2)), pos = 4, col = "black")
text(x = 1.1, y = mediana, labels = paste("Mediana:", round(mediana, 2)), pos = 4, col = "red")

# Opcional: Añadir texto para cuartiles si es necesario
text(x = 1.1, y = cuartil1, labels = paste("Q1:", round(cuartil1, 2)), pos = 4, col = "blue")
text(x = 1.1, y = cuartil3, labels = paste("Q3:", round(cuartil3, 2)), pos = 4, col = "blue")

summary(murders$rate)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.3196  1.2526  2.6871  2.7791  3.3861 16.4528