This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
You can also embed plots, for example:
Note that the echo = FALSE parameter was added to the
code chunk to prevent printing of the R code that generated the
plot.
##Variables cualitativas y cuantitativas ##Variables cualitativas ##Variables categóricas y se dividen en dos: ordinales y nominales
##Variables cuantitativas ##Expresar numéricamente y se dividen en dos: discretas y continuas
##Paquetes
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(dslabs)
library(viridisLite)
library(RColorBrewer)
DATASET
data("murders")
Gráficos Diagramas de barras
levels(murders$region) #Cualitativa nominal
## [1] "Northeast" "South" "North Central" "West"
tabla <- table(murders$region)
tabla
##
## Northeast South North Central West
## 9 17 12 13
# Crear el gráfico de barras
barplot_heights <- barplot(tabla, main = "Diagrama de barras", ylab = "Frecuencia", xlab = "Regiones",ylim = c(0,20),col="purple")
# Añadir etiquetas a las barras
text(barplot_heights,
tabla,
labels = tabla,
pos = 3,
cex = 0.8,
col = "black")
##1. Poner el valor sobre cada columna
#help(“barplot”)
##DIAGRAMA DE TORTA
# Crear una tabla de frecuencias por región
tabla <- tapply(murders$total, murders$region, sum)
# Calcular porcentajes
porcentajes <- 100 * tabla / sum(tabla)
# Definir nombres de las regiones
nombres <- names(porcentajes)
# Definir colores para el gráfico
colores <- rainbow(length(porcentajes))
# Crear el diagrama circular
pie(porcentajes,
labels = paste(nombres, "\n", round(porcentajes, 1), "%"),
col = colores,
main = "Diagrama Circular de Asesinatos por Región",
border = colores)
# Añadir una leyenda
legend("bottomright",
legend = paste(nombres, "\n", round(porcentajes, 1), "%"),
cex = 0.75,
fill = colores)
##2.Crear tabla de porcentajes y gráficar mostrando el dato
Variables ordinales que requieren un orden específico.
region<-factor(murders$region,levels=c("South","West","North Central","Northeast"))
tabla1<-table(region)
barplot(tabla1)
# Cargar los paquetes necesarios
library(dslabs)
library(dplyr)
library(RColorBrewer)
# Cargar el conjunto de datos
data("murders")
# Calcular la tasa de asesinatos
murders <- murders %>% mutate(rate = total / population * 100000)
# Crear el histograma
hist_data <- hist(murders$rate,
main = "Histograma de la tasa de asesinatos en EEUU",
xlim = c(0, 20),
ylim = c(0, 25),
col = brewer.pal(3, "Paired")[1:3],
xlab = "Tasa de asesinatos",
border = brewer.pal(3, "Paired")[1:3],
xaxt = "n") # Desactiva los ejes X predeterminados
# Añadir etiquetas a las barras
text(hist_data$mids,
hist_data$counts,
labels = hist_data$counts,
pos = 3,
cex = 0.8,
col = "black")
# Personalizar las marcas del eje X
axis(1, at = seq(0, 20, by = 1)) # Ajusta el eje X para mostrar marcas de 1 en 1
Boxplot
# Cargar los paquetes necesarios
library(dslabs)
library(dplyr)
# Cargar el conjunto de datos
data("murders")
# Calcular la tasa de asesinatos
murders <- murders %>% mutate(rate = total / population * 100000)
# Crear el boxplot
boxplot(murders$rate,
col = "Blue",
ylab = "Tasa de asesinatos",
outline = FALSE,
main = "Boxplot",
ylim = c(0, 6))
# Calcular estadísticas de resumen
media <- mean(murders$rate)
mediana <- median(murders$rate)
cuartil1 <- quantile(murders$rate, 0.25)
cuartil3 <- quantile(murders$rate, 0.75)
# Adicionar la media y la mediana al boxplot
points(x = 1, y = media, col = "black", pch = 20) # Media
points(x = 1, y = mediana, col = "red", pch = 17) # Mediana
# Añadir texto para la media y la mediana
text(x = 1.1, y = media, labels = paste("Media:", round(media, 2)), pos = 4, col = "black")
text(x = 1.1, y = mediana, labels = paste("Mediana:", round(mediana, 2)), pos = 4, col = "red")
# Opcional: Añadir texto para cuartiles si es necesario
text(x = 1.1, y = cuartil1, labels = paste("Q1:", round(cuartil1, 2)), pos = 4, col = "blue")
text(x = 1.1, y = cuartil3, labels = paste("Q3:", round(cuartil3, 2)), pos = 4, col = "blue")
summary(murders$rate)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.3196 1.2526 2.6871 2.7791 3.3861 16.4528