INTRODUCCIÓN
Los gráficos son una herramienta fundamental en el análisis de datos, permitiéndonos visualizar patrones, tendencias y relaciones dentro de nuestros conjuntos de datos. En el mundo del análisis de datos, R se ha establecido como una de las herramientas más poderosas y versátiles, ofreciendo una amplia gama de funciones y paquetes para la creación de gráficos de alta calidad.
Es una de las funciones más usadas para generar gráficos en R, por lo que puede representar gráficamente distintos tipos de datos además genera un nuevo gráfico cada vez que se ejecute.
La función plot en R permite crear un gráfico pasando: dos vectores (de la misma longitud), un data frame, una matriz o incluso otros objetos, dependiendo de su clase o tipo de los datos de entrada.
La función plot() en R es versátil y se utiliza para crear una variedad de gráficos y visualizaciones como:
La función hist(x) proporciona un histograma convencional, donde x es un vector de valores númericos.
El histograma es el gráfico estadístico por excelencia. El histograma de un conjunto de datos es un gráfico de barra que representan las frecuencias.
Por ejemplo:
Edad <- sample(18:30,10,T)
hist(Edad, col="yellow", main="Histograma de Frecuencias Absolutas")
En este código:
Este código generará un histograma con las frecuencias absolutas del vector Edad.
Edad <- sample(45.5:70,35,T)
hist(Edad, col="blue",las=2,xlim = c(45,70), ylim= c(0,0.05), freq=FALSE, main="Histograma de Frecuencias Relativas")
En este código:
Este código generará un histograma con las frecuencias relativas del vector Edad.
Los diagramas de dispersión permiten efectuar un diagnóstico visual de la posible relación (funcional) entre dos variables de naturaleza cuantitativa. La función que permite realizar este tipo de gráfico es plot(). Si solicitamos la ayuda de R sobre esta función (?plot), veremos que la función plot tiene un argumento llamado type que sirve para seleccionar el tipo de gráfico a dibujar. Las opciones de type son:
“p” para hacer un gráfico de puntos (es el tipo de gráfico por defecto). “l” para hacer un gráfico de líneas. “b” para hacer un gráfico de puntos y líneas (pero las líneas no entran en los puntos). “c” para hacer un gráfico de líneas (parten de los puntos, sin entrar, pero no se representan). “o” para hacer un gráfico de puntos y líneas (ahora las líneas entran en los puntos). “h” para hacer un histograma o un diagrama de barras. “s” para hacer un diagrama de escalera. Por defecto la opción plot es type=p. Por tanto, si queremos hacer un diagrama de dispersión para representar la nube de puntos no será necesario indicar el tipo de gráfico.
install.packages(“ggplot2”)
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.3
# Crear datos aleatorios
set.seed(123)
datos <- data.frame(
x = rnorm(100, mean = 50, sd = 10),
y = rnorm(100, mean = 50, sd = 10)
)
# Crear el diagrama de dispersión
ggplot(datos, aes(x = x, y = y)) +
geom_point() +
labs(title = "Diagrama de Dispersion",
x = "Variable X",
y = "Variable Y")
> > > >
La función pie toma un vector numérico que representa las proporciones de las diferentes partes del pastel y opcionalmente un vector de etiquetas que proporciona nombres para cada parte.
Primero, prepara tus datos. Tienes que tener un vector con los valores que quieres representar en el gráfico de pastel, así como un vector de etiquetas para cada categoría.
Por ejemplo:
# Vector de ventas totales.
ventas <- c(300, 500, 700, 400)
# Vector de etiquetas
categorias <- c( "Vestimenta", "Alimentación", "Salud","Educación")
Luego, usa la función pie para crear el gráfico de pastel:
pie(ventas, labels = categorias, main = "Distribución de Ventas por Categoría")
Opcionalmente, puedes personalizar el gráfico agregando un título y cambiando los colores de las porciones.
colores <- c("red", "blue", "green", "orange") # Definir colores
pie(ventas, labels = categorias, col = colores, main = "Distribución de Ventas por Categoría")
Diagrama de Caja y Bigotes
El diagrama de caja y bigotes, también conocido como boxplot, es una visualización estadística que proporciona una representación gráfica de la distribución de un conjunto de datos. Este gráfico es particularmente útil para resumir la dispersión y la forma de la distribución, así como para identificar valores atípicos.
install.packages(“ggplot2”)
# Cargar la librería ggplot2
library(ggplot2)
# Crear datos de ejemplo
datos <- data.frame(
Grupo = rep(c("A", "B", "C"), each = 100),
Valor = c(rnorm(100, mean = 10, sd = 2),
rnorm(100, mean = 15, sd = 3),
rnorm(100, mean = 12, sd = 1.5))
)
# Crear el diagrama de caja y bigotes
ggplot(datos, aes(x = Grupo, y = Valor, fill = Grupo)) +
geom_boxplot() +
labs(title = "Diagrama de Caja y Bigotes",
x = "Grupo",
y = "Valor") +
theme_minimal()
En este código:
ggplot2.ggplot() para iniciar el gráfico
y especificamos los datos y la estética.geom_boxplot() para crear el diagrama de caja
y bigotes.labs() para agregar etiquetas al título y a los
ejes x e y.theme_minimal() para darle al
gráfico un aspecto más limpio.Este código generará un gráfico de diagrama de caja y bigotes con tres grupos diferentes en el eje x y valores en el eje y.