Universidad Central del Ecuador

INTRODUCCIÓN

Los gráficos son una herramienta fundamental en el análisis de datos, permitiéndonos visualizar patrones, tendencias y relaciones dentro de nuestros conjuntos de datos. En el mundo del análisis de datos, R se ha establecido como una de las herramientas más poderosas y versátiles, ofreciendo una amplia gama de funciones y paquetes para la creación de gráficos de alta calidad.

Función PLOT ()

Es una de las funciones más usadas para generar gráficos en R, por lo que puede representar gráficamente distintos tipos de datos además genera un nuevo gráfico cada vez que se ejecute.

La función plot en R permite crear un gráfico pasando: dos vectores (de la misma longitud), un data frame, una matriz o incluso otros objetos, dependiendo de su clase o tipo de los datos de entrada.

La función plot() en R es versátil y se utiliza para crear una variedad de gráficos y visualizaciones como:

Función hist()

La función hist(x) proporciona un histograma convencional, donde x es un vector de valores númericos.

  • Histograma

El histograma es el gráfico estadístico por excelencia. El histograma de un conjunto de datos es un gráfico de barra que representan las frecuencias.

Por ejemplo:

Edad <- sample(18:30,10,T)
hist(Edad, col="yellow", main="Histograma de Frecuencias Absolutas")

En este código:

  • Primero, se asigna un vector llamado “Edad”, con números aleatorios.
  • Luego, utilizamos la función HIST().
  • Dentro de la función colocamos el vector, colocamos un color en las columnas del histograma y se coloca un título del histograma.

Este código generará un histograma con las frecuencias absolutas del vector Edad.

Edad <- sample(45.5:70,35,T)
hist(Edad, col="blue",las=2,xlim = c(45,70), ylim= c(0,0.05), freq=FALSE, main="Histograma de Frecuencias Relativas")

En este código:

  • Primero, se asigna un vector llamado “Edad”, con números aleatorios.
  • Luego, utilizamos la función HIST().
  • Dentro de la función colocamos el vector, colocamos un color en las columnas del histograma, se delimitan los limites de cada uno de los ejes y por último, se coloca un título del histograma.

Este código generará un histograma con las frecuencias relativas del vector Edad.

  • Diagrama de dispersión

Los diagramas de dispersión permiten efectuar un diagnóstico visual de la posible relación (funcional) entre dos variables de naturaleza cuantitativa. La función que permite realizar este tipo de gráfico es plot(). Si solicitamos la ayuda de R sobre esta función (?plot), veremos que la función plot tiene un argumento llamado type que sirve para seleccionar el tipo de gráfico a dibujar. Las opciones de type son:

“p” para hacer un gráfico de puntos (es el tipo de gráfico por defecto). “l” para hacer un gráfico de líneas. “b” para hacer un gráfico de puntos y líneas (pero las líneas no entran en los puntos). “c” para hacer un gráfico de líneas (parten de los puntos, sin entrar, pero no se representan). “o” para hacer un gráfico de puntos y líneas (ahora las líneas entran en los puntos). “h” para hacer un histograma o un diagrama de barras. “s” para hacer un diagrama de escalera. Por defecto la opción plot es type=p. Por tanto, si queremos hacer un diagrama de dispersión para representar la nube de puntos no será necesario indicar el tipo de gráfico.

install.packages(“ggplot2”)

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.3
# Crear datos aleatorios 
set.seed(123)
datos <- data.frame(
  x = rnorm(100, mean = 50, sd = 10),
  y = rnorm(100, mean = 50, sd = 10)
)

# Crear el diagrama de dispersión
ggplot(datos, aes(x = x, y = y)) + 
  geom_point() +
  labs(title = "Diagrama de Dispersion",
       x = "Variable X",
       y = "Variable Y")

> > > >

Funcion PIE()

La función pie toma un vector numérico que representa las proporciones de las diferentes partes del pastel y opcionalmente un vector de etiquetas que proporciona nombres para cada parte.

  • Diagrama de sectotres o pastel

Primero, prepara tus datos. Tienes que tener un vector con los valores que quieres representar en el gráfico de pastel, así como un vector de etiquetas para cada categoría.

Por ejemplo:

# Vector de ventas totales.
ventas <- c(300, 500, 700, 400)
# Vector de etiquetas
categorias <- c( "Vestimenta", "Alimentación", "Salud","Educación")

Luego, usa la función pie para crear el gráfico de pastel:

pie(ventas, labels = categorias, main = "Distribución de Ventas por Categoría")

Opcionalmente, puedes personalizar el gráfico agregando un título y cambiando los colores de las porciones.

colores <- c("red", "blue", "green", "orange")  # Definir colores
pie(ventas, labels = categorias, col = colores, main = "Distribución de Ventas por Categoría")

Diagrama de Caja y Bigotes

El diagrama de caja y bigotes, también conocido como boxplot, es una visualización estadística que proporciona una representación gráfica de la distribución de un conjunto de datos. Este gráfico es particularmente útil para resumir la dispersión y la forma de la distribución, así como para identificar valores atípicos.

install.packages(“ggplot2”)

# Cargar la librería ggplot2
library(ggplot2)

# Crear datos de ejemplo
datos <- data.frame(
  Grupo = rep(c("A", "B", "C"), each = 100),
  Valor = c(rnorm(100, mean = 10, sd = 2),
            rnorm(100, mean = 15, sd = 3),
            rnorm(100, mean = 12, sd = 1.5))
)

# Crear el diagrama de caja y bigotes
ggplot(datos, aes(x = Grupo, y = Valor, fill = Grupo)) +
  geom_boxplot() +
  labs(title = "Diagrama de Caja y Bigotes",
       x = "Grupo",
       y = "Valor") +
  theme_minimal()

En este código:

  • Primero, cargamos la librería ggplot2.
  • Luego, creamos datos de ejemplo con tres grupos diferentes (A, B y C) con valores generados aleatoriamente.
  • Utilizamos la función ggplot() para iniciar el gráfico y especificamos los datos y la estética.
  • Agregamos geom_boxplot() para crear el diagrama de caja y bigotes.
  • Usamos labs() para agregar etiquetas al título y a los ejes x e y.
  • Finalmente, aplicamos theme_minimal() para darle al gráfico un aspecto más limpio.

Este código generará un gráfico de diagrama de caja y bigotes con tres grupos diferentes en el eje x y valores en el eje y.