data.frame: La función data.frame se utiliza para crear un data frame en R. Nombre, Edad, Puntuacion: Son los nombres de las columnas del data frame. c(…): Se utiliza para definir vectores con los datos de cada columna. Cálculos Estadísticos:
mean(estudiantes\(Puntuacion): Calcula la media de la columna 'Puntuacion'. sd(estudiantes\)Edad): Calcula la desviación estándar de la columna ‘Edad’. Impresión de Resultados:
cat(…): Imprime los resultados en la consola. Se imprimen la media de las puntuaciones y la desviación estándar de las edades. Este código crea un data frame con información sobre estudiantes, calcula la media de las puntuaciones y la desviación estándar de las edades, y luego imprime estos resultados. Es un ejemplo básico de análisis de datos estadísticos utilizando R.
# Crear un data frame con datos de estudiantes (Nombre, Edad, Puntuación)
estudiantes <- data.frame(
Nombre = c("Ana", "Juan", "María", "Luis"),
Edad = c(20, 22, 21, 23),
Puntuacion = c(85, 90, 88, 92)
)
# Calcular la media de las puntuaciones
media_puntuacion <- mean(estudiantes$Puntuacion)
# Calcular la desviación estándar de las edades
desviacion_edad <- sd(estudiantes$Edad)
cat("Media de Puntuaciones:", media_puntuacion, "\n")
## Media de Puntuaciones: 88.75
cat("Desviación Estándar de Edades:", desviacion_edad, "\n")
## Desviación Estándar de Edades: 1.290994
# Añadir una nueva columna 'Aprobado' basada en la condición de puntuación
estudiantes$Aprobado <- estudiantes$Puntuacion >= 90
# Filtrar estudiantes mayores de 21 años
estudiantes_mayores <- subset(estudiantes, Edad > 21)
cat("\nData frame con nueva columna 'Aprobado':\n")
##
## Data frame con nueva columna 'Aprobado':
print(estudiantes)
## Nombre Edad Puntuacion Aprobado
## 1 Ana 20 85 FALSE
## 2 Juan 22 90 TRUE
## 3 María 21 88 FALSE
## 4 Luis 23 92 TRUE
cat("\nEstudiantes mayores de 21 años:\n")
##
## Estudiantes mayores de 21 años:
print(estudiantes_mayores)
## Nombre Edad Puntuacion Aprobado
## 2 Juan 22 90 TRUE
## 4 Luis 23 92 TRUE
library(ggplot2): Se carga la biblioteca ggplot2, una herramienta poderosa para crear visualizaciones en R. Crear la Visualización:
ggplot(estudiantes, aes(x = Edad, y = Puntuacion)): Se inicia un objeto ggplot con el data frame estudiantes y se especifican las variables para el eje x (Edad) y el eje y (Puntuacion). geom_point(): Se agrega una capa de puntos al gráfico, representando la relación entre la edad y la puntuación. labs(title = “Relación entre Edad y Puntuación”, x = “Edad”, y = “Puntuación”): Se añade etiquetas al gráfico, incluyendo un título y etiquetas para los ejes x e y. Visualización del Gráfico:
La última línea del código se encarga de renderizar y mostrar el gráfico. Este código utiliza ggplot2 para crear un gráfico de dispersión que muestra la relación entre la edad y la puntuación de los estudiantes. Es una forma efectiva y rápida de visualizar la relación entre dos variables en un conjunto de datos.
# Cargar la biblioteca ggplot2 para visualización
library(ggplot2)
# Visualizar la relación entre Edad y Puntuación
ggplot(estudiantes, aes(x = Edad, y = Puntuacion)) +
geom_point() +
labs(title = "Relación entre Edad y Puntuación", x = "Edad", y = "Puntuación")
# Crear un gráfico de barras de la puntuación promedio por estudiante
ggplot(estudiantes, aes(x = Nombre, y = Puntuacion)) +
geom_bar(stat = "identity", fill = "skyblue") +
labs(title = "Puntuación Promedio por Estudiante", x = "Nombre", y = "Puntuación")
ggplot(estudiantes, aes(x = Nombre, y = Puntuacion)): Se inicia un
objeto ggplot con el data frame estudiantes y se especifican las
variables para el eje x (Nombre) y el eje y (Puntuacion). geom_bar(stat
= “identity”, fill = “skyblue”): Agrega barras al gráfico, utilizando la
puntuación como altura de las barras y especificando el color de
relleno. labs(title = “Puntuación Promedio por Estudiante”, x =
“Nombre”, y = “Puntuación”): Añade etiquetas al gráfico, incluyendo
título y etiquetas para los ejes x e y.
# Crear un gráfico de líneas de la evolución de la puntuación por edad
ggplot(estudiantes, aes(x = Edad, y = Puntuacion, group = 1)) +
geom_line(color = "orange") +
labs(title = "Evolución de la Puntuación por Edad", x = "Edad", y = "Puntuación")
ggplot(estudiantes, aes(x = Edad, y = Puntuacion, group = 1)): Inicia un
objeto ggplot con el data frame estudiantes, especificando las variables
para los ejes x e y, y agrupando por el grupo 1. geom_line(color =
“orange”): Agrega una línea al gráfico, conectando los puntos según la
relación entre la edad y la puntuación. labs(title = “Evolución de la
Puntuación por Edad”, x = “Edad”, y = “Puntuación”): Añade etiquetas al
gráfico.
# Crear un histograma de las edades de los estudiantes
ggplot(estudiantes, aes(x = Edad, fill = factor(Edad))) +
geom_histogram(binwidth = 1, position = "identity", alpha = 0.7, color = "black") +
labs(title = "Histograma de Edades", x = "Edad", y = "Frecuencia")
ggplot(estudiantes, aes(x = Edad, fill = factor(Edad))): Inicia un
objeto ggplot con el data frame estudiantes, especificando la variable
para el eje x (Edad) y el color de relleno basado en las edades.
geom_histogram(binwidth = 1, position = “identity”, alpha = 0.7, color =
“black”): Agrega un histograma al gráfico, con barras de ancho 1,
posición “identity”, transparencia y borde negro. labs(title =
“Histograma de Edades”, x = “Edad”, y = “Frecuencia”): Añade etiquetas
al gráfico.
# Crear un gráfico de torta de aprobación
ggplot(estudiantes, aes(x = "", fill = factor(Aprobado))) +
geom_bar(width = 1, stat = "count") +
coord_polar(theta = "y") +
labs(title = "Porcentaje de Aprobación", fill = "Aprobado", x = NULL, y = NULL) +
theme_void()
ggplot(estudiantes, aes(x = ““, fill = factor(Aprobado))): Inicia un
objeto ggplot con el data frame estudiantes, especificando que no hay
eje x, y el color de relleno basado en la variable Aprobado.
geom_bar(width = 1, stat =”count”): Agrega barras al gráfico con un
ancho de 1, usando la función de conteo. coord_polar(theta = “y”):
Convierte el gráfico en un gráfico de torta. labs(title = “Porcentaje de
Aprobación”, fill = “Aprobado”, x = NULL, y = NULL): Añade etiquetas al
gráfico. theme_void(): Elimina el fondo y los ejes, ya que un gráfico de
torta no necesita estos elementos.