library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.3
Tenemos que tener en cuenta la importacia que tiene los diferentes tipos de graficas, dado que es un elemento apropiado para describir dados estadisticos.
altura <- c(160, 165, 170, 175, 180)
peso <- c(55, 60, 65, 72, 80)
plot(altura, peso)
library(ggplot2)
avp <- data.frame(altura = c(160, 165, 170, 175, 180),
peso = c(55, 60, 65, 72, 80))
ggplot(avp, aes(x = altura, y = peso)) +
geom_point(color = "blue") +
ggtitle("Altura vs Peso") +
xlab("Altura (cm)") +
ylab("Peso (kg)")
Tenemos que ubicar de forma correcta nuestros datos al momento de hacer las graficas; entonces en un caso tal como lo es con (plot), debemos caracterizar que elementos son las variables dependientes e independientes (como se muestra en ejemplo anterior).
Tambien podemos correr nuestras graficas de forma mas llamativa e interesante a la vista. por ejemplo:
altura <- c(160, 165, 170, 175, 180)
peso <- c(55, 60, 65, 72, 80)
plot(altura, peso,
main = "Altura vs Peso",
xlab = "Altura (cm)",
ylab = "Peso (kg)",
col = "blue",
pch = 19,
type = "o") # esta linea une los puntos de la grafica, y es utilizado mayormente cuando son datos continuos
Representa cantidades mediante barras, ademas compara frecuencias o cantidades entre distintas categorias.
frutas <- c("Manzana", "Banana", "Pera", "Uva")
ventas <- c(30, 45, 25, 50)
barplot(ventas, names.arg = frutas,
main = "Ventas por tipo de fruta",
col = "orange",
ylab = "Cantidad")
Muestra la distribucion de una variable numerica dividiendola en intervalos especificos.
edades <- c(18, 22, 21, 25, 20, 22, 24, 26, 28, 22, 23)
hist(edades,
main = "Distribución de edades",
xlab = "Edad",
col = "skyblue",
border = "black")
Visualiza los cuartilas, la mediana y los valores atipicos, y es utilizado para comparar distribuciones y detectar cuartiles.
edad <- c(18, 22, 21, 25, 20, 22, 24, 26, 28, 22, 23, 40)
boxplot(edad,
main = "Boxplot de edades",
ylab = "Edad",
col = "green")
Representa proporciones
categorias <- c("Aprobados", "Reprobados", "Retirados")
valores <- c(50, 30, 20)
pie(valores, labels = categorias,
main = "Resultados de los estudiantes",
col = c("green", "red", "yellow"))
Muestra partes de un todo por categorias y ademas compara composicon dentro de cada grupo.
ventas <- matrix(c(10, 15, 20, 8, 12, 18), nrow = 2, byrow = TRUE)
colnames(ventas) <- c("Ene", "Feb", "Mar")
rownames(ventas) <- c("Producto A", "Producto B")
barplot(ventas,
beside = FALSE ,
main = "Ventas mensuales por producto",
col = c("blue", "red"),
legend = rownames(ventas))
# la linea beside me garantiza que los datos queden apilados con FALSE, en cambio con TRUE estas agrupadas
datos <- data.frame(
altura = c(160, 165, 170, 175, 180),
peso = c(55, 60, 65, 72, 80)
)
ggplot(datos, aes(x = altura, y = peso)) +
geom_point(color = "blue") +
ggtitle("Altura vs Peso") +
xlab("Altura (cm)") +
ylab("Peso (kg)")