Folder de trabajo
setwd("~/pye1pm")Paquetes
library(pacman)
p_load("datasets","DT","fdth","prettydoc","xfun", "ggplot2", "beanplot")Ejercicio #4: Análisis exploratorio de datos (EDA)
Utilizando el conjunto de datos de autos llamado Cars
Los datos dan la velocidad de los automóviles y las distancias necesarias para detenerse. Tenga en cuenta que los datos se registraron en la década de 1920.
Conjunto de datos de autos
Las mediciones de estos datos se hacen de la siguiente forma:
Descarga este codigo
xfun::embed_file("A4U1 - Tarea.Rmd")#conociendo los datos
#A traves de una tabla interactiva
datatable(cars)#A traves de una grafica usando ggplot
df <- carsggplot(df, aes(speed, dist) ) + geom_point(aes(col= "car"), size=4)##Medidas exploratorias de tendencia central
summary(df)## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
##Visualizacion
##histograma
hist(df$speed,
col = "red",
main = "histograma de la velocidad del auto",
xlab = "Magnitud de la velocidad",
ylab = "Frecuencia absoluta")Diferentes maneras de realizar histogramas
par(mfrow=c(1,3))
hist(cars$speed,xlim=c(0,8),ylim=c(0,40))
hist(cars$dist,xlim=c(0,8),ylim=c(0,40))Grafico de dispersion (scatterplot)
crear un ancho de la velocidad del auto (speed) versus la distancia que necesita para detenerse (dist)
En este caso usaremos la funcion “Plot”
plot( cars$speed, cars$dist,
col= "green",
main = "Grafico de dispersion CARS",
xlab = "Velocidad del auto",
ylab = "Distancia",
pch = 19
) ##Grafico comparativo del tipo beanplot
xcars <- cars
xcars$Velocities <- NULL
beanplot(xcars, main = "Mediciones de velocidades y distancias")Ancho de sepalo por especies de lirios utilizando un grafico de caja y bigote
boxplot(cars$speed,
data=cars,
main= "Velocidad del auto por distancia",
xlab = "Velocidad",
ylab = "Distancia",
col = "Blue",
border = "orange"
)Interpretando un grafico de caja y bigote
Componentes del gráfico de caja y bigote
#Extraccion de subconjuntos
IrisVer <- subset(iris, Species == "Versicolor")
IrisVir <- subset(iris, Species == "Virginica")
IrisSet <- subset(iris, Species == "Setosa")