A4U1

Julian

2/2/2022

Folder de trabajo

setwd("~/pye1pm")

Paquetes

library(pacman)
p_load("datasets","DT","fdth","prettydoc","xfun", "ggplot2", "beanplot")

Ejercicio #4: Análisis exploratorio de datos (EDA)

Utilizando el conjunto de datos de autos llamado Cars

Los datos dan la velocidad de los automóviles y las distancias necesarias para detenerse. Tenga en cuenta que los datos se registraron en la década de 1920.

Conjunto de datos de autos

Las mediciones de estos datos se hacen de la siguiente forma:

Descarga este codigo

xfun::embed_file("A4U1 - Tarea.Rmd")

Download A4U1 - Tarea.Rmd

#conociendo los datos

#A traves de una tabla interactiva

datatable(cars)

#A traves de una grafica usando ggplot

df <- cars
ggplot(df, aes(speed, dist) ) + geom_point(aes(col= "car"), size=4)

##Medidas exploratorias de tendencia central

summary(df)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

##Visualizacion

##histograma

hist(df$speed, 
     col = "red", 
     main = "histograma de la velocidad del auto", 
     xlab = "Magnitud de la velocidad", 
     ylab =  "Frecuencia absoluta")

Diferentes maneras de realizar histogramas

par(mfrow=c(1,3))
hist(cars$speed,xlim=c(0,8),ylim=c(0,40))
hist(cars$dist,xlim=c(0,8),ylim=c(0,40))

Grafico de dispersion (scatterplot)

crear un ancho de la velocidad del auto (speed) versus la distancia que necesita para detenerse (dist)

En este caso usaremos la funcion “Plot”

plot( cars$speed, cars$dist, 
     col= "green", 
     main = "Grafico de dispersion CARS", 
     xlab = "Velocidad del auto", 
     ylab = "Distancia", 
     pch = 19
)

##Grafico comparativo del tipo beanplot

xcars <- cars
xcars$Velocities <- NULL
beanplot(xcars, main = "Mediciones de velocidades y distancias")

Ancho de sepalo por especies de lirios utilizando un grafico de caja y bigote

boxplot(cars$speed,
        data=cars,
        main= "Velocidad del auto por distancia",
        xlab = "Velocidad",
        ylab = "Distancia",
        col = "Blue", 
        border = "orange"
)

Interpretando un grafico de caja y bigote

Componentes del gráfico de caja y bigote

#Extraccion de subconjuntos
IrisVer <- subset(iris, Species == "Versicolor")
IrisVir <- subset(iris, Species == "Virginica")
IrisSet <- subset(iris, Species == "Setosa")