Demostración de la Tarea 2 del 2do 50%

Bases de datos de los paquetes de R

Las bases de datos en losw documentos RMarkdown se pueden mostrar y analizar con las distintas funciones de R.

La primera base de datos que miraremos se llama: mtcars

Base de datos mtcars

mtcars

Información de la BD mtcars

Nombres de columnas con la función names()

names(mtcars)
##  [1] "mpg"  "cyl"  "disp" "hp"   "drat" "wt"   "qsec" "vs"   "am"   "gear"
## [11] "carb"

Información mas detallada con la función str()

str(mtcars)
## 'data.frame':    32 obs. of  11 variables:
##  $ mpg : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
##  $ cyl : num  6 6 4 6 8 6 8 4 4 6 ...
##  $ disp: num  160 160 108 258 360 ...
##  $ hp  : num  110 110 93 110 175 105 245 62 95 123 ...
##  $ drat: num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
##  $ wt  : num  2.62 2.88 2.32 3.21 3.44 ...
##  $ qsec: num  16.5 17 18.6 19.4 17 ...
##  $ vs  : num  0 0 1 1 0 1 0 1 1 1 ...
##  $ am  : num  1 1 1 0 0 0 0 0 0 0 ...
##  $ gear: num  4 4 4 3 3 3 3 4 4 4 ...
##  $ carb: num  4 4 1 1 2 1 4 2 2 4 ...

Descriptiva de la BD mtcars con la función summary()

La función summary(mtcars) en R proporciona una visión general de las estadísticas descriptivas para cada variable en el dataset mtcars

summary(mtcars)
##       mpg             cyl             disp             hp       
##  Min.   :10.40   Min.   :4.000   Min.   : 71.1   Min.   : 52.0  
##  1st Qu.:15.43   1st Qu.:4.000   1st Qu.:120.8   1st Qu.: 96.5  
##  Median :19.20   Median :6.000   Median :196.3   Median :123.0  
##  Mean   :20.09   Mean   :6.188   Mean   :230.7   Mean   :146.7  
##  3rd Qu.:22.80   3rd Qu.:8.000   3rd Qu.:326.0   3rd Qu.:180.0  
##  Max.   :33.90   Max.   :8.000   Max.   :472.0   Max.   :335.0  
##       drat             wt             qsec             vs        
##  Min.   :2.760   Min.   :1.513   Min.   :14.50   Min.   :0.0000  
##  1st Qu.:3.080   1st Qu.:2.581   1st Qu.:16.89   1st Qu.:0.0000  
##  Median :3.695   Median :3.325   Median :17.71   Median :0.0000  
##  Mean   :3.597   Mean   :3.217   Mean   :17.85   Mean   :0.4375  
##  3rd Qu.:3.920   3rd Qu.:3.610   3rd Qu.:18.90   3rd Qu.:1.0000  
##  Max.   :4.930   Max.   :5.424   Max.   :22.90   Max.   :1.0000  
##        am              gear            carb      
##  Min.   :0.0000   Min.   :3.000   Min.   :1.000  
##  1st Qu.:0.0000   1st Qu.:3.000   1st Qu.:2.000  
##  Median :0.0000   Median :4.000   Median :2.000  
##  Mean   :0.4062   Mean   :3.688   Mean   :2.812  
##  3rd Qu.:1.0000   3rd Qu.:4.000   3rd Qu.:4.000  
##  Max.   :1.0000   Max.   :5.000   Max.   :8.000

mpg (Millas por galón) Min: 10.40

1st Qu.: 15.43

Median: 19.20

Mean: 20.09

3rd Qu.: 22.80

Max: 33.90

Las millas por galón varían de 10.40 a 33.90, con una media de 20.09.

cyl (NĆŗmero de cilindros) Min: 4

1st Qu.: 4

Median: 6

Mean: 6.188

3rd Qu.: 8

Max: 8

La mayorĆ­a de los coches tienen 4, 6 o 8 cilindros.

disp (Desplazamiento en pulgadas cĆŗbicas) Min: 71.1

1st Qu.: 120.8

Median: 196.3

Mean: 230.7

3rd Qu.: 326.0

Max: 472.0

El desplazamiento varĆ­a ampliamente, con una media de 230.7.

hp (Caballos de fuerza) Min: 52

1st Qu.: 96.5

Median: 123

Mean: 146.7

3rd Qu.: 180

Max: 335

La potencia de los coches oscila entre 52 y 335 caballos de fuerza, con una media de 146.7.

drat (Relación del eje trasero) Min: 2.76

1st Qu.: 3.08

Median: 3.695

Mean: 3.597

3rd Qu.: 3.92

Max: 4.93

La relación del eje trasero tiene una media de 3.597.

wt (Peso del coche en miles de libras) Min: 1.513

1st Qu.: 2.581

Median: 3.325

Mean: 3.217

3rd Qu.: 3.61

Max: 5.424

El peso de los coches varĆ­a entre 1.513 y 5.424, con una media de 3.217.

qsec (Tiempo del cuarto de milla en segundos) Min: 14.50

1st Qu.: 16.89

Median: 17.71

Mean: 17.85

3rd Qu.: 18.90

Max: 22.90

El tiempo del cuarto de milla oscila entre 14.50 y 22.90 segundos, con una media de 17.85.

vs (Motor en V o en lĆ­nea) Min: 0

1st Qu.: 0

Median: 0

Mean: 0.4375

3rd Qu.: 1

Max: 1

La mayorĆ­a de los coches tienen motores en V (0), con una minorĆ­a con motores en lĆ­nea (1).

am (Tipo de transmisión, 0 = automÔtica, 1 = manual) Min: 0

1st Qu.: 0

Median: 0

Mean: 0.4062

3rd Qu.: 1

Max: 1

La mayoría de los coches tienen transmisión automÔtica (0).

gear (NĆŗmero de marchas) Min: 3

1st Qu.: 3

Median: 4

Mean: 3.688

3rd Qu.: 4

Max: 5

La mayorĆ­a de los coches tienen 3 o 4 marchas, con algunos teniendo 5.

carb (NĆŗmero de carburadores) Min: 1

1st Qu.: 2

Median: 2

Mean: 2.812

3rd Qu.: 4

Max: 8

El nĆŗmero de carburadores varĆ­a de 1 a 8, con una media de 2.812.

Graficas

Histogramas de frecuencias

Un histograma de frecuencias es una herramienta grĆ”fica que se utiliza para representar la distribución de un conjunto de datos. BĆ”sicamente, divide los datos en intervalos (o ā€œbinsā€) y muestra cuĆ”ntos valores caen en cada intervalo. AquĆ­ tienes los componentes clave de un histograma de frecuencias:

Eje horizontal (x): Representa los intervalos de los datos.

Eje vertical (y): Representa la frecuencia de los datos en cada intervalo, es decir, cuƔntos valores estƔn en cada bin.

Barras: Cada barra muestra la frecuencia de los datos dentro de ese intervalo.

Los histogramas son muy útiles para entender la distribución de los datos, detectar posibles outliers y visualizar la dispersión y la forma de la distribución.

Histograma de frecuencia de la variable mpg

hist(mtcars$mpg)

Histogramas de densidad

Un histograma de densidad es similar a un histograma de frecuencias, pero en lugar de representar el número de ocurrencias de datos en cada intervalo, representa una estimación de la densidad de probabilidad. Es útil para visualizar la distribución de los datos de una manera mÔs suave y continua.

Crear un histograma de densidad en R Primero, necesitas tener el conjunto de datos que deseas analizar. AquĆ­ tienes un ejemplo usando el dataset mtcars:

# Crear el histograma de densidad
hist(mtcars$mpg, freq = FALSE, main = "Histograma de Densidad de Millas por Galón", xlab = "Millas por Galón", col = "skyblue", border = "white")

# AƱadir una lƭnea de densidad
lines(density(mtcars$mpg), col = "red", lwd = 2)

Datos_2024_S_2 de Excel

library(readxl) # El paquete readxl debe instalarse lo cual lo hace automaticamente posit cloud
housing <- read_excel("DATOS_2024_SEM_2.xlsx", 
    sheet = "Housing")
housing

Graficando longitudes y latitudes

plot(housing$longitude, housing$latitude)