Las bases de datos en losw documentos RMarkdown se pueden mostrar y analizar con las distintas funciones de R.
La primera base de datos que miraremos se llama: mtcars
mtcars
names()
names(mtcars)
## [1] "mpg" "cyl" "disp" "hp" "drat" "wt" "qsec" "vs" "am" "gear"
## [11] "carb"
str()
str(mtcars)
## 'data.frame': 32 obs. of 11 variables:
## $ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
## $ cyl : num 6 6 4 6 8 6 8 4 4 6 ...
## $ disp: num 160 160 108 258 360 ...
## $ hp : num 110 110 93 110 175 105 245 62 95 123 ...
## $ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
## $ wt : num 2.62 2.88 2.32 3.21 3.44 ...
## $ qsec: num 16.5 17 18.6 19.4 17 ...
## $ vs : num 0 0 1 1 0 1 0 1 1 1 ...
## $ am : num 1 1 1 0 0 0 0 0 0 0 ...
## $ gear: num 4 4 4 3 3 3 3 4 4 4 ...
## $ carb: num 4 4 1 1 2 1 4 2 2 4 ...
La función summary(mtcars) en R proporciona una visión general de las estadĆsticas descriptivas para cada variable en el dataset mtcars
summary(mtcars)
## mpg cyl disp hp
## Min. :10.40 Min. :4.000 Min. : 71.1 Min. : 52.0
## 1st Qu.:15.43 1st Qu.:4.000 1st Qu.:120.8 1st Qu.: 96.5
## Median :19.20 Median :6.000 Median :196.3 Median :123.0
## Mean :20.09 Mean :6.188 Mean :230.7 Mean :146.7
## 3rd Qu.:22.80 3rd Qu.:8.000 3rd Qu.:326.0 3rd Qu.:180.0
## Max. :33.90 Max. :8.000 Max. :472.0 Max. :335.0
## drat wt qsec vs
## Min. :2.760 Min. :1.513 Min. :14.50 Min. :0.0000
## 1st Qu.:3.080 1st Qu.:2.581 1st Qu.:16.89 1st Qu.:0.0000
## Median :3.695 Median :3.325 Median :17.71 Median :0.0000
## Mean :3.597 Mean :3.217 Mean :17.85 Mean :0.4375
## 3rd Qu.:3.920 3rd Qu.:3.610 3rd Qu.:18.90 3rd Qu.:1.0000
## Max. :4.930 Max. :5.424 Max. :22.90 Max. :1.0000
## am gear carb
## Min. :0.0000 Min. :3.000 Min. :1.000
## 1st Qu.:0.0000 1st Qu.:3.000 1st Qu.:2.000
## Median :0.0000 Median :4.000 Median :2.000
## Mean :0.4062 Mean :3.688 Mean :2.812
## 3rd Qu.:1.0000 3rd Qu.:4.000 3rd Qu.:4.000
## Max. :1.0000 Max. :5.000 Max. :8.000
mpg (Millas por galón) Min: 10.40
1st Qu.: 15.43
Median: 19.20
Mean: 20.09
3rd Qu.: 22.80
Max: 33.90
Las millas por galón varĆan de 10.40 a 33.90, con una media de 20.09.
cyl (NĆŗmero de cilindros) Min: 4
1st Qu.: 4
Median: 6
Mean: 6.188
3rd Qu.: 8
Max: 8
La mayorĆa de los coches tienen 4, 6 o 8 cilindros.
disp (Desplazamiento en pulgadas cĆŗbicas) Min: 71.1
1st Qu.: 120.8
Median: 196.3
Mean: 230.7
3rd Qu.: 326.0
Max: 472.0
El desplazamiento varĆa ampliamente, con una media de 230.7.
hp (Caballos de fuerza) Min: 52
1st Qu.: 96.5
Median: 123
Mean: 146.7
3rd Qu.: 180
Max: 335
La potencia de los coches oscila entre 52 y 335 caballos de fuerza, con una media de 146.7.
drat (Relación del eje trasero) Min: 2.76
1st Qu.: 3.08
Median: 3.695
Mean: 3.597
3rd Qu.: 3.92
Max: 4.93
La relación del eje trasero tiene una media de 3.597.
wt (Peso del coche en miles de libras) Min: 1.513
1st Qu.: 2.581
Median: 3.325
Mean: 3.217
3rd Qu.: 3.61
Max: 5.424
El peso de los coches varĆa entre 1.513 y 5.424, con una media de 3.217.
qsec (Tiempo del cuarto de milla en segundos) Min: 14.50
1st Qu.: 16.89
Median: 17.71
Mean: 17.85
3rd Qu.: 18.90
Max: 22.90
El tiempo del cuarto de milla oscila entre 14.50 y 22.90 segundos, con una media de 17.85.
vs (Motor en V o en lĆnea) Min: 0
1st Qu.: 0
Median: 0
Mean: 0.4375
3rd Qu.: 1
Max: 1
La mayorĆa de los coches tienen motores en V (0), con una minorĆa con motores en lĆnea (1).
am (Tipo de transmisión, 0 = automÔtica, 1 = manual) Min: 0
1st Qu.: 0
Median: 0
Mean: 0.4062
3rd Qu.: 1
Max: 1
La mayorĆa de los coches tienen transmisión automĆ”tica (0).
gear (NĆŗmero de marchas) Min: 3
1st Qu.: 3
Median: 4
Mean: 3.688
3rd Qu.: 4
Max: 5
La mayorĆa de los coches tienen 3 o 4 marchas, con algunos teniendo 5.
carb (NĆŗmero de carburadores) Min: 1
1st Qu.: 2
Median: 2
Mean: 2.812
3rd Qu.: 4
Max: 8
El nĆŗmero de carburadores varĆa de 1 a 8, con una media de 2.812.
Un histograma de frecuencias es una herramienta grĆ”fica que se utiliza para representar la distribución de un conjunto de datos. BĆ”sicamente, divide los datos en intervalos (o ābinsā) y muestra cuĆ”ntos valores caen en cada intervalo. AquĆ tienes los componentes clave de un histograma de frecuencias:
Eje horizontal (x): Representa los intervalos de los datos.
Eje vertical (y): Representa la frecuencia de los datos en cada intervalo, es decir, cuƔntos valores estƔn en cada bin.
Barras: Cada barra muestra la frecuencia de los datos dentro de ese intervalo.
Los histogramas son muy útiles para entender la distribución de los datos, detectar posibles outliers y visualizar la dispersión y la forma de la distribución.
hist(mtcars$mpg)
Un histograma de densidad es similar a un histograma de frecuencias, pero en lugar de representar el número de ocurrencias de datos en cada intervalo, representa una estimación de la densidad de probabilidad. Es útil para visualizar la distribución de los datos de una manera mÔs suave y continua.
Crear un histograma de densidad en R Primero, necesitas tener el conjunto de datos que deseas analizar. AquĆ tienes un ejemplo usando el dataset mtcars:
# Crear el histograma de densidad
hist(mtcars$mpg, freq = FALSE, main = "Histograma de Densidad de Millas por Galón", xlab = "Millas por Galón", col = "skyblue", border = "white")
# AƱadir una lĆnea de densidad
lines(density(mtcars$mpg), col = "red", lwd = 2)
library(readxl) # El paquete readxl debe instalarse lo cual lo hace automaticamente posit cloud
housing <- read_excel("DATOS_2024_SEM_2.xlsx",
sheet = "Housing")
housing
plot(housing$longitude, housing$latitude)