Es un conjunto de datos integrado en R. Comprende 11 artículos de 32 automóviles de la revista estadounidense Motor Trend de 1974.
head(mtcars)
Media
Es el valor numérico que representa el centro de un conjunto de datos. Se calcula sumando todos los valores en el conjunto y luego dividiendo esa suma por el número total de valores, se ve afectada por los datos atípicos.
mean(mtcars$mpg)
## [1] 20.09062
Mediana
Es el valor que ocupa la posición central en un conjunto de datos ordenados de menor a mayor (o de mayor a menor). Si hay un número impar de observaciones, la mediana es simplemente el valor que se encuentra en el centro de la lista ordenada. Si hay un número par de observaciones, la mediana se calcula como el promedio de los dos valores centrales.
median(mtcars$wt)
## [1] 3.325
Varianza
Es una medida de dispersión en estadística que indica qué tan dispersos están los valores de un conjunto de datos alrededor de su media.
var(mtcars$qsec)
## [1] 3.193166
Desviación estándar
Es una medida de dispersión en estadística que indica cuánto se desvían, en promedio, los valores de un conjunto de datos respecto a su media.
sd(mtcars$disp)
## [1] 123.9387
Cuartiles
Son valores que dividen un conjunto de datos ordenados en cuatro partes iguales. Estos valores son útiles para entender la distribución de los datos y proporcionan información sobre la dispersión y la posición relativa de los datos dentro del conjunto.
quantile(mtcars$wt)
## 0% 25% 50% 75% 100%
## 1.51300 2.58125 3.32500 3.61000 5.42400
Algunos de los gráficos son:
Histograma
Es un tipo de gráfico utilizado en estadística para representar la distribución de un conjunto de datos numéricos. Consiste en barras rectangulares que se colocan adyacentes unas a otras. La longitud de cada barra representa la frecuencia o la densidad de ocurrencia de los valores dentro de ciertos intervalos de datos.
Diagrama de Caja
Es una herramienta gráfica utilizada en estadística para visualizar la distribución de un conjunto de datos, especialmente su dispersión y sus valores atípicos.
Graficos de dispersión
Es una herramienta visual que se utiliza en estadística para mostrar la relación entre dos variables cuantitativas. En un gráfico de dispersión, cada punto en el gráfico representa una observación en el conjunto de datos, y su posición en los ejes horizontal y vertical indica los valores de las dos variables. Sirve para identificar patrones, tendencias, correlaciones y la presencia de valores atípicos en los datos.