Conjunto de datos mtcars

Es un conjunto de datos integrado en R. Comprende 11 artículos de 32 automóviles de la revista estadounidense Motor Trend de 1974.

head(mtcars)

Funciones estadísticas básicas

  • Media

    Es el valor numérico que representa el centro de un conjunto de datos. Se calcula sumando todos los valores en el conjunto y luego dividiendo esa suma por el número total de valores, se ve afectada por los datos atípicos.
mean(mtcars$mpg)
## [1] 20.09062
  • Mediana

    Es el valor que ocupa la posición central en un conjunto de datos ordenados de menor a mayor (o de mayor a menor). Si hay un número impar de observaciones, la mediana es simplemente el valor que se encuentra en el centro de la lista ordenada. Si hay un número par de observaciones, la mediana se calcula como el promedio de los dos valores centrales.
median(mtcars$wt)
## [1] 3.325
  • Varianza

    Es una medida de dispersión en estadística que indica qué tan dispersos están los valores de un conjunto de datos alrededor de su media.
var(mtcars$qsec)
## [1] 3.193166
  • Desviación estándar

    Es una medida de dispersión en estadística que indica cuánto se desvían, en promedio, los valores de un conjunto de datos respecto a su media.
sd(mtcars$disp)
## [1] 123.9387
  • Cuartiles

    Son valores que dividen un conjunto de datos ordenados en cuatro partes iguales. Estos valores son útiles para entender la distribución de los datos y proporcionan información sobre la dispersión y la posición relativa de los datos dentro del conjunto.
quantile(mtcars$wt)
##      0%     25%     50%     75%    100% 
## 1.51300 2.58125 3.32500 3.61000 5.42400

Gráficos

Algunos de los gráficos son:

  • Histograma

    Es un tipo de gráfico utilizado en estadística para representar la distribución de un conjunto de datos numéricos. Consiste en barras rectangulares que se colocan adyacentes unas a otras. La longitud de cada barra representa la frecuencia o la densidad de ocurrencia de los valores dentro de ciertos intervalos de datos.

  • Diagrama de Caja

    Es una herramienta gráfica utilizada en estadística para visualizar la distribución de un conjunto de datos, especialmente su dispersión y sus valores atípicos.

  • Graficos de dispersión

    Es una herramienta visual que se utiliza en estadística para mostrar la relación entre dos variables cuantitativas. En un gráfico de dispersión, cada punto en el gráfico representa una observación en el conjunto de datos, y su posición en los ejes horizontal y vertical indica los valores de las dos variables. Sirve para identificar patrones, tendencias, correlaciones y la presencia de valores atípicos en los datos.