Estadística

En estadística, el análisis de datos es una mezcla de conocimientos estadísticos y sentido común. No existen unas pautas constantes para obtener unos resultados óptimos ya que cada base de datos es un problema diferente, con variables y objetivos diferentes. Sin embargo, cuando se abarca un análisis de cualquier base de datos es obligatorio estudiar la estructura de los datos, un análisis descriptivo, tanto analítico como gráfico, de los datos, etc.

En el siguiente problema tomaremos un primer contacto con las técnicas estadísticas que se utilizan para ordenar, analizar y representar un conjunto de datos, con el fin de describir apropiadamente sus características. El primer paso en el análisis de datos, una vez introducidos los mismos, es realizar un análisis descriptivo o análisis exploratorio de datos. Para ello, tomaremos un conjunto de datos, se calculan medidas que describen sus características más importantes y se realizan representaciones gráficas o histogramas.

##Datos para nuestro cálculo estadístico

Datos=c(4.775591, 4.129769, 10.820459, 2.926689, 8.806668, 4.783637, 8.418380, 7.833450, 4.537405, 6.730402, 3.698800, 6.86492, 3.22558, 5.634067, 5.504755, 6.331493, 3.726112, 6.496017, 3.682233, 6.843869, 4.193416, 6.293272, 7.568595, 5.758989, 8.720617, 3.732230, 4.492452, 3.948485, 7.427152, 4.360651, 5.411284, 1.328836, 6.282210, 7.916329, 6.750422, 5.529266, 3.653097, 7.401630, 3.742837, 8.358330)

Promedio de los Datos

mean(Datos)
## [1] 5.71601

Desviación Estandar

sd(Datos)
## [1] 1.999193

Varianza

var(Datos)
## [1] 3.996772

Mediana

median(Datos)
## [1] 5.581666

Representación por medio de histograma

hist(Datos,"Scott", col="skyblue", main="Histograma para un Conjunto de Datos")

En conclusión podemos decir que: 1. El promedio o media aritmética es la suma de los valores dividido por el número de observaciones. La función de “R” para la media aritmética es mean(variable) 2. La desviación estandar es la raíz cuadrada de la varianza (cuasivarianza muestral) y la función de “R” para la desviación estándar es sd(variable). 3. La varianza es la esperanza del cuadrado de la desviación típica de dicha variable respecto a su media. La función de “R” para la varianza es var(variable). 4. La mediana es el valor de la variable que deja el mismo número de datos antes y después de él, una vez ordenados estos, cuando las observaciones se ordenan. La función de “R” para la mediana es median(“variable”).