Pensamiento estadístico

Iniciemos con un sencillo problema relacionado con la calidad en algunos datos de costos digitados en un sistema, como medimos la calidad de estos datos? como deberíamos controlar la calidad de estos datos?

Problema No. 1

Una empresa ha registrado la siguiente información de costo unitarios de un insumo médico “jeringas con agujas desechables”, de esos datos obtenemos una muestra de cien(100) valores digitados en diferentes fechas, esta información fue registrada con la calidad esperada?

#definiendo un vector con  costos unitarios en R
valoresUnitarios <- c(383,652,652,652,383,652,652,652,383,652,652,652,383,652,652,652,
383,652,652,652,383,652,652,652,383,652,652,652,383,652,652,2223,383,652,652,
50100,383,652,652,50100,383,652,652,50100,383,652,652,50100,383,652,652,79700,
383,652,652,103900,383,652,652,103900,383,652,652,103900,383,652,652,103900,
383,652,652,103900,383,652,652,103900,383,652,652,126400,258,652,652,126400,
258,652,652,148700,258,652,652,251100,652,652,652,334800,652,652,652,769900) 

Para responder esta pregunta estudiaremos estadísticos de tendencia central

Iniciemos con algo sencillo

MEDIA ARITMETICA MUESTRAL

Sean \(x_1, x_2, ..., x_n\) \(n\) observaciones numéricas, la media aritmética se define como

\(\overline{x}=\frac{1}{n} \sum_{i=1}^nx_i\)

Propiedades de la media aritmetica

  1. La suma de las desviaciones de los valores de la variable respecto a la media es igual a 0, esto es

    \(\sum_{i=1}^n\left( x_{i}-\overline{x}\right)=0\)

    Demostración:

    \(\sum_{i=1}^n\left( x_{i}-\overline{x}\right)=\sum_{i=1}^{n}x_i-\sum_{i=1}^{n}\overline{x} =n\overline{x}-n\overline{x}=0\)

  2. (Teorema de König) La media de las desviaciones al cuadrado de los valores de la variable respecto una constante \(k\) cualquiera, se hace mínima \(S(k)= \sum_{i=1}^{n}(x_i-k)^2\) cuando la constante es igual a la medía aritmética (\(k=\overline{x}\)).

    Demostración:

    Basta con minimizar esa suma de desviaciones al cuadrado con respecto a k, el valor de esa constante k sera el que anule la primera derivada y haga que la segunda sea positiva

    \(\frac{d(S(k))}{d(k)}=\frac{ d(\sum_{i=1}^{n}(x_i-k)^2)}{d(k)}=2\sum_{i=1}^{n}(x_i-k)(-1)=0\)

    A partir de esto se obtiene

    \(\sum_{i=1}^{n}(x_i-k)=0\) por tanto

    \(\sum_{i=1}^{n}(x_i)=nk\)

    De forma que si se dividen ambos miembros de la igualdad por n tenemos que

    \(\frac{1}{n}\sum_{i=1}^{n}(x_i)=k\)

Calculos en R

#Calculando la media en R
mediaValores = mean( valoresUnitarios )
mediaValores
## [1] 27099.25
valoresUnitarios - mediaValores  
##   [1] -26716.25 -26447.25 -26447.25 -26447.25 -26716.25 -26447.25 -26447.25
##   [8] -26447.25 -26716.25 -26447.25 -26447.25 -26447.25 -26716.25 -26447.25
##  [15] -26447.25 -26447.25 -26716.25 -26447.25 -26447.25 -26447.25 -26716.25
##  [22] -26447.25 -26447.25 -26447.25 -26716.25 -26447.25 -26447.25 -26447.25
##  [29] -26716.25 -26447.25 -26447.25 -24876.25 -26716.25 -26447.25 -26447.25
##  [36]  23000.75 -26716.25 -26447.25 -26447.25  23000.75 -26716.25 -26447.25
##  [43] -26447.25  23000.75 -26716.25 -26447.25 -26447.25  23000.75 -26716.25
##  [50] -26447.25 -26447.25  52600.75 -26716.25 -26447.25 -26447.25  76800.75
##  [57] -26716.25 -26447.25 -26447.25  76800.75 -26716.25 -26447.25 -26447.25
##  [64]  76800.75 -26716.25 -26447.25 -26447.25  76800.75 -26716.25 -26447.25
##  [71] -26447.25  76800.75 -26716.25 -26447.25 -26447.25  76800.75 -26716.25
##  [78] -26447.25 -26447.25  99300.75 -26841.25 -26447.25 -26447.25  99300.75
##  [85] -26841.25 -26447.25 -26447.25 121600.75 -26841.25 -26447.25 -26447.25
##  [92] 224000.75 -26447.25 -26447.25 -26447.25 307700.75 -26447.25 -26447.25
##  [99] -26447.25 742800.75
sum(valoresUnitarios - mediaValores  )
## [1] 0