Estadística y Probabilidad

Clase 1.5
Propiedades de las sumatorias y
Medidas de tendencia central para datos no agrupados

Msc. Roberto Trespalacios

Universidad Tecnológica de Bolivar

2024-01-29

Tabla de contenido

  • Sumatoria y sus propiedades
    • Definición
    • Sumatoria y sus propiedades
    • Igualdades que NO cumplen las sumatorias
  • Medidas de tendencia central para datos no agrupados
    • Media
    • Mediana
    • Moda

Sumatoria y sus propiedades

Definición: Sumatoria

Sean \(a_1, a_2, \dots, a_n\), donde cada \(a_i \in \mathbb{R}\), e \(i=1,2,\dots,n\), entonces simbolizamos la suma \(a_1 + a_2 +\cdots +a_n\) como

\[ \sum_{i=1}^{n}a_{i}=a_{1}+a_{2}+\cdots +a_n \]

Ejemplos

  • Ejemplo 1: la suma de los números \(a_1 =3, a_2=2.1 , a_3=-6\) y \(a_4=1\) es: \[ \sum_{i=1}^{4}a_{i}=a_{1}+a_{2}+ a_3 +a_4 = 3+ 2.1 +(-6) + 1= 0.1 \]

En R

sum(c(3,2.1,-6,1))
  • Ejemplo 2: la suma de los primeros 5 números primos, sería:

\[ \sum_{i=1}^{5}a_{i}=2+3+5+7+11=28 \]

En R

sum(c(2,3,5,7,11))
  • Ejemplo 3: la suma de los cuadrados de los 10 primeros números naturales, sería:

\[ \sum_{i=1}^{10}a_{i}= \sum_{i=1}^{10}i^2 = 1^2+2^2+3^2+\cdots+10^2 =385 \]

En R

sum((1:10)^2)

Sumatoria y sus propiedades

La sumatoria es simplemente una manera abreviada de representar una suma, y por lo tanto, cumple todas las propiedades de ésta:

  • Propiedad conmutativa: \(\displaystyle {\sum_{i=1}^{n}(a_i+b_i)= \sum_{i=1}^{n}a_i+\sum_{i=1}^{n} b_i=\sum_{i=1}^{n}b_i+\sum_{i=1}^{n}a_i =\sum_{i=1}^{n}(b_i+a_i)}\)

  • Propiedad asociativa:\(\displaystyle \sum_{i=1}^{n}(a_i+b_i)+\sum_{i=1}^{n}c_i = \sum_{i=1}^{n}a_i+\left(\sum_{i=1}^{n}b_i+\sum_{i=1}^{n}c_i\right)= \sum_{i=1}^{n}a_i + \sum_{i=1}^{n}(b_i +c_i)\)

  • Propiedad distributiva: \(\displaystyle \sum_{i=1}^{n}a(b_i+c_i)=\sum_{i=1}^{n}(ab_i+ ac_i)=\sum_{i=1}^{n}ab_i+ \sum_{i=1}^{n}ac_i\)

Sumatoria y sus propiedades

  • Suma de un valor constante: \(\displaystyle \sum_{i=1}^{n}a= \underbrace{a+a+\cdots+a}_{n-veces}=na\)

  • Partición del índice: \(\displaystyle \sum_{i=1}^{n}a_i=\sum_{i=1}^{n_0}a_i + \sum_{i=n_0+1}^{n}a_i, \quad \text{para } n_0 <n\)

  • Desigualdad triangular: \(\displaystyle \left| \sum_{i=1}^{n}a_i \right| \leqslant \sum_{i=1}^{n}|a_i|\)

Propideades de sumas dobles

  • Conmutatividad de índices:

\[ \begin{align*} \sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij} =& \sum_{i=1}^{n} ( a_{i1}+ a_{i2}+\cdots +a_{in} ) \\ =& (a_{11}+ \cdots +a_{n1}) + (a_{12}+\cdots +a_{n2}) +\cdots+ (a_{1n}+\cdots +a_{nn}) \\ =& \sum_{j=1}^{n} ( a_{1j}+ a_{2j}+\cdots +a_{nj} ) \\ =& \sum_{j=1}^{n}\sum_{i=1}^{n}a_{ij} \end{align*} \]

Igualdades que NO cumplen las sumatorias

  • Suma del producto: \(\displaystyle \sum_{i=1}^{n}a_ib_i \neq \sum_{i=1}^{n}a_i \sum_{i=1}^{n}b_i\)

  • Suma de los cuadrados: \(\displaystyle \sum_{i=1}^{n}a_i^2 \neq \left(\sum_{i=1}^{n} a_i\right)^2\)

Medidas de tendencia central para datos no agrupados

La media aritmética \(\bar{x}\)

Sean \(x_1, x_2, \dots, x_n\), donde cada \(x_i \in \mathbb{R}\), entonces definimos la media aritmetica \(\bar{x}\): como

\[ \bar{x} = \frac{x_1+ x_2+ \dots+ x_n}{n} = \frac{\sum_{i=1}^n x_i}{n} \]

Propiedades de la media aritmética

  • La suma de las desviaciones que se relacionan a la aritmética debe ser equivalente a 0 (Cero). Es decir, \(\overset{n}{\underset{i=1}{\Sigma}}(x_{i}-\overline{x})=0\): la suma de la diferencia de cada dato con el promedio es cero.
  • La media no tiene que ser igual a los valores de los datos iniciales.
  • Es única para una muestra.
  • Es afectada por todas las observaciones e influida por valores extremos (valores tatípicos o “outliers”).

Ejemplos

Ejemplo 3

Los datos representan el costo de una casa en millones de pesos: 125, 130, 117, 117, 146,80,95,85,110 y 100, entonces la media aritmética es:

\[\bar{x}=\frac{\displaystyle \sum_{i=1}^{10} x_{i}}{10} =\frac{125+130+117+117+146+80+95+85+110+100}{10}=110.5\]

En R

x = c(125, 130, 117, 117, 146,80,95,85,110,100)
sum(x)/length(x)

# tambien
mean(x)

Es decir, el costo promedio de una casa es 110.5 millones de pesos.

Ejemplo 4

Si tomamos una muestra adicional (casa) con valor de 500 millones y los datos del ejemplo 3, entonces el costo promedio de las casa seria 145.91 millones.

  • Notemos que el promedio esta siendo afectado por los valores extremos (outliers), en este caso por 500 y esto da una información incorrecta, ya que sólo hay 2 casas con precio promedio mayor a este.

La media poblacional y muestral

Observaciones:

  • La media poblacional se representa por \(\mu\) y para saber su valor exacto tendríamos que usar todos los datos de la población.
  • La media poblacional \(\mu\) es una parámetro de la población.
  • La media poblacional puede ser estimada por la media muestral \(\bar{x}\) y se le llama estadístico.

La mediana \(Me\)

Es el valor central de un conjunto de observaciones cuando los datos están ordenados. La mediana divide en dos partes a los datos. Para encontrar la mediana de un conjunto de datos tenemos que seguir los siguientes pasos:

  1. Ordenar los datos de menor a mayor.
  2. Si el número de datos es par, la mediana será el promedio de los dos valores centrales.
  3. Si el número de datos es impar, la mediana será el valor central.

Ejemplo 5

El tiempo mensual, en horas, dedicados a estudiar durante un semestre por un estudiante de estadística es: 24.2, 15.8, 25.0, 18.3, 23.6 y 14.3.

  1. Encuentre la mediana del tiempo mensual dedicados a estudiar.
  2. Interprete

Solución

  1. El número de datos es par y los datos ordenados de menor a mayor son:

\(14.3, 15.8, 18.3, 23.6, 24.2, 25.0\)

\[Me=\frac{18.3 + 23.6}{2}=20.95\]

En R

x = c(24.2, 15.8, 25.0, 18.3, 23.6,14.3)
median(x)
  1. Interpretación: El 50% de los estudiantes dedica menos de 20.95 horas al estudio, y el otro 50% dedica más de 20.95 horas.

La moda \(Mo\)

Dado un conjunto de datos, la moda muestral es el (los) valor(es) que se repite con mayor frecuencia. Esta medida se puede usar para datos cualitativos y cuantitativos(discretos).

Ejemplo 6 (datos cualitativos)

El tipo de apariencia registrada: (1) Normal, (2) Defectuoso, en un grupo de 13 artículos es:
\[1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2\]

Encuentre la moda de la apariencia en este conjunto de artículos.

En R

x = c(1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2)
max(table(x))

La moda \(Mo\) (Distribuciones multimodales)

  • Cuando solo existe una moda, decimos que la distribución es unimodal.
  • En el caso de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima.
  • Cuando no existe una moda, entonces la distribución es uniforme.
  • Se hablará de una distribución multimodal, cuando existe más de una moda.

Relación entre la media, mediana, moda y la distribución de los datos

Una manera visual de identificar el sesgo, es haciendo un histograma de frecuencias con su respectivo polígono de frecuencias.

Ejercicios

  1. La Komen Race for the Cure Series es la serie de carreras de 5.000 metros más multitudinaria del mundo. La Susan G. Komen Breast Cancer Foundation recauda fondos para financiar la lucha contra el cáncer de mama y para darla a conocer; apoya los proyectos de educación, selección y tratamiento en comunidades de todo el mundo; alaba a las mujeres que han sobrevivido y honra a las que han perdido la batalla contra la enfermedad. Los siguientes son cinco tiempos (en minutos) que hicieron los participantes en una reciente Race for the Cure:

    1. 45, 53, 45, 50, 48

    Halle las medidas de la tendencia central de la muestra a mano y en R.

  2. Diez economistas recibieron el encargo de predecir el crecimiento porcentual que experimentará el índice de precios de consumo el próximo año. Sus predicciones fueron: 3.6, 3.1, 3.9, 3.7, 3.5, 3.7, 3.4, 3, 3.7 y 3.4.

    1. Calcule la media muestral.
    2. Calcule la mediana muestral.
    3. ¿Cuál es la moda?

Los tres incisos a mano y en R