Clase 1.5
Propiedades de las sumatorias y
Medidas de tendencia central para datos no agrupados
Universidad Tecnológica de Bolivar
2024-01-29
Sean \(a_1, a_2, \dots, a_n\), donde cada \(a_i \in \mathbb{R}\), e \(i=1,2,\dots,n\), entonces simbolizamos la suma \(a_1 + a_2 +\cdots +a_n\) como
\[ \sum_{i=1}^{n}a_{i}=a_{1}+a_{2}+\cdots +a_n \]
En R
\[ \sum_{i=1}^{5}a_{i}=2+3+5+7+11=28 \]
En R
\[ \sum_{i=1}^{10}a_{i}= \sum_{i=1}^{10}i^2 = 1^2+2^2+3^2+\cdots+10^2 =385 \]
En R
La sumatoria es simplemente una manera abreviada de representar una suma, y por lo tanto, cumple todas las propiedades de ésta:
Propiedad conmutativa: \(\displaystyle {\sum_{i=1}^{n}(a_i+b_i)= \sum_{i=1}^{n}a_i+\sum_{i=1}^{n} b_i=\sum_{i=1}^{n}b_i+\sum_{i=1}^{n}a_i =\sum_{i=1}^{n}(b_i+a_i)}\)
Propiedad asociativa:\(\displaystyle \sum_{i=1}^{n}(a_i+b_i)+\sum_{i=1}^{n}c_i = \sum_{i=1}^{n}a_i+\left(\sum_{i=1}^{n}b_i+\sum_{i=1}^{n}c_i\right)= \sum_{i=1}^{n}a_i + \sum_{i=1}^{n}(b_i +c_i)\)
Propiedad distributiva: \(\displaystyle \sum_{i=1}^{n}a(b_i+c_i)=\sum_{i=1}^{n}(ab_i+ ac_i)=\sum_{i=1}^{n}ab_i+ \sum_{i=1}^{n}ac_i\)
Suma de un valor constante: \(\displaystyle \sum_{i=1}^{n}a= \underbrace{a+a+\cdots+a}_{n-veces}=na\)
Partición del índice: \(\displaystyle \sum_{i=1}^{n}a_i=\sum_{i=1}^{n_0}a_i + \sum_{i=n_0+1}^{n}a_i, \quad \text{para } n_0 <n\)
Desigualdad triangular: \(\displaystyle \left| \sum_{i=1}^{n}a_i \right| \leqslant \sum_{i=1}^{n}|a_i|\)
\[ \begin{align*} \sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij} =& \sum_{i=1}^{n} ( a_{i1}+ a_{i2}+\cdots +a_{in} ) \\ =& (a_{11}+ \cdots +a_{n1}) + (a_{12}+\cdots +a_{n2}) +\cdots+ (a_{1n}+\cdots +a_{nn}) \\ =& \sum_{j=1}^{n} ( a_{1j}+ a_{2j}+\cdots +a_{nj} ) \\ =& \sum_{j=1}^{n}\sum_{i=1}^{n}a_{ij} \end{align*} \]
Suma del producto: \(\displaystyle \sum_{i=1}^{n}a_ib_i \neq \sum_{i=1}^{n}a_i \sum_{i=1}^{n}b_i\)
Suma de los cuadrados: \(\displaystyle \sum_{i=1}^{n}a_i^2 \neq \left(\sum_{i=1}^{n} a_i\right)^2\)
Sean \(x_1, x_2, \dots, x_n\), donde cada \(x_i \in \mathbb{R}\), entonces definimos la media aritmetica \(\bar{x}\): como
\[ \bar{x} = \frac{x_1+ x_2+ \dots+ x_n}{n} = \frac{\sum_{i=1}^n x_i}{n} \]
Los datos representan el costo de una casa en millones de pesos: 125, 130, 117, 117, 146,80,95,85,110 y 100, entonces la media aritmética es:
\[\bar{x}=\frac{\displaystyle \sum_{i=1}^{10} x_{i}}{10} =\frac{125+130+117+117+146+80+95+85+110+100}{10}=110.5\]
En R
Es decir, el costo promedio de una casa es 110.5 millones de pesos.
Si tomamos una muestra adicional (casa) con valor de 500 millones y los datos del ejemplo 3, entonces el costo promedio de las casa seria 145.91 millones.
Es el valor central de un conjunto de observaciones cuando los datos están ordenados. La mediana divide en dos partes a los datos. Para encontrar la mediana de un conjunto de datos tenemos que seguir los siguientes pasos:
El tiempo mensual, en horas, dedicados a estudiar durante un semestre por un estudiante de estadística es: 24.2, 15.8, 25.0, 18.3, 23.6 y 14.3.
\(14.3, 15.8, 18.3, 23.6, 24.2, 25.0\)
\[Me=\frac{18.3 + 23.6}{2}=20.95\]
En R
Dado un conjunto de datos, la moda muestral es el (los) valor(es) que se repite con mayor frecuencia. Esta medida se puede usar para datos cualitativos y cuantitativos(discretos).
El tipo de apariencia registrada: (1) Normal, (2) Defectuoso, en un grupo de 13 artículos es:
\[1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2\]
Encuentre la moda de la apariencia en este conjunto de artículos.
En R
Una manera visual de identificar el sesgo, es haciendo un histograma de frecuencias con su respectivo polígono de frecuencias.
La Komen Race for the Cure Series es la serie de carreras de 5.000 metros más multitudinaria del mundo. La Susan G. Komen Breast Cancer Foundation recauda fondos para financiar la lucha contra el cáncer de mama y para darla a conocer; apoya los proyectos de educación, selección y tratamiento en comunidades de todo el mundo; alaba a las mujeres que han sobrevivido y honra a las que han perdido la batalla contra la enfermedad. Los siguientes son cinco tiempos (en minutos) que hicieron los participantes en una reciente Race for the Cure:
Halle las medidas de la tendencia central de la muestra a mano y en R.
Diez economistas recibieron el encargo de predecir el crecimiento porcentual que experimentará el índice de precios de consumo el próximo año. Sus predicciones fueron: 3.6, 3.1, 3.9, 3.7, 3.5, 3.7, 3.4, 3, 3.7 y 3.4.
Los tres incisos a mano y en R