Caso 1. Los siguientes datos almacenados en https://raw.githubusercontent.com/anngelc/datos/master/indice-felicidad-latino-america.csv corresponden al Índice de Felicidad del Planeta o Índice del Planeta Feliz http://happyplanetindex.org/ que es un indicador del bienestar humano y del impacto ambiental de los países, especificamente de los paises de Latinoamerica. y está publicado por el New Economics Foundation (NEF) en el 2016 por Karen Jeffrey, Hanna Wheatley y Saamah Abdallah.
\[\overline { X } =\frac { { x }_{ 1 }+{ x }_{ 2 }+{ x }_{ 3 }+...+{ x }_{ n } }{ n }\] \[\overline { X } =\sum _{ i=1 }^{ n }{ \frac { { x }_{ i } }{ n } }\] Primero vamos ingresar los datos y almacenamos en la variable x y luego utilizamos la funcióm mean() para encontrar la media aritmética.
x=c(35.2,23.3,34.3,31.7,40.7,37,23.3,34.6,25.4,36.1,33.6)
mean(x)
## [1] 32.29091
\[MG= \sqrt[n]{ x_{1} x_{2}...x_{n}} = \sqrt[n]{ \prod_{i=1}^{n} x_{i} } \]
\[MG= anti .log \left[ \frac{ \sum_{ i=1 }^{ n }{ log .x_{i}} }{n} \right] \]
Tomando los datos del caso 1,calculamos la media geométrica, par lo cual tomamos los valos almacenados en la variable x, luego se determina el valo de n utilizando la función length().
x
## [1] 35.2 23.3 34.3 31.7 40.7 37.0 23.3 34.6 25.4 36.1 33.6
n = length(x)
y para finalizar se calcula la media geometrica utilizando la función de productorio prod() para realizar la multiplicación de todos los valores observados, al cual se le aplica la raiz n-ésima mediante el método de la potenciación.
(prod(x))^(1/n)
## [1] 31.77646
\[MA= \frac{1}{ \frac{1}{n}( \frac{1}{ x_{1} }+\frac{1}{ x_{2}}+...\frac{1}{ x_{n} } ) }= \frac{1}{ \frac{ \sum_{i=1}^{n} \frac{1}{ x_{i} } }{n} } = \frac{n}{ \sum_{i=1}^{n} \frac{1}{ x_{i} } } \]
Donde: \(n\): número de observaciones; \(x_{i}\): Observaciones de la muestra.
Para el cáculo de la media armónica tomamos la variable x y aplicamos la siguiente formula.
n/sum(1/x)
## [1] 31.22535
Si \(n\) es impar: \[Me={ X }_{ \frac { n+1 }{ 2 } }\] Si \(n\) es par: \[Me=\frac { { X }_{ \left( \frac { n }{ 2 } \right) }+{ X }_{ \left( \frac { n }{ 2 } +1 \right) } }{ 2 } \]
Para el cálculo de Mediana utilizaremos la función median()
median(x)
## [1] 34.3
\[Mo=Valor\_de\_mayor\_frecuencia.\].
Para encontrar la Moda primero se genera una tabla de distribución de frecuencias table(x), en donde se determinar el valor que mas se repite which.max() y finalmente se muestra el nombre de este valor names()
names(which.max(table(x)))
## [1] "23.3"
Caso 2. Considere la estatura (en centímetros) de una muestra de 50 estudiantes que están matriculados en el curso de Estadística. https://raw.githubusercontent.com/anngelc/datos/master/estatura-alumnos-estadistica.csv
\[\overline { X } =\frac {\sum _{ i=1 }^{ k } { x }_{ i } { f}_{ i } }{ n }\]
Donde:
\({ x }_{ i }\): Marcas de clase; \({ f}_{ i }\): Frecuencia Absoluta; \(k\): Número de intervalos.
Resolviendo el Caso 2. Primero tenemos que determinar las marcas de clase \({ x }_{ i }\)
x1=(150+155)/2
x2=(155+160)/2
x3=(160+165)/2
x4=(165+170)/2
x5=(170+175)/2
x6=(175+180)/2
x7=(180+185)/2
Luego insertamos los datos para las marcas de clase \({ x }_{ i }\) y las frecuencias abosolutas \({ f}_{ i }\)
xi=c(x1,x2,x3,x4,x5,x6,x7)
fi=c(3,8,12,14,10,2,1)
Finalmente determinamos la media aritmética, calculando la sumatoria de la multiplicación de las marcas de clase \({ x }_{ i }\) por las frecuencias absolutas \({ f}_{ i }\) divido por el número total de observaciones n=50. \(\frac {\sum _{ i=1 }^{ k } { x }_{ i } { f}_{ i } }{ n }\)
n=50
sum(xi*fi)/n
## [1] 165.5
\[MG= \sqrt[n]{ x_{1}^{ f_{1} } x_{2}^{ f_{2}}...x_{k}^{ f_{k}} } = \sqrt[n]{ \prod_{i=1}^{k} x_{i}^{ f_{i} } } \] Donde: \({ x }_{ i }\): Marcas de clase; \({ f}_{ i }\): Frecuencia Absoluta; \(k\): Número de intervalos.
Aplicando logaritmo a ambos miembros de la ecuación anterior se tiene:
\[MG=anti.log \left[ \frac{ \sum_{ i=1 }^{ k } f_{i} { log .x_{i}} }{n} \right]\]
Para el cálculo de Media Geométrica para datos tabulados del caso 2, utilizamos la marca de clase \({ x }_{ i }\) y las frecuencias abosolutas \({ f}_{ i }\) las cuales ya se almacenaron el la variable xi y fi respectivamente, por lo tanto el código será de la siguiente manera:
(prod(xi^fi))^(1/n)
## [1] 165.364
\[MA= \frac{n}{ \frac{ f_{1} }{ x_{1} }+ \frac{ f_{2} }{ x_{2} }+...+\frac{ f_{k} }{ x_{k} }}= \frac{n}{ \sum_{i=1}^k \frac{ f_{i} }{ x_{i} } } \]
Donde: \({ x }_{ i }\): Marcas de clase; \({ f}_{ i }\): Frecuencia Absoluta; \(k\): Número de intervalos. También se puede usar las frecuencias relativas: \[MA= \frac{1}{ \sum_{i=1}^k \frac{ h_{i} }{ x_{i} } } \] Aplicando la formula tenemos:
n/sum(fi/xi)
## [1] 165.228
Determinar la clase que contiene La Mediana, para lo cual se busca el valor \(n/2\) en la frecuencia acumulada \(F_{i}\)
Formula \[Me={ LI }_{ Me }+\left[ \frac { \left( \frac { n }{ 2 } \right) -{ F }_{ Me-1 } }{ { f }_{ Me } } \right] C_{Me}\]
Donde:
\(LI_{Me}\): Limite inferior de la clase de la mediana.
\({ F }_{ Me-1 }\): Frecuencia absoluta acumulada anterior a la clase de la mediana.
\({ f }_{ Me }\): Frecuencia absoluta de la clase que contiene la mediana.
\(C_{Me}\): Amplitud interválica de la clase que contiene la mediana.
Para aplicar la formula de la mediana, en primer lugar determinamos la clase de la Mediana
n/2
## [1] 25
Este resultado buscamos en la frecuencia absoluta acumulada \(F_{i}\)
Encontrando que este valor pertenece al intervalo cuatro, una vez determinado la clase de la mediana, reemplazamos los valores en la formula.
165 + ((n/2-23)/14)*5
## [1] 165.7143
Determinar la clase que contiene La Moda (clase modal), para lo cual se busca el valor mas alto en la frecuencia absoluta \(f_{i}\).
Formula \[Mo={ LI }_{ Mo }+\left[ \frac { { \Delta }_{ 1 } }{ { \Delta }_{ 1 }+{ \Delta }_{ 2 } } \right] C\]
\[{ \Delta }_{ 1 }={ f }_{ i }-{ f }_{ i-1 }\] \[{ \Delta }_{ 2 }={ f }_{ i }-{ f }_{ i+1 }\]
Donde:
\(LI_{Mo}\): Limite inferior de la clase Modal.
\({ f }_{ i }\): Frecuencia absoluta de la clase modal.
\({ f }_{ i-1 }\): Frecuencia absoluta anterior a la clase modal.
\({ f }_{ i+1 }\): Frecuencia absoluta posterior a la clase modal.
\(C\): Amplitud interválica de la clase modal.
Para el calculo de la Moda en primer lugar determinamos la clase modal para lo cual buscamos el intervalo que presenta la mayor frecuencia absoluta, encontrado de esta manera que la clase modal pertenece al cuarto intervalo y como siguiente paso reemplazamos los valores en la formula
165+(2/(2+4))*5
## [1] 166.6667