Sesión 1. Medidas de Tendencia Central y Dispersión
#Ejercicio 1.
recibos <- c(266.63,163.41,219.41,162.64,187.16,289.17,306.55,335.48,343.50,226.80,208.99,230.46)
# Media o Promedio
media_recibos<-mean(recibos)
media_recibos
## [1] 245.0167
#Mediana
mediana_recibos <- median(recibos)
mediana_recibos
## [1] 228.63
#Moda
#En R no hay una función directa para la Moda
#Rango
rango_recibos <- max(recibos)-min(recibos)
rango_recibos
## [1] 180.86
#Varianza
recibos1<-recibos-media_recibos
recibos1
## [1] 21.61333 -81.60667 -25.60667 -82.37667 -57.85667 44.15333 61.53333
## [8] 90.46333 98.48333 -18.21667 -36.02667 -14.55667
recibos2<-recibos1*recibos1
recibos2
## [1] 467.1362 6659.6480 655.7014 6785.9152 3347.3939 1949.5168 3786.3511
## [8] 8183.6147 9698.9669 331.8469 1297.9207 211.8965
recibos3<-sum(recibos2)
recibos3
## [1] 43375.91
varianza_poblacional<-recibos3/12
varianza_poblacional
## [1] 3614.659
desviacion_estandar_poblacional<-sqrt(varianza_poblacional)
desviacion_estandar_poblacional
## [1] 60.12203
Sesión 2. Distribución Normal

#Ejemplo 1
#a
a<-(pnorm(600,1300,600))*100
a
## [1] 12.16725
#b
b<-(pnorm(1500,1300,600)-pnorm(1000,1300,600))*100
b
## [1] 32.20211
#c
c<-(1-pnorm(2200,1300,600))*100
c
## [1] 6.68072
#Ejemplo 2
a2<-(pnorm(21,18.7,5)*100)
a2
## [1] 67.72419
a21<-(1-pnorm(21,18.7,5))*100
a21
## [1] 32.27581
#Ejemplo 3
a3<-(1-pnorm(90,80,4))*100
a3
## [1] 0.6209665
b3<-(pnorm(85,80,4)-pnorm(70,80,4))*100
b3
## [1] 88.81406
c3<-((1-pnorm(100,80,4))*100)*1000
c3
## [1] 0.02866516
d3<-((1-pnorm(90,80,4))*100)*1000
d3
## [1] 620.9665
Ejercicios del Mundo Real:

“Reto: Ejercicios del mundo real”
Capítulo 3: Medidas de Tendencia Central y Dispersión.
3-84
¿Qué reacción tendría usted si un aficionado al fútbol americano le
dijera lo siguiente? “Los Raiders de Rockland tienen un promedio de 3.6
yardas de recorrido por tierra. Como sólo necesitan 10 yardas para
anotar y tienen cuatro oportunidades para lograrlo, la anotación es
segura, siempre y cuando mantengan su forma de jugar por tierra.”
Respuesta: La afirmación es incorrecta porque ignora
completamente la variabilidad en yardas ganadas por carrera.
3-86
A continuación, se tienen 3 partes del presupuesto de defensa de un
año, a cada una de estas se le asignó, por parte del Congreso mexicano,
la misma cantidad de financiamiento:
*Salario de oficiales (total).
*Mantenimiento de la flota aérea.
*Adquisiciones de alimentos (total).
Tomando en cuenta la distribución de posibles resultados para los
gastos reales en cada una de éstas áreas, haga corresponder cada sección
a una de las curvas de la siguiente figura, fundamente su
respuesta.

Respuesta: Salarios de funcionarios: A; mantenimiento de
flota: C; adquisiciones de alimentos: B.
3-92
El 30 de junio de 1992, la capitalización de nueve mercados de
valores del Pacífico y Asia fue:
| Filipinas |
17 |
| Indonesia |
21 |
| Tailandia |
44 |
| Singapur |
50 |
| Malasia |
79 |
| Corea del Sur |
86 |
| Taiwan |
140 |
| Hong Kong |
178 |
| Australia |
203 |
a) Encuentre la media aritmética de los datos.
b) Encuentre la mediana de los datos.
c) Encuentre la moda de los datos.
d) ¿Cuál es la mejor medida de la tendencia central del conjunto de
datos?
e) Encuentre la desviación estándar de los datos. (La población
completa está incluida en ellos.)
capitalizacion <- c(17,21,44,50,79,86,140,178,203)
#a
media_capitalizacion<-mean(capitalizacion)
media_capitalizacion
## [1] 90.88889
#b
mediana_capitalizacion<- median(capitalizacion)
mediana_capitalizacion
## [1] 79
#c
#No hay moda para datos sin agrupar
#d
histograma_c<-hist(capitalizacion)

#Como la distribución está sesgada a la derecha, la mejor medida de tendencia central es la mediana.
#e
capitalizacion2<-capitalizacion-media_capitalizacion
capitalizacion3<-capitalizacion2*capitalizacion2
capitalizacion4<-sum(capitalizacion3)
varianza_poblacional_capitalizacion <- capitalizacion4/9
desviacion_estandar_poblacional_capitalizacion<-sqrt(varianza_poblacional_capitalizacion)
desviacion_estandar_poblacional_capitalizacion
## [1] 64.07365
3-100
Matthews, Young y Asociados, una agencia de consultorías de Chapell
Hill, tiene los siguientes registros que indican el número de días que
cada uno de sus 10 consultores de planta cobró el último año:
212 220 230 210 228 229 231 219 221 222
a) Sin calcular el valor de las medidas, ¿cuál de ellas cree usted
que le daría una mayor información acerca de esta distribución: el rango
(alcance) o la desviación estándar?
b) Calcule: Rango, Varianza y Desviación Estándar.
c) Tomando en cuenta la dificultad y el tiempo para calcular cada
medida que revisó en el inciso a), ¿cuál sugeriría como la mejor?
d) ¿Qué haría que usted cambiara su opinión al respecto?
RESPUESTA
a) desviación estandar:
b)
dias<- c(212,220,230,210,228,229,231,219,221,222)
rango_dias <-max(dias)-min(dias)
rango_dias
## [1] 21
media_dias <-mean(dias)
media_dias
## [1] 222.2
dias2 <- dias-media_dias
dias3<- dias2*dias2
dias4<-sum(dias3)
varianza_poblacional_dias<-dias4/10
varianza_poblacional_dias
## [1] 48.76
desviacion_estandar_poblacional_dias<-sqrt(varianza_poblacional_dias)
desviacion_estandar_poblacional_dias
## [1] 6.982836
c) Desviación Estandar
3-106
Allison Barett realiza análisis estadísticos para un equipo de
carreras automovilísticas. A continuación, se presentan las cifras en
kilómetros por litro del gasto de combustible de sus automóviles en las
carreras recientes:
4.77 6.11 6.11 5.05 5.99 4.91 5.27 6.01 5.75 4.89 6.05 5.22 6.02
5.24 6.11 5.02
a) Calcule la mediana del consumo de combustible.
b) Calcule la media del mismo consumo.
c) Agrupe los datos en 5 clases de igual tamaño. ¿Cuál es el
intervalo del valor de consumo de combustible para la clase modal?
d) ¿Cuál de las 3 medidas de tendencia central es la que mejor puede
servirle a Allison cuando haga un pedido de combustible? Explique su
respuesta.
e) ¿Cuál es el rango?
f) ¿Cuál es la varianza?
g) ¿Cuál es la desviación estándar? Establezca una conclusión a
partir de las medidas de dispersión.
RESPUESTA:
kilometros <-c(4.77,6.11,6.11,5.05,5.99,4.91,5.27,6.01,5.75,4.89,6.05,5.22,6.02,5.24,6.11,5.02)
#a
mediana_km <-median(kilometros)
mediana_km
## [1] 5.51
#b
media_km<-mean(kilometros)
media_km
## [1] 5.5325
#c)
clases_km<-cut(kilometros, breaks=5)
clases_km
## [1] (4.77,5.04] (5.84,6.11] (5.84,6.11] (5.04,5.31] (5.84,6.11] (4.77,5.04]
## [7] (5.04,5.31] (5.84,6.11] (5.57,5.84] (4.77,5.04] (5.84,6.11] (5.04,5.31]
## [13] (5.84,6.11] (5.04,5.31] (5.84,6.11] (4.77,5.04]
## Levels: (4.77,5.04] (5.04,5.31] (5.31,5.57] (5.57,5.84] (5.84,6.11]
clases_km2 <- table(clases_km)
clases_km2
## clases_km
## (4.77,5.04] (5.04,5.31] (5.31,5.57] (5.57,5.84] (5.84,6.11]
## 4 4 0 1 7
#d
histograma_km<-hist(kilometros)

histograma_km
## $breaks
## [1] 4.6 4.8 5.0 5.2 5.4 5.6 5.8 6.0 6.2
##
## $counts
## [1] 1 2 2 3 0 1 1 6
##
## $density
## [1] 0.3125 0.6250 0.6250 0.9375 0.0000 0.3125 0.3125 1.8750
##
## $mids
## [1] 4.7 4.9 5.1 5.3 5.5 5.7 5.9 6.1
##
## $xname
## [1] "kilometros"
##
## $equidist
## [1] TRUE
##
## attr(,"class")
## [1] "histogram"
# Depende...
#e)
rango_km<-max(kilometros)-min(kilometros)
rango_km
## [1] 1.34
8-64
Inspectores del gobierno, al investigar los cargos levantados contra
una embotelladora de bebidas no alcohólicas, de Texas, que no llenaba
adecuadamente sus productos, han muestreado 200 botellas y encontraron
que el promedio de llenado es de 31.7 onzas líquidas (aproximadamente
930 ml.) Se anuncia que las botellas contienen 32 onzas líquidas (946.33
ml.). Se sabe que la desviación estándar de la población es de 1.5 onzas
líquidas (44.36 ml.). ¿Deberían concluir los inspectores, al nivel de
significancia de 2%, que las botellas están siendo llenadas con menos
contenido, y emitir una sanción?
RESPUESTA:
Paso 1. Plantear hipótesis
H0: xbar =µ
H1: xbar ≠µ
Paso 2. Nivel de significancia
α=0.02
Paso 3. Zona de aceptacíon / rechazo

Paso 4. Función Pivotal
# ¿n>30? si, 200.
z_lleno<-(31.7-32)/(1.5/sqrt(200))
z_lleno
## [1] -2.828427
Paso 5. Conclusión
Se rechaza H0: Las botellas se llenan con menos contenido
