Parcial 1 Regresión Lineal

Retroalimentación

Author

Mariana Pacheco

Published

September 18, 2023

Problema 1.

Encuentre la media y la varianza de: \(W = 3\bar{X}-\bar{Y}-2\bar{Z}\), si se sabe que las variables aleatorias \(X_{i},Y_{i},Z_{i}\), tienen medias: \(\mu _{x}=2, \mu_{y}=-3, \mu _{z}=4\), y varianzas: \(\sigma_{x}^{2}=1, \sigma_{y}^{2}=5,\sigma_{z}^{2}=2\), el promedio de cada variable es resultado de un muestreo aleatorio de 30,25 y 44 individuos respectivamente.

Solución:

A) Encuentre la media

\(= E(3\bar{X}-\bar{Y}-2\bar{Z})\)
\(= 3\mu _{x}+\mu_{y}+ 2\mu _{z}\)
\(= 3(2)+3-2(4)\)
\(=1\)

B) Encuentre la varianza

\(= var(3\bar{X}-\bar{Y}-2\bar{Z})\)
\(= 9(\frac{1}{30})+(\frac{5}{25})+(\frac{2}{44})\)
\(= (\frac{3}{10})+(\frac{1}{5})+(\frac{1}{22})\)

Problema 2.

Sean \(X_{1},X_{2}...,X_{10}\) y \(Y_{1},Y_{2}...,Y_{12}\) muestras aleatorias independientes. Las \(X_{i}\) se distribuyen normal con media 7.2 y varianza 4.5 y las \(Y_{j}\) se distribuyen normal con media 14 y varianza 2.6. Calcule la probabilidad de que la suma de los promedios sea mayor a 24.

Solución:

\(= P(\bar{X}+\bar{Y}>24)\)
\(= E(\bar{ X}+\bar{Y})\) \(= E(\bar{X}) + E(\bar{Y})\)
\(= 7.2+14\) \(= 21.2\)

\(= var(\bar{ X}+\bar{Y})\) \(= var(\bar{X}) + var(\bar{Y})\)
\(= (\frac{4.5}{10})+(\frac{2.6}{12})\) \(= 0.66\)

mu1 <- 7.2
varianza1 <- 4.5
n1 = 10

mu2 <- 14
varianza2 <- 2.6
n2 = 12

p <- 24 # por lo menos mayor a 24

z <- (p - (mu1 + mu2))/(sqrt((varianza1/n1) + (varianza2/n2)))
z
[1] 3.429286

\(= P(\frac{(\bar{ X}+\bar{Y})-(\mu _{x}+\mu_{y})}{\sqrt{\frac{{\sigma_{y}}^{{2}}}{n_{1}}+\frac{\sigma_{y}^{2}}{n_{2}}}}>\frac{24-(21.2)}{\sqrt{0.66}})\)
\(= P(Z>3.44)\)

probabilidad <- 1 - pnorm(q = z)
porcentaje <- probabilidad*100
cat("La probabilidad es de", probabilidad, "es decir, el", porcentaje,"%")
La probabilidad es de 0.0003025861 es decir, el 0.03025861 %

Problema 3.

Para cada una de las situaciones planteadas (literales a,b,c,d), resuelva lo siguiente:

-Defina el espacio muestral
-Defina con claridad y precisión la población de interés. Indique si al población tiene un número finito o infinito de individuos
-Defina la variable aleatoria y su dominio, indique si al variable aleatoria es discreta o continua.

A) Se llamó por teléfono a personas de 200 casas en la ciudad de Richmondyse les pidió nombrar al candidato por el que votarían en al elección del presidente de al mesa directiva de al escuela.

B) Se lanzó 10 veces una moneda y se registraron 34 cruces.

C) Se probaron 200 pares de un nuevo tipo de calzado deportivo en un torneo de tenis profesional para determinar su duración y se encontró que, en promedio, duraron 4 meses.

D) En cinco ocasiones diferentes a una abogada el tomó 21, 26, 24,22y 21 minutos conducir desde su casa en los suburbios hasta su oficina en el centro de la ciudad.

Solución:

A)
Espacio Muestral: El espacio muestral está compuesto por los candidatos a los que las personas en las 200 casas en la ciudad de Richmond podrían votar en la elección del presidente de la mesa directiva de la escuela. .

Población de Interés: La población de interés son todas las personas que viven en las 200 casas en la ciudad de Richmond. Esta población es finita.

Variable Aleatoria: La variable aleatoria en este caso es el candidato por el que cada persona votaría en la elección del presidente de la mesa directiva de la escuela. El dominio de esta variable aleatoria es el conjunto de nombres de los candidatos. Esta variable es discreta, ya que solo puede tomar valores discretos y finitos correspondientes a los nombres de los candidatos.

B)
Espacio Muestral: Cara o sello.

Población de Interés: Resultado posible entre cara o sello.Esta población es infinita.

Variable Aleatoria: La variable aleatoria en este caso es el número de cruces (caras) obtenidas en los 10 lanzamientos de la moneda. El dominio de esta variable aleatoria es el conjunto de números enteros no negativos desde 0 hasta 10. Esta variable es discreta, ya que solo puede tomar valores discretos.

C)
Espacio Muestral: El espacio muestral está compuesto por los 200 pares de calzado deportivo que se probaron en el torneo de tenis profesional.

Población de Interés: La población de interés es la duración del nuevo tipo de calzado deportivo. En este caso, la población tiene un número infinito de zapatos.

Variable Aleatoria: La variable aleatoria en este caso es la duración de los pares de calzado deportivo, y su dominio es el conjunto de números reales no negativos, ya que la duración puede ser un número decimal.

D)
Espacio Muestral: El espacio muestral está compuesto por las cinco ocasiones diferentes en las que la abogada tomó el tiempo para conducir desde su casa hasta su oficina.

Población de Interés: La población de interés son las ocasiones en las que la abogada viaja desde su casa en los suburbios hasta su oficina en el centro de la ciudad. No es una población de individuos, sino una población de eventos o situaciones específicas.

Variable Aleatoria: La variable aleatoria en este caso es el tiempo en minutos que toma a la abogada conducir desde su casa hasta su oficina en cada una de las cinco ocasiones. El dominio de esta variable aleatoria es el conjunto de números reales positivos. Esta variable es continua.

Problema 4.

Un experimento publicado en Popular Science comparó el ahorro de combustible para dos tipos de camiones compactos que funcionan con diésel y están equipados de forma similar. Suponga que se utilizaron 12 camiones Volkswagen y 10 Toyota en pruebas con una velocidad constante de 90 km/h. Los 12 camiones Volkswagen promedian 16 kilómetros por litro con una desviación estándar de 1.0 kilómetros por litro, y los Los 10 camiones Toyota promedian 11 kilómetros por litro con una desviación estándar de 0.8 kilómetros por litro. Suponga que las distancias por litro para cada modelo de camión están distribuidas de forma aproximadamente normal y que tienen varianzas iguales.

Solución:

A) Construya e interprete un intervalo de confianza del 92% para la diferencia entre los kilómetros promedio por litro de estos dos camiones compactos.

n1 <- 12 
n2 <- 10
s1 <- 1*1 
s2 <- 0.8*0.8
x1.barra <- 16
x2.barra <- 11
intervalo <- 0.92

#Calcular alpha
alpha <- 1 - intervalo
alpha
[1] 0.08
alpha.medio <- alpha/2
alpha.medio
[1] 0.04
#HALLAR MSE
MSE <- ((n1-1)*s1 + (n2-1)*s2)/((n1+n2)-2)
MSE
[1] 0.838
#HALLAR T.APLHA.MEDIO
t_alpha_2 <- qt(p = alpha.medio ,df = (n1+n2)-2 ,lower.tail = F)
t_alpha_2
[1] 1.844331
#hallar intervalo de confianza
se <- sqrt(MSE*(1/n1 + 1/n2)) 

xsup <- (x1.barra - x2.barra) + t_alpha_2*se
xinf <- (x1.barra - x2.barra) - t_alpha_2*se
cat("Se espera que si construyo 100 intervalos, en 92 de ellos exista:", "[",xinf, ",", xsup,"]")
Se espera que si construyo 100 intervalos, en 92 de ellos exista: [ 4.277094 , 5.722906 ]

B) Construya e interprete un intervalo de confianza del 97% para \(2\mu_{1}-\frac{3}{2}\mu _{2}+2\)

\(Estimador = 2\bar{X}_{1}-\frac{3}{2}\bar{X}_{2}+2\)
\(var(est) = 4\frac{{\sigma_{1}}^{{2}}}{n_{1}}+(\frac{9}{4}) \frac{\sigma_{2}^{2}}{n_{2}}\)

n1 <- 12 
n2 <- 10
s1 <- 1*1 
s2 <- 0.8*0.8
x1.barra <- 16
x2.barra <- 11
intervalo <- 0.97

#Calcular alpha
alpha <- 1 - intervalo
alpha
[1] 0.03
alpha.medio <- alpha/2
alpha.medio
[1] 0.015
#HALLAR MSE
MSE <- ((n1-1)*s1 + (n2-1)*s2)/((n1+n2)-2)
MSE
[1] 0.838
#HALLAR T.APLHA.MEDIO
t_alpha_2 <- qt(p = alpha.medio ,df = (n1+n2)-2 ,lower.tail = F)
t_alpha_2
[1] 2.336242
#hallar intervalo de confianza
se <- sqrt(MSE*(1/n1 + 1/n2)) 

xsup <- (2*x1.barra - (3/2*x2.barra)+2) + t_alpha_2*se
xinf <- (2*x1.barra - (3/2*x2.barra)+2) - t_alpha_2*se
cat("Se espera que si construyo 100 intervalos, en 97 de ellos exista:", "[",xinf, ",", xsup,"]")
Se espera que si construyo 100 intervalos, en 97 de ellos exista: [ 16.58428 , 18.41572 ]