library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.0.4
## -- Attaching packages --------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.3     v purrr   0.3.4
## v tibble  3.0.6     v dplyr   1.0.4
## v tidyr   1.1.2     v stringr 1.4.0
## v readr   1.4.0     v forcats 0.5.1
## Warning: package 'ggplot2' was built under R version 4.0.4
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
  1. [0,2] Ejercicio 1 (partes a y b), capítulo 7, página 263. Pueden usar R para la parte a. Para esto deben crear un vector con los elementos y luego usar la función combn para enumerar las muestras, así:
elementos <- c("a", "b", "c", "d", "e")
combn(x = elementos, m = 2)
##      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
## [1,] "a"  "a"  "a"  "a"  "b"  "b"  "b"  "c"  "c"  "d"  
## [2,] "b"  "c"  "d"  "e"  "c"  "d"  "e"  "d"  "e"  "e"
  1. ¿Cuál es la probabilidad que tiene cada muestra de tamaño 2 de ser seleccionada?
pnorm(2)
## [1] 0.9772499
  1. dados los datos que probienen de una muestra a leatoria simple
elementos <- c(5, 8, 10, 7, 10, 4)
  1. ¿Cuál es la estimación puntual de la media poblacional?

media muestral x

median.default(5, 8, 10, 7, 10, 4)
## [1] 5

b.¿Cuál es la estimación puntual de la desviación estándar poblacional?

  1. La media de una población es 200 y su desviación estándar es 50. Se va a tomar una muestra aleatoria simple de tamaño 100 y se usará la media muestral para estimar la media poblacional.
  1. ¿Cuál es el valor esperado de x?

E(x)= 200

  1. ¿Cuál es la desviación estándar de x?
sigma <- 50 
n <-100
ee <- 50/sqrt(100)

ee= 5 c. Muestre la distribución muestral de x

plot_normal=function(m,de)
{
  li = qnorm(0.00001, mean=m, sd=de, lower.tail=TRUE)
  ls = qnorm(0.99999, mean=m, sd=de, lower.tail=TRUE)
  curve(dnorm(x, mean=m, sd=de), from=li, to=ls,
        ylab = "Probabilidad",
        xlab = "Valores de X",
        main = "Distribución Normal",
        col="blue")
}
plot_normal(200,5)

  1. ¿Qué muestra la distribución muestral de x?

muestra todos los posibles valores de x, es decir todas las posibles medias muestrales

  1. Suponga que la desviación estándar poblacional es σ= 25. Calcule el error estándar de la media,σ , con muestras de tamaño 50, 100, 150 y 200. ¿Qué puede decir acerca del error estándar de la media conforme el tamaño de la muestra aumenta?
sigma <- 25
n <- 50
ee <- 25/sqrt(50)
ee
## [1] 3.535534

ee = 3.53553

sigma <- 25
n <- 100
ee <- 25/sqrt(100)
ee
## [1] 2.5

ee = 2.5

sigma <- 25
n <- 150
ee <- 25/sqrt(150)
ee
## [1] 2.041241

ee = 2.0412

sigma <- 25
n <- 200
ee <- 25/sqrt(200)
ee
## [1] 1.767767

ee = 1.7677

se puede evidenciar que a medida que la muestra aumenta, el error estándar es cada vez menor. Se ve que cuando la muestra es 50, el error estándar es al rededor de 3.5 y que por el contrario, cuando se aumenta la muestra a 200, el error estándar es 1.7

  1. El costo medio de la colegiatura en una universidad estatal de Estados Unidos es $4260 anuales. Considere este valor como media poblacional y asuma que la desviación estándar poblacional es σ=900. Suponga que selecciona una muestra aleatoria de 50 universidades.
media = 4260
  1. Presente la distribución muestral de x como media muestral de la colegiatura en las 50 universidades.
sigma <- 900
n <- 50
ee = 900/sqrt(50)
ee
## [1] 127.2792

ee= 127.27922

plot_normal=function(m,de)
{
  li = qnorm(0.00001, mean=m, sd=de, lower.tail=TRUE)
  ls = qnorm(0.99999, mean=m, sd=de, lower.tail=TRUE)
  curve(dnorm(x, mean=m, sd=de), from=li, to=ls,
        ylab = "Probabilidad",
        xlab = "Valores de X",
        main = "Distribución Normal",
        col="blue")
}
plot_normal(50, 127.27)

  1. ¿Cuál es la probabilidad de que la muestra aleatoria simple proporcione una media muestral que no difiera de la media poblacional en más de $250?
pnorm(250, mean = media, sd =ee)
## [1] 3.647569e-218
  1. ¿Cuál es la probabilidad de que la muestra aleatoria simple proporcione una media muestral que no difiera de la media poblacional en más de $100?
  1. BusinessWeek realizó una encuesta entre los estudiantes que terminaban sus estudios en los 30 programas de una maestría (BusinessWeek, 22 de septiembre de 2003). De acuerdo con esta encuesta el salario medio anual de una mujer y de un hombre 10 años después de terminar sus estudios es $117 000 y $168 000, respectivamente. Suponga que la desviación estándar entre los salarios de las mujeres es $25 000 y entre los salarios de los hombres es $40 000.
  1. ¿Cuál es la probabilidad de que en una muestra aleatoria simple de 40 hombres la media muestral no difiera más de $10 000 de la media poblacional de $168 000?
media <- 40
EEp <- 40000

pnorm(178000, mean = media, sd = EEp)
## [1] 0.9999957
  1. ¿Cuál es la probabilidad de que en una muestra aleatoria simple de 40 mujeres la media muestral no difiera más de $10 000 de la media poblacional de $117 000?
media <- 40
EEp <- 25000
pnorm(127000, mean = media, sd = EEp)
## [1] 0.9999998
  1. ¿En cuál de los dos casos, inciso a o inciso b, hay más probabilidad de obtener una media muestral que no difiera en más de $10 000 de la media poblacional? ¿Por qué?

Se puede evidenciar que en el de las mujeres hay más probabilidad porque se acerca más a 1. segun la probabilidad arrojada en el inciso b.

  1. ¿Cuál es la probabilidad de que en una muestra aleatoria simple de 100 hombres, la media muestral no difiera en más de $4000 de la media poblacional?
media <- 100
EEp <- 4000
pnorm(172000, mean = media, sd =EEp)
## [1] 1
  1. En el norte de Kentucky (The Cincinnati Enquirer, 21 de enero de 2006) el precio promedio de la gasolina sin plomo era $2.34. Use este precio como media poblacional y suponga que la desviación estándar poblacional es $0.20.
  1. ¿Cuál es la probabilidad de que el precio medio en una muestra de 30 gasolineras no difiera en más de $0.30 de la media poblacional?
media <- 30
EEp <- 0.20
pnorm(2.64, mean = media , sd = EEp)
## [1] 0
  1. ¿Cuál es la probabilidad de que el precio medio en una muestra de 50 gasolineras no difiera en más de $0.30 de la media poblacional?
media <- 50
EEp <- 0.20
pnorm(2.64, mean = media , sd = EEp)
## [1] 0
  1. ¿Cuál es la probabilidad de que el precio medio en una muestra de 100 gasolineras no difiera en más de $0.30 de la media poblacional?
media <- 100
EEp <- 0.2
pnorm(2.64, mean = media , sd = EEp)
## [1] 0
  1. ¿Recomendaría usted alguno de los tamaños muestrales de los incisos a, b o c para que la probabilidad de que el precio muestral no difiriera en más de $0.30 de la media muestral fuera $0.95?
media <- 30 
EEp <- 0.2
pnorm(1.25, mean = media , sd = EEp)
## [1] 0
media <- 50
EEp <- 0.2
pnorm(1.25, mean = media , sd = EEp)
## [1] 0
media <- 100
EEp <- 0.2
pnorm(1.25, mean = media , sd = EEp)
## [1] 0

como se evidenció todos los incisos dan 0, es decir que la probabilidad que que difieran de los valores aportados por el problema es nula, por consiguiente no recomendaría ninguno de los tamaños ya que la probabilidad es 0.

  1. De una muestra aleatoria de tamaño 100 de una población en la que p = 0.40.
  1. ¿Cuál es el valor esperado de p? el valor esperado de p es la media de todos los posibles de p, es decir que el valor esperado es igual a la proporción poblacional.

E(p)= p E(p)= 0,4

  1. ¿Cuál es el error estándar de p?
x= 0.4*(1-0.4)/100
EEp = sqrt(x)

EEp = 0.04889

  1. Exprese la distribución muestral de p.
plot_normal=function(m,de)
{
  li = qnorm(0.00001, mean=m, sd=de, lower.tail=TRUE)
  ls = qnorm(0.99999, mean=m, sd=de, lower.tail=TRUE)
  curve(dnorm(x, mean=m, sd=de), from=li, to=ls,
        ylab = "Probabilidad",
        xlab = "Valores de X",
        main = "Distribución Normal",
        col="blue")
}
plot_normal(100, 0.048)

  1. ¿Qué indica la distribución muestral de ?

indica que tiene una proporción normal porque np > 5 y n(1-p)>5

  1. Suponga que la proporción poblacional es 0.55. Calcule el error estándar de la proporción, , para los tamaños de muestra 100, 200, 500 y 1000. ¿Qué puede decir acerca del tamaño del error estándar a medida que el tamaño de la muestra aumenta?
EEp = sqrt(0.55*(1-0.55)/100)
EEp
## [1] 0.04974937

EEp= 0.04974

EEp = sqrt(0.55*(1-0.55)/200)
EEp
## [1] 0.03517812

EEp= 0.03517

EEp = sqrt(0.55*(1-0.55)/500)
EEp
## [1] 0.0222486

EEp= 0.022248

EEp = sqrt(0.55*(1-0.55)/1000)
EEp
## [1] 0.01573213

EEp= 0.01573

se puede ver que a medida que se aumenta el tamaño de la muestra, el error estándar se hace cada vez más èuqeño. En ese sentido, es necesario cuadruplicar el tamaño de la muestra para reducir el error estándar a la mitad porque se está sacando raíz cuadrada de la muestra N.

  1. Los sondeos de Time/CNN entre los votantes siguieron la opinión del público respecto de los candidatos presidenciales en las votaciones del 2000. En uno de estos sondeos Yankelovich Partners empleó una muestra de 589 probables votantes (Time, 26 de junio de 2000). Suponga que la proporción poblacional a favor de un determinado candidato a la presidencia haya sido p =0.50. Sea la proporción muestral en los posibles votantes que está a favor de ese candidato a la presidencia.
  1. Muestre la distribución muestral de p.
plot_normal=function(m,de)
{
  li = qnorm(0.00001, mean=m, sd=de, lower.tail=TRUE)
  ls = qnorm(0.99999, mean=m, sd=de, lower.tail=TRUE)
  curve(dnorm(x, mean=m, sd=de), from=li, to=ls,
        ylab = "Probabilidad",
        xlab = "Valores de X",
        main = "Distribución Normal",
        col="blue")
}
EEp = sqrt(0.5*(1-0.5)/589)
EEp
## [1] 0.02060214

EEp = 0.02060

plot_normal(589, 0.02060)

  1. ¿Cuál es la probabilidad de que los sondeos de Time/CNN indiquen que la diferencia entre las proporciones muestral y poblacional en uno de estos sondeos no sea mayor que +-0.04?
media <- 589
EEp <- 0.02060
pnorm(602, mean = media, sd = EEp)-pnorm(594, mean = media, sd = EEp)
## [1] 0
  1. ¿Cuál es la probabilidad de que los sondeos de Time/CNN indiquen que la diferencia entre las proporciones muestral y poblacional en uno de estos sondeos no sea mayor que +-0.03?
pnorm(592, mean = media, sd = EEp)-pnorm(586, mean = media, sd = EEp)
## [1] 1
  1. ¿Cuál es la probabilidad de que los sondeos de Time/CNN indiquen que la diferencia entre las proporciones muestral y poblacional en uno de estos sondeos no sea mayor que +-0.02?
pnorm(591, mean = media, sd = EEp)-pnorm(587, mean = media, sd = EEp)
## [1] 1
  1. El Food Marketing Institute informa que 17% de los hogares gastan más de $100 en productos de abarrotes. Suponga que la proporción poblacional es p = 0.17 y que de la población se toma una muestra aleatoria simple de 800 hogares.
  1. Exprese la distribución muestral de p, la proporción muestral de hogares que gastan más de $100 semanales en abarrotes.
plot_normal=function(m,de)
{
  li = qnorm(0.00001, mean=m, sd=de, lower.tail=TRUE)
  ls = qnorm(0.99999, mean=m, sd=de, lower.tail=TRUE)
  curve(dnorm(x, mean=m, sd=de), from=li, to=ls,
        ylab = "Probabilidad",
        xlab = "Valores de X",
        main = "Distribución Normal",
        col="blue")
}  
EEp = sqrt(0.17*(1-0.17)/800)
EEp
## [1] 0.01328062

EEp = 0.01328

plot_normal(800, 0.01328)

  1. ¿Cuál es la probabilidad de que la proporción poblacional no difiera en más de 0.02 de la proporción poblacional?
media <- 800
EEp <- 0.01328
pnorm(800, mean = media, sd = EEp)
## [1] 0.5
  1. Conteste el inciso b en el caso de que el tamaño de la muestra sea 1600 hogares
pnorm(1600, mean = media, sd = EEp)
## [1] 1
  1. Un investigador informa sobre sus resultados diciendo que el error estándar de la media es 20. La desviación estándar poblacional es 500.
  1. ¿De qué tamaño fue la muestra usada en esta investigación?
ee = 20
o = 500

500/sqrt(n)=20

prueba:

ee= 500/sqrt(625)
ee
## [1] 20

ee = 20 b. ¿Cuál es la probabilidad de que la estimación puntual esté a no más de +-25 de la media poblacional?

pnorm(650, mean = media, sd = EEp)-pnorm(600, mean = media, sd = EEp)
## [1] 0