Plantilla para los trabajos
Utiliza este documento para presentar las prácticas de una manera sencilla y bonita.
Se cumple que \(p(A)= \frac{3}{5}\), \(p(B)=\frac{2}{3}\), \(p(A\cup B)=\frac{5}{6}\). Calcula, sabiendo que son independientes:
\(p(A/B)\)
\(p(A \cap B) = \frac{3}{5}\) x \(\frac{2}{3} = \frac{6}{15}\)
\(p(A/B)\) = \(\frac{p(A\cap B)}{p(B)}\) = \(\frac{\frac{6}{15}}{\frac{2}{3}}\) = \(\frac{3}{5}\)
\(p(B/A)\)
\(p(B/A)\) = \(\frac{p(B\cap A)}{p(A)}\) = \(\frac{\frac{6}{15}}{\frac{3}{5}}\) = \(\frac{2}{3}\)
\(p(A \cap B^c)\)
\(p(B^c) = 1 - p(B)\) entonces, \(p(B^c)= \frac{1}{3}\)
\(p(A \cap B^c)\) = \(p(A)\) x \(p(B^c)\) = \(\frac{3}{5}\) x \(\frac{1}{3}\) = \(\frac{3}{15}\)
\(p(A/B^c)\)
\(p(A/B^c)\) = \(\frac{p(A \cap B^c)}{p(B^c)}\) = \(\frac{\frac{3}{15}}{\frac{1}{3}}\) = \(\frac{3}{5}\)
Sean X una variable exponencial de media 5.
\(P(3\leq X\leq
8)\)=pexp(8, 1/5) - pexp(3, 1/5)=0.3469151
pexp(8, 1/5) - pexp(3, 1/5)
## [1] 0.3469151
\(Var(X)=1/0.25^2\)=1/0.25^2=16
1/0.25^2
## [1] 16
\(P(X>7/X>4)=\frac{P(X>7)}{P(X>4)}=\frac{1-P(X<7)}{1-P(X<4)}\)=(1-pexp(7,1/5))/(1-pexp(4,1/5))=0.5488116
(1-pexp(7,1/5))/(1-pexp(4,1/5))
## [1] 0.5488116
\(P(x<5)=1-P(x>=5)\)
=pexp(5, 1/5)=0.6321206
pexp(5, 1/5)
## [1] 0.6321206
***
Se celebra un concurso en el cual, si el concursante acierta 10 preguntas, con 4 posibles respuestas para cada pregunta, ganara un premio.
Sin embargo, el concursante no esta seguro de saber la respuesta correcta de ninguna pregunta, y decide responder de manera aleatoria.
Calcula cual es la probabilidad de…
X = Probabilidad de acierto de una sola pregunta
X~Bi(50,0.25)
Primer cuartil
qbinom(0.25,10,0.75)
## [1] 7
Mediana
qbinom(0.5,10,0.75)
## [1] 8
P(X<5)=1-P(X>=5)
1 - pbinom(5,10,0.25)
## [1] 0.01972771
P(6<Y<8)=P(X<8)-P(X<6)
pbinom(8,10,0.25)-pbinom(6,10,0.25)
## [1] 0.003476143
P(X=10)
dbinom(10,10,0.25)
## [1] 9.536743e-07
(Primer apartado)
20 jugadores profesionales de fútbol distintos han sido reunidos para realizar un estudio. Se han realizado mediciones en la velocidad máxima que alcanza el esférico cuando chutan con su máxima potencia (Una medición por cada futbolista). A continuación se adjuntan las mediciones obtenidas (en km/h): 85, 89, 90, 85, 91, 86, 97, 79, 101, 89, 88, 110, 95, 86, 85, 82, 81, 96, 92, 87.
x=c(85,89,90,85,91,86,97,79,101,89,88,110,95,86,85,82,81,96,92,87)
mean(x)
## [1] 89.7
sd(x)
## [1] 7.334848
median(x)
## [1] 88.5
quantile(x,0.25)
## 25%
## 85
quantile(x,0.75)
## 75%
## 92.75
IQR(x)
## [1] 7.75
(Segundo apartado)
El jugador Javier Galán tiene el record del disparo más potente de la historia con 138 km/h. Debido a las mejoras en el aspecto físico de los jugadores en el futuro, se prevee que la probabilidad de que un jugador profesional promedio en el futuro supere los 138 km/h en un disparo, es de un 0.15. Cuando en el futuro se realice otro estudio con 20 jugadores en el que el comportamiento de los jugadores sea independiente, calcula…
P(X=3)
dbinom(3,20,0.15)
## [1] 0.2428289
P(X=0)
dbinom(0,20,0.15)
## [1] 0.03875953
La anchura de las puertas blindadas utilizadas en los bancos españoles tienen una distribución normal con media 1.5 metros y desviación estándar de 0.10 metros.
Su distribucion es: X∼N(1.5,0.10)
Probabilidad de que las puertas blindadas tengan una anchura de menos de 1.8 metros y de mas de 1.2 metros.Sabiendo que si miden mas de 1.8 metros o menos de 1.2 metros, esas puertas no sirven. ¿Cuál es la proporció.n de puertas inservibles?
P(1.8 >= X U X >= 1.2)= 1 - P(1.2 <= X <= 1.8)= 1 - (P(X<=1.8)-P(X<=1.2)) = 1 - (pnorm(1.8,1.5,0.1) - pnorm(1.2,1.5,0.1)) = 1 - 0.9973 = 0.0027
La probabilidad de que al seleccionar 3 puertas blindadas,tengan una anchura de menos de 1.8 metros y de mas de 1.2 metros.¿ Y cuál es la probabilidad de que todas sean inservibles?
Como conocemos la probabilidad de que sean inservibles, ahora tenemos que calcular la probabilidad de que ninguna sea inservibles
P(Y = 0) = dbinom(0,3,0.0027) = 0.9919 P(Y = 3) = 1 - 0.9919 = 0.0080
La probabilidad de que el ancho de 3 puertas blindadeas, de al menos dos tengan una anchura de menos de 1.8 metros y de mas de 1.2 metros.
Como conocemos la probabilidad de que sean inservibles, ahora tenemos que calcular la probabilidad de que 1 o ninguna sean inservibles
P(X<=1) = ppbinom(1,3,0.0027) = 0.9999782
La probabilidad de que la media de los anchos esté entre 1.8 y 1.2 metros.
Por el teorema central del límite, al ser X ∼ N(1.5,0.1) y n = 3, tenemos que X∼N (1.5,(0.1/√ 3)=N(1.5,√3/30)
P(1.8 <= X <= 1.2) = P(Z<=(1.8-1.5)/√3/30)-P(Z<=(1.2-1.5)/√3/30)= P(Z<=5.19)-P(Z<=-5.19)= pnorm(5.19,1.5,sqrt(3)/30) - pnorm(-5.19,1.5,sqrt(3)/30)= 1
Se sabe que la duración, en horas, de un foco de 75 watts tiene una distribución aproximadamente normal, con una desviación estándar de σ=25 horas. Se toma una muestra aleatoria de 20 focos, la cual resulta tener una duración promedio de x̄= 1014 horas.
bar_x = 1014 (x̄)
sigma=25 (σ)
n=20 (n)
alpha=0.05 (α)
¿z_alpha2 -> (\(Z_{\alpha/2}\))?
qnorm(1-0.05/2)
## [1] 1.959964
Por la derecha:
\(\bar{X} + Z_{\alpha/2} \frac{\sigma}{\sqrt{n}}\)
1014 + 1.96*25/sqrt(20)
## [1] 1024.957
Por la izquierda:
\(\bar{X} - Z_{\alpha/2} \frac{\sigma}{\sqrt{n}}\)
1014 - 1.96*25/sqrt(20)
## [1] 1003.043
Utilizamos la siguiente fórmula:
\(n=\frac{Z^2\sigma^2}{e^2}\)
α=0.1 (alpha)
\(Z\)= qnorm(1- α/2) -> 1.645
\(n=\frac{(1.645^2)(25^2)}{8^2} = 26.426\)
p =40/100 = 0.4
1 − pˆ = 0.6
α = 0.2
Z =
qnorm(1-0.2/2)
## [1] 1.281552
Por tanto, el intervalo es:
0.4- 1.281 * sqrt(0.4*0.6/100)
## [1] 0.3372441
0.4+ 1.281 * sqrt(0.4*0.6/100)
## [1] 0.4627559
El intervalo es: (0.33, 0.46)
alpha=0.05 (α)
\(Z_{\alpha/2}\)
qnorm(1-0.05/2)
## [1] 1.959964
\(P(1000 < Z < 1050) = P((1000-1025)/1.95 < Z < (1050-1025)/1.95) = P( -12.82< Z < 12.82) =\)
\(183.6831 - 179.0965 = 4.5866\)
(1014 + 12.82) / (25 / sqrt(20))
## [1] 183.6831
(1014 - 12.82) / (25 / sqrt(20))
## [1] 179.0965
Un fabricante de bombillas afirma que la duración promedio de su producto es de 2000 horas. Para comprobar esta afirmación, se selecciona una muestra aleatoria de 100 bombillas y se obtiene un tiempo promedio de duración de 1900 horas, con una desviación estándar de 250 horas. Realiza un contraste de hipótesis paramétrico para determinar si la afirmación del fabricante es correcta o no, utilizando un nivel de significación del 5%.
#1. La prueba de hipotesis y el nivel de significacion seria:
La prueba de hipotesis seria: Hipótesis nula, H0: La duración promedio de las bombillas es igual a 2000 horas. Hipótesis alternativa, H1: La duración promedio de las bombillas es menor a 2000 horas. El nivel de significacion es α = 0.05
#2.El calculo de la estadistica de contraste es:
x_bar <- 1900 # Media muestral
mu_0 <- 2000 # Media poblacional hipotética
s <- 250 # Desviación estándar muestral
n <- 100 # Tamaño de la muestra
z <- (x_bar - mu_0)/(s/sqrt(n))
z
## [1] -4
#3.El calculo de p-valor es:
p_valor <- pnorm(z, lower.tail = TRUE)
p_valor
## [1] 3.167124e-05
#4. Toma de decision:
Como el p-valor es menor que el nivel de significación, se rechaza la hipótesis nula. Por lo tanto, hay suficiente evidencia estadística para afirmar que la duración promedio de las bombillas es menor a 2000 horas. Por lo que, se puede decir que la afirmación del fabricante de que la duración promedio de sus bombillas es de 2000 horas es incorrecta, ya que la muestra proporciona suficiente evidencia para decir que la duración promedio es menor a 2000 horas.
En una empresa de venta de electrodomésticos no están muy satisfechos con su plan actual de marketing. Debido a ello, han elavorado un nuevo plan de marketing que resulte más efectivo. Para determinar la efectividad de este nuevo plan de marketing, se han comparado las ventas antes y después de emplear el nuevo plan de marketing. Se tiene en cuenta que el numero de unidades vendidas no sigue una distribución normal.
Se representa un conjunto de datos que muestra el número de unidades de electrodomésticos vendidas antes y después de emplear el nuevo plan de marketing en 10 semanas a través de una tabla:
library(knitr)
data<- data.frame(
Semana = c(1,2,3,4,5,6,7,8,9,10),
Antes = c(78,73,83,88,76,81,86,89,87,98),
Despues = c(68,63,80,90,74,73,83,83,89,88)
)
tabla<-kable(data, caption = "Número de unidades de electrodomésticos vendidas")
tabla
| Semana | Antes | Despues |
|---|---|---|
| 1 | 78 | 68 |
| 2 | 73 | 63 |
| 3 | 83 | 80 |
| 4 | 88 | 90 |
| 5 | 76 | 74 |
| 6 | 81 | 73 |
| 7 | 86 | 83 |
| 8 | 89 | 83 |
| 9 | 87 | 89 |
| 10 | 98 | 88 |
Teniendo en cuenta que se trata de dos muestras emparejadas y que el enunciado nos dice que el número de unidades vendidas no sigue una distribución normal, empleamos el test no paramétrico apropiado, que en este caso es el Test de los signos.
A)Hipótesis nula (H0): La mediana de las diferencias es igual a 0.
B)Hipótesis alternativa (H1): La mediana de las diferencias NO es igual a 0.
C)nivel de significacion (α) = 0.05 (Valor por defecto cuando no se indica un valor diferente)
El efecto que tiene el nivel de significación es que a medida que este disminuye, se requiere un mayor grado de diferencia entre las muestras para poder rechazar la hipótesis nula.
Para calcular el valor del estadístico, compruebo cuantos positivos y negativos hay y escojo el máximo:
Antes = c(78,73,83,88,76,81,86,89,87,98)
Despues = c(68,63,80,90,74,73,83,83,89,88)
sum((Antes-Despues)>0)
## [1] 8
sum((Antes-Despues)<0)
## [1] 2
Llegamos a la conclusión de hay 8 positivos y 2 negativos, por lo tanto el máximo es 8.
A continuación, calculo el umbral:
qbinom(1-(0.05/2),10,0.5)
## [1] 8
Ya que Bs no es mayor que Bα/2, no se rechaza la hipótesis nula.
Visto que el nuevo plan de marketing no representa ninguna diferencia significativa con el anterior plan de marketing, podemos afirmar que no es efectivo.
Se desea evaluar la efectividad de tres diferentes tipos de fertilizantes en el crecimiento de plantas de tomate. Se tienen tres grupos de plantas, donde cada grupo ha sido tratado con uno de los tres fertilizantes diferentes. Se midió la altura de cada planta después de tres semanas de tratamiento y se registró el resultado. Se quiere determinar si hay diferencias significativas entre los tres tipos de fertilizantes en términos de su efectividad en el crecimiento de las plantas.
library(knitr)
datos<- data.frame(
Tratamiento_1 = c(.46, 3.8, 4.1, 5.2, 3.7),
Tratamiento_2 = c(6.1, 4.9, 5.7, 6.2, 5.1),
Tratamiento_3 = c(5.2, 4.4, 5.5, 6.0, 5.3)
)
tabla<-kable(datos, caption = "Anova")
tabla
| Tratamiento_1 | Tratamiento_2 | Tratamiento_3 |
|---|---|---|
| 0.46 | 6.1 | 5.2 |
| 3.80 | 4.9 | 4.4 |
| 4.10 | 5.7 | 5.5 |
| 5.20 | 6.2 | 6.0 |
| 3.70 | 5.1 | 5.3 |
Para comprobar que siguen una normal hacemos uso del metodo shapiro.test()
shapiro.test(c(4.6, 3.8, 4.1, 5.2, 3.7, 6.1, 4.9, 5.7, 6.2, 5.1, 5.2, 4.4, 5.5, 6.0, 5.3))
##
## Shapiro-Wilk normality test
##
## data: c(4.6, 3.8, 4.1, 5.2, 3.7, 6.1, 4.9, 5.7, 6.2, 5.1, 5.2, 4.4, 5.5, 6, 5.3)
## W = 0.95244, p-value = 0.5637
Como p_valor es mayor mayor que el nivel de significancia (por lo general, 0.05), se acepta la hipótesis nula de que los datos provienen de una distribución normal.
Para calcular la desviación utilizamos el metodo sd() con los datos que tengamos:
datos<-c(4.6, 3.8, 4.1, 5.2, 3.7, 6.1, 4.9, 5.7, 6.2, 5.1, 5.2, 4.4, 5.5, 6.0, 5.3)
sd(datos)
## [1] 0.8016649
datos<-c(4.6, 3.8, 4.1, 5.2, 3.7, 6.1, 4.9, 5.7, 6.2, 5.1, 5.2, 4.4, 5.5, 6.0, 5.3)
grupo1 <- c(4.6, 3.8, 4.1, 5.2, 3.7)
grupo2 <- c(6.1, 4.9, 5.7, 6.2, 5.1)
grupo3 <- c(5.2, 4.4, 5.5, 6.0, 5.3)
media_total<-mean(datos)
media_grupo1 <- mean(grupo1)
media_grupo2 <- mean(grupo2)
media_grupo3 <- mean(grupo3)
n<-5
SSE <- (n * ((media_grupo1 - media_total)^2 + (media_grupo2 - media_total)^2 + (media_grupo3 - media_total)^2))
SSE
## [1] 4.741333
SSD <- sum((grupo1 - media_grupo1)^2) + sum((grupo2 - media_grupo2)^2) + sum((grupo3 - media_grupo3)^2)
SSD
## [1] 4.256
SST = SSE + SSD; 4.741333 + 4.256 = 8.997333
b(nº grupos) = 3; n(tamaño grupo) = 5
MSE(entre grupos) = \[\frac{SSE}{b-1}\] = \[\frac{4.741333}{3-1}\] = 2.370667
MSD(dentro) = \[\frac{SSD}{n-b}\] = \[\frac{4.256}{5-3}\] = 2.128