Grupo CEn un estudio sobre los clientes de una tienda de ropa online, se comprueba que \(\frac{7}{10}\) de los usuarios que visitan la página, realizan la compra de una camiseta (p(A)), mientras que \(\frac{1}{2}\) de los usuarios realizan la compra de un pantalon (p(B)). Se sabe que estos dos eventos son independientes entre sí.
Sus probabilidades son:
\(p(A)= \frac{7}{10}\) , \(p(B)= \frac{1}{2}\)
a) \(p(A \cup B)\)
\(p(A \cup B) = p(A) + p(B) - p(A \cap B)\)
\(p(A \cup B) = \frac{7}{10} + \frac{1}{2} - ( \frac{7}{10}*\frac{1}{2} ) = \frac{17}{20}\)
b) \(p(A^c \cap B^c)\)
\(p(A^c) = 1 - p(A) = 1 - \frac{7}{10} = \frac{3}{10}\)
\(p(B^c) = 1 - p(B) = 1 - \frac{1}{2} = \frac{1}{2}\)
Por lo que el resultado quedaria:
\(p(A^c \cap B^c) =p(A^c) * p(B^c) = \frac{3}{10} * \frac{1}{2} = \frac{3}{20}\)
c) \(p(A \cap B^c)\)
Como sabemos que son independientes:
\(p(A \cap B^c) = p(A) * p(B^c)\)
\(p(A \cap B^c) = \frac{7}{10} * \frac{1}{2} = \frac{7}{20}\)
d) \(p(A|B)\)
Al igual aqui como A y B son variables independientes p(A|B) = p(A)
\(p(A|B) = \frac{p(A \cap B)}{p(B)} = \frac{p(A) * p(B)}{p(B)}\)
\(p(A|B) = \frac{\frac{7}{10} * \frac{1}{2}}{\frac{1}{2}} = \frac{7}{10}\)
Se realizan 20 preguntas en un juego
para ganar 1 iPad valorado en más de
0.14 Dogecoins. Existen
2^3 respuestas posibles para cada
pregunta, para ganar se deben acertar todas sin excepción.
a) ¿Cúal es la probabilidad de fallar 1?
0.8751 - pbinom(0,1,7/8)
## [1] 0.875
b) ¿Cúal es la probabilidad de acertar la mitad de las preguntas?
dbinom(10,20,1/8)
## [1] 4.526674e-05
c) ¿Cuál es la probabilidad de acertar más de 7 y menos de 12 preguntas?
pbinom(12,20,1/8) - pbinom(7,20,1/8)
## [1] 0.001852157
d) ¿Cuál es la probabilidad de acertar todas las preguntas menos la última?
dbinom(19,20,1/8)
## [1] 1.214306e-16
0.00000000000000012143 * 0.875
## [1] 1.062513e-16
Juan tiene un examen mañana de 10 preguntas cada una con 4 posibles repuestas.
Juan no se ha preparado nada. Por lo tanto, va a responder de manera aleatoria todas las preguntas.
Calcula las probabilidades de acierto de cada pregunta.
X= Probabilidad de acierto. X~Bi(50,0.25)
1-Calcula el tercer cuartil y la mediana
tercer cuartil
qbinom(0.75,10,0.25)
## [1] 3
mediana
qbinom(0.5,10,0.75)
## [1] 8
2-Con un 4 en el examen hace media. Calcula la probabilidad de que saque al menos un 4.
P(X<4)=1-P(X>=4)
1 - pbinom(4,10,0.25)
## [1] 0.07812691
3-Juan cree que puede sacar mas o menos buena nota. Calcula la probabilidad de que acierte al menos 6 preguntas y menos de 9.
P(6<Y<9)=P(X<9)-P(X<6)
pbinom(9,10,0.25)-pbinom(6,10,0.25)
## [1] 0.003504753
4-Calcula la probabilidad de que Juan saque un 10. Es decir, que acierte todas las preguntas
P(X=10)
dbinom(10,10,0.25)
## [1] 9.536743e-07
En un torneo de curling organizado por la Universidad de Murcia, tenemos 10 escobas en total para cada equipo. Hay tres tipos de escobas con dientes: 3 blandos, 2 medios y 5 duros. Durante la competición, un equipo ya ha usado 1 escoba blanda, 1 escoba media y 3 duras.
Probabilidad de tipo de escoba:
3/10 ,
P(media) = 2/10 , P(dura)
= 5/10Probabilidad de escobas usadas: * P(blanda/usada) =
1/3 , P(media/usada) = 1/2 ,
P(dura/usada) = 3/5
Probabilidad de escobas nuevas: * P(blanda/nueva) =
2/3 , P(media/nueva) = 1/2 ,
P(dura/nueva) = 2/5
a)¿Cuál es la probabilidad de usar una escoba dura y que sea usada?
0.3b)¿Cuál es la probabilidad de usar una escoba media o dura y además ser nueva?
0.3c)¿Cuál es la probabilidad de escoger una escoba usada?
0.5d)¿Cuál es la probabilidad de que sea nueva?
0.5Los empleados de Movistar creen que el 80% de los clientes están satisfechos con su velocidad de internet. Por lo que hemos tomado una muestra aleatoria de 300 clientes, de los cuales 272 están satisfechos con su velocidad de internet.Con un nivel de significancia del 15%. Con este enunciado calcula:
Los datos del problema son:
Planteamiento del contraste de hipotesis.
*Hipotesis nula(H0): p0 = 80%
*Hipotesis alternativa(H1): p0 != 80%
Para calcular el estadistico test, sabemos que para una proporcion la formula es:
Zs = \(\frac{(p - p0)}{sqrt((p0*(1-p0))/n)}\)
Zs = ((272/300) - 0.8)/sqrt((0.8*(1-0.8))/300)
Zs
## [1] 4.618802
Para calcular la región critica seria:
Za2 = qnorm(1- 0.15/2)
Za2
## [1] 1.439531
-Za2
## [1] -1.439531
pvalor = 2 * (1-pnorm(abs(Zs)))
pvalor
## [1] 3.859616e-06
Como podemos ver el pvalor es menor que α y que el estadistico test cae fuera de la region crítica. Esto nos quiere decir que podemos rechazar la hipotesis nula(H0) ya que existe evidencia estadistica suficiente para aceptar la hipotesis alternativa(H1).
Se está llevando a cabo un estudio para evaluar la efectividad de un nuevo medicamento. Se seleccionaron al azar 100 pacientes para participar en el estudio de un nuevo medicamento. Después del tratamiento, se hizo una analítica a cada paciente. Se obtuvo una media muestral de colesterol del 80, con una desviación típica de 15. Los investigadores desean determinar si hay suficiente evidencia para afirmar que el nuevo medicamento es efectivo, utilizando un nivel de significacion del 5%.
1-Plantea la hipotesis en la cual el medicamento es efectivo bajando la media a 75 y da su nivel de significación.
Hipótesis nula (H0): El nuevo medicamento no es efectivo, es decir, H0 : µ ≤ 75. Hipótesis alternativa (H1): El nuevo medicamento es efectivo, es decir, H1 : µ > 75. Nivel de significacion es del α = 0.05.
2-Calcula el contraste estadístico.
# Calculamos el estadístico t
Qs = (80 - 75) / (15 / sqrt(100))
Qs
## [1] 3.333333
3-Calcula el p-valor
# Calculamos el p-valor
pvalor = 1-pnorm(Qs)
pvalor
## [1] 0.0004290603
4-Extrae las conclusiones del ejercicio.
Como el pvalor es 0.0004290603 que a su vez es menor que el nivel de significación (0.05) entonces la hipotesis H0 no es cierta porque hay evidencia estadistica para rechazarla.
Se esta llevando a cabo un estudio para medir las marcas de los 100 metros lisos. Se seleccionan 1000 corredores de atletismo al azar para realizar la medición de sus marcas. Despues de la medición se realiza una media muestral donde se obtiene que son de 11 segundos. Teniendo una desviación tipica de 2 segundos. Se quiere determinar si hay suficiente evidencia para demostrar las marcas utilizando un nivel de significación del 5%.
1-Plantea la hipotesis en la cual se quiere saber si la media es 10.85.
Hipótesis nula (H0): La medicion es efectiva, es decir, \(H_0 : µ = 10.85\).
Hipótesis alternativa (H1): La medición no es efectiva, es decir, \(H_1: µ ≠ 10.85\).
Nivel de significacion es del \(α = 0.05\).
2-Calcula el contraste estadístico.
# Calculamos el estadístico t
Qs = (11 - 10.85) / (2 / sqrt(1000))
Qs
## [1] 2.371708
3-Calcula el p-valor
# Calculamos el p-valor
pvalor = 2*(1-pnorm(abs(Qs)))
pvalor
## [1] 0.01770607
4-Extrae las conclusiones del ejercicio. Como p-valor es menor que \(α\) rechaza \(H_0\).
En una reunión de ingenieros de la Fórmula 1, se propuso la idea de medir la eficiencia de tres tipos diferentes de gasolina. Para ello, se realizaron pruebas en un circuito cerrado con tres coches de la misma escudería, cada uno utilizando un tipo de combustible distinto. Midieron el consumo por kilometro, teniendo los siguientes resultados:
Una vez hechas las pruebas, se plantearon las siguientes preguntas:
a) ¿Cuál es el valor del estadístico del contraste?
0.325.b) ¿Cuál es el P-valor? ¿Influye el tipo de combustible en la eficiencia del vehículo?
0.735,por lo que como es mayor que 0.05,
el tipo de combustible no influye en la eficiencia del vehículo.c) ¿Cuál es el valor de la suma de cuadrados entre los grupos? ¿ Y dentro de los grupos?
0.1371 y dentro, 1.2673.d) ¿Cuál es el valor de la media de cuadrados entre los grupos? ¿ Y dentro de los grupos?
0.06854 y dentro, 0.21121Para responder a las anteriores preguntas, los ingenieros usaron este script en R donde podían obtener todas las respuestas.
datos=c(10.8,11.2,10.45,10.32,10.2,11,9.90,10.5,10.2) grupos=factor(rep(c(“A”,“B”,“C”),3)) summary(aov(datos~grupos))
En la empresa Disney se ha propuesto analizar el presupuesto que necesitaran para realizar sus próximas peliculas, teniendo en cuenta su duracion. Por lo que han tomado una muestra de 20 películas que han realizado y su presupuesto utilizado. Los datos extraidos son estos:
Duracion = c(90, 120, 150, 80, 200, 95, 110, 130, 140, 85, 100, 175, 105, 125, 160, 70, 180, 135, 145, 115)
Presupuesto = c(20, 60, 100, 10, 150, 15, 40, 70, 90, 25, 30, 130, 50, 55, 120, 5, 160, 75, 85, 45)
1-Muestra de datos:
Para la muestra de datos se introduciran los datos en el sistema y mostraremos la grafica que se genera y su respectiva funcion que la genera.
Duracion = c(90, 120, 150, 80, 200, 95, 110, 130, 140, 85, 100, 175, 105, 125, 160, 70, 180, 135, 145, 115)
Presupuesto = c(20, 60, 100, 10, 150, 15, 40, 70, 90, 25, 30, 130, 50, 55, 120, 5, 160, 75, 85, 45)
plot(Duracion,Presupuesto)
abline(lm(Presupuesto~Duracion))
La funcion que genera la grafica anterior viene dada aqui:
lm(Presupuesto~Duracion)
##
## Call:
## lm(formula = Presupuesto ~ Duracion)
##
## Coefficients:
## (Intercept) Duracion
## -94.793 1.287
A traves de estos datos podemos extraer que la función resultante es:
y=-94.73 + 1.287*x
2-Coeficiente de correlación
Para conocer el coeficiente de correlacion utilizaremos la siguiente formula:
cor(Presupuesto,Duracion)
## [1] 0.9807087
A traves de este resultado podemos obtener que la relacion lineal es muy aceptable ya que se aproxima mucho a 1
3-Distribucion normal de los residuos
Para comprobar si los residuos siguen una normal haremos lo siguiente:
summary(lm(Presupuesto~Duracion))$residuals
## 1 2 3 4 5 6
## -1.0546139 0.3295669 1.7137476 1.8173258 -12.6459510 -12.4905838
## 7 8 9 10 11 12
## -6.7984934 -2.5423729 4.5856874 10.3813559 -3.9265537 -0.4661017
## 13 14 15 16 17 18
## 9.6374765 -11.1064030 8.8418079 9.6892655 23.0979284 -3.9783427
## 19 20
## -6.8502825 -8.2344633
hist(summary(lm(Presupuesto~Duracion))$residuals)
Con este resultado y con el histograma podemos comprobar que la distribucion que siguen los residuos es una distribucion normal ya que el histograma tiene forma de campana y el p-valor es mayor que 0.05.
4-Calcula el intervalo de confianza estimando que la duracion de la pelicula es de 120 minutos con un intervalo de confianza del 70%
Para realizar esto necesitamos un nuevo vector donte podamos añadir el valor
NuevaDuracion = data.frame(Duracion = c(120))
predict(lm(Presupuesto~Duracion),NuevaDuracion,interval = 'prediction', level = 0.7)
## fit lwr upr
## 1 59.67043 49.44218 69.89869
Con lo que obtenemos un intervalo (49.44218,69.89869).