Plantilla para los trabajos

Utiliza este documento para presentar las prácticas de una manera sencilla y bonita.


Probabilidad

Se cumple que \(p(A)= \frac{3}{5}\), \(p(B)=\frac{2}{3}\), \(p(A\cup B)=\frac{5}{6}\). Calcula, sabiendo que son independientes:

  1. \(p(A/B)\)

    \(p(A \cap B) = \frac{3}{5}\) x \(\frac{2}{3} = \frac{6}{15}\)

    \(p(A/B)\) = \(\frac{p(A\cap B)}{p(B)}\) = \(\frac{\frac{6}{15}}{\frac{2}{3}}\) = \(\frac{3}{5}\)

  2. \(p(B/A)\)

    \(p(B/A)\) = \(\frac{p(B\cap A)}{p(A)}\) = \(\frac{\frac{6}{15}}{\frac{3}{5}}\) = \(\frac{2}{3}\)

  3. \(p(A \cap B^c)\)

    \(p(B^c) = 1 - p(B)\) entonces, \(p(B^c)= \frac{1}{3}\)

    \(p(A \cap B^c)\) = \(p(A)\) x \(p(B^c)\) = \(\frac{3}{5}\) x \(\frac{1}{3}\) = \(\frac{3}{15}\)

  4. \(p(A/B^c)\)

    \(p(A/B^c)\) = \(\frac{p(A \cap B^c)}{p(B^c)}\) = \(\frac{\frac{3}{15}}{\frac{1}{3}}\) = \(\frac{3}{5}\)


Variable aleatoria

Sean X una variable exponencial de media 5.

  1. Calcula la probabilidad de que X esté entre 3 y 8.

\(P(3\leq X\leq 8)\)=pexp(8, 1/5) - pexp(3, 1/5)=0.3469151

pexp(8, 1/5) - pexp(3, 1/5)
## [1] 0.3469151
  1. Calcula la varianza de X.

\(Var(X)=1/0.25^2\)=1/0.25^2=16

1/0.25^2 
## [1] 16

  1. Calcula la probabilidad de que X sea mayor de 7 sabiendo que es mayor de 4.

\(P(X>7/X>4)=\frac{P(X>7)}{P(X>4)}=\frac{1-P(X<7)}{1-P(X<4)}\)=(1-pexp(7,1/5))/(1-pexp(4,1/5))=0.5488116

(1-pexp(7,1/5))/(1-pexp(4,1/5))
## [1] 0.5488116

  1. Calcula la probabilidad de que X sea menor de 5.

\(P(x<5)=1-P(x>=5)\) =pexp(5, 1/5)=0.6321206

pexp(5, 1/5) 
## [1] 0.6321206

***

Estadística descriptiva

Se celebra un concurso en el cual, si el concursante acierta 10 preguntas, con 4 posibles respuestas para cada pregunta, ganara un premio.

Sin embargo, el concursante no esta seguro de saber la respuesta correcta de ninguna pregunta, y decide responder de manera aleatoria.

Calcula cual es la probabilidad de…

X = Probabilidad de acierto de una sola pregunta

X~Bi(50,0.25)

  1. Calcular el primer cuartil y la mediana.

Primer cuartil

qbinom(0.25,10,0.75)
## [1] 7

Mediana

qbinom(0.5,10,0.75)
## [1] 8
  1. Contestar correctamente menos de 5 preguntas.

P(X<5)=1-P(X>=5)

1 - pbinom(5,10,0.25) 
## [1] 0.01972771
  1. Contestar correctamente mas de 6 preguntas, pero menos de 8 preguntas.

P(6<Y<8)=P(X<8)-P(X<6)

pbinom(8,10,0.25)-pbinom(6,10,0.25) 
## [1] 0.003476143
  1. Contestar correctamente todas las preguntas.

P(X=10)

dbinom(10,10,0.25)
## [1] 9.536743e-07

————————————————————————

TRABAJO 2

Ejercicio Tema 1 y 2

(Primer apartado)

20 jugadores profesionales de fútbol distintos han sido reunidos para realizar un estudio. Se han realizado mediciones en la velocidad máxima que alcanza el esférico cuando chutan con su máxima potencia (Una medición por cada futbolista). A continuación se adjuntan las mediciones obtenidas (en km/h): 85, 89, 90, 85, 91, 86, 97, 79, 101, 89, 88, 110, 95, 86, 85, 82, 81, 96, 92, 87.

x=c(85,89,90,85,91,86,97,79,101,89,88,110,95,86,85,82,81,96,92,87)
  1. Halla la media, la desviación típica y la mediana.
mean(x)
## [1] 89.7
sd(x)
## [1] 7.334848
median(x)
## [1] 88.5
  1. Halla el primer cuartil, el tercer cuartil y el rango. intercuartílico.
quantile(x,0.25)
## 25% 
##  85
quantile(x,0.75)
##   75% 
## 92.75
IQR(x)
## [1] 7.75

(Segundo apartado)

El jugador Javier Galán tiene el record del disparo más potente de la historia con 138 km/h. Debido a las mejoras en el aspecto físico de los jugadores en el futuro, se prevee que la probabilidad de que un jugador profesional promedio en el futuro supere los 138 km/h en un disparo, es de un 0.15. Cuando en el futuro se realice otro estudio con 20 jugadores en el que el comportamiento de los jugadores sea independiente, calcula…

  1. La probabilidad de que 3 jugadores superen el disparo de Javier Galán.

P(X=3)

dbinom(3,20,0.15)
## [1] 0.2428289
  1. La probabilidad de que nadie supere el disparo de Javier Galán.

P(X=0)

dbinom(0,20,0.15)
## [1] 0.03875953

Ejercicio Tema 3

La anchura de las puertas blindadas utilizadas en los bancos españoles tienen una distribución normal con media 1.5 metros y desviación estándar de 0.10 metros.

  Su distribucion es: X∼N(1.5,0.10)
  
  1. Probabilidad de que las puertas blindadas tengan una anchura de menos de 1.8 metros y de mas de 1.2 metros.Sabiendo que si miden mas de 1.8 metros o menos de 1.2 metros, esas puertas no sirven. ¿Cuál es la proporció.n de puertas inservibles?

    P(1.8 >= X U X >= 1.2)= 1 - P(1.2 <= X <= 1.8)= 1 - (P(X<=1.8)-P(X<=1.2)) = 1 - (pnorm(1.8,1.5,0.1) - pnorm(1.2,1.5,0.1)) = 1 - 0.9973 = 0.0027

  2. La probabilidad de que al seleccionar 3 puertas blindadas,tengan una anchura de menos de 1.8 metros y de mas de 1.2 metros.¿ Y cuál es la probabilidad de que todas sean inservibles?

    Como conocemos la probabilidad de que sean inservibles, ahora tenemos que calcular la probabilidad de que ninguna sea inservibles

    P(Y = 0) = dbinom(0,3,0.0027) = 0.9919 P(Y = 3) = 1 - 0.9919 = 0.0080

  3. La probabilidad de que el ancho de 3 puertas blindadeas, de al menos dos tengan una anchura de menos de 1.8 metros y de mas de 1.2 metros.

    Como conocemos la probabilidad de que sean inservibles, ahora tenemos que calcular la probabilidad de que 1 o ninguna sean inservibles

    P(X<=1) = ppbinom(1,3,0.0027) = 0.9999782

  4. La probabilidad de que la media de los anchos esté entre 1.8 y 1.2 metros.

    Por el teorema central del límite, al ser X ∼ N(1.5,0.1) y n = 3, tenemos que X∼N (1.5,(0.1/√ 3)=N(1.5,√3/30)

    P(1.8 <= X <= 1.2) = P(Z<=(1.8-1.5)/√3/30)-P(Z<=(1.2-1.5)/√3/30)= P(Z<=5.19)-P(Z<=-5.19)= pnorm(5.19,1.5,sqrt(3)/30) - pnorm(-5.19,1.5,sqrt(3)/30)= 1


Ejercicio Tema 4

Se sabe que la duración, en horas, de un foco de 75 watts tiene una distribución aproximadamente normal, con una desviación estándar de σ=25 horas. Se toma una muestra aleatoria de 20 focos, la cual resulta tener una duración promedio de x̄= 1014 horas.

  1. Calcula un intervalo de confianza unilateral por la derecha y otro por la izquierda con una confianza del 95%.

bar_x = 1014 (x̄)

sigma=25 (σ)

n=20 (n)

alpha=0.05 (α)

¿z_alpha2 -> (\(Z_{\alpha/2}\))?

qnorm(1-0.05/2)
## [1] 1.959964

Por la derecha:

\(\bar{X} + Z_{\alpha/2} \frac{\sigma}{\sqrt{n}}\)

1014 + 1.96*25/sqrt(20)
## [1] 1024.957

Por la izquierda:

\(\bar{X} - Z_{\alpha/2} \frac{\sigma}{\sqrt{n}}\)

1014 - 1.96*25/sqrt(20)
## [1] 1003.043
  1. ¿Qué tamaño muestral es necesario para estimar la media con un error de ± 8 y con una confianza del 90%?

Utilizamos la siguiente fórmula:

\(n=\frac{Z^2\sigma^2}{e^2}\)

α=0.1 (alpha)

\(Z\)= qnorm(1- α/2) -> 1.645

\(n=\frac{(1.645^2)(25^2)}{8^2} = 26.426\)

  1. Teniendo en cuenta que para una proporcion de 40 focos sobre 100 la duracion media en horas es mayor, hallar un intervalo de confianza del 80 % para la proporción donde las media sea mayor.

p =40/100 = 0.4

1 − pˆ = 0.6

α = 0.2

Z =

qnorm(1-0.2/2)
## [1] 1.281552

Por tanto, el intervalo es:

0.4- 1.281 * sqrt(0.4*0.6/100)
## [1] 0.3372441
0.4+ 1.281 * sqrt(0.4*0.6/100)
## [1] 0.4627559

El intervalo es: (0.33, 0.46)

  1. Si el valor medio está entre 1000 y 1050, ¿con qué nivel de confianza se puede hacer esa afirmación?

alpha=0.05 (α)

\(Z_{\alpha/2}\)

qnorm(1-0.05/2)
## [1] 1.959964

\(P(1000 < Z < 1050) = P((1000-1025)/1.95 < Z < (1050-1025)/1.95) = P( -12.82< Z < 12.82) =\)

\(183.6831 - 179.0965 = 4.5866\)

(1014  + 12.82) / (25 / sqrt(20))
## [1] 183.6831
(1014  - 12.82) / (25 / sqrt(20))
## [1] 179.0965

————————————————————————

TRABAJO 3

EJERCICIO CONTRASTE PARAMETRICO

Un fabricante de bombillas afirma que la duración promedio de su producto es de 2000 horas. Para comprobar esta afirmación, se selecciona una muestra aleatoria de 100 bombillas y se obtiene un tiempo promedio de duración de 1900 horas, con una desviación estándar de 250 horas. Realiza un contraste de hipótesis paramétrico para determinar si la afirmación del fabricante es correcta o no, utilizando un nivel de significación del 5%.

#1. La prueba de hipotesis y el nivel de significacion seria:

La prueba de hipotesis seria: Hipótesis nula, H0: La duración promedio de las bombillas es igual a 2000 horas. Hipótesis alternativa, H1: La duración promedio de las bombillas es menor a 2000 horas. El nivel de significacion es α = 0.05

#2.El calculo de la estadistica de contraste es:

x_bar <- 1900  # Media muestral
mu_0 <- 2000   # Media poblacional hipotética
s <- 250       # Desviación estándar muestral
n <- 100       # Tamaño de la muestra


 
z <- (x_bar - mu_0)/(s/sqrt(n))
z
## [1] -4
#3.El calculo de p-valor es:

p_valor <- pnorm(z, lower.tail = TRUE)
p_valor
## [1] 3.167124e-05
#4. Toma de decision:

Como el p-valor es menor que el nivel de significación, se rechaza la hipótesis nula. Por lo tanto, hay suficiente evidencia estadística para afirmar que la duración promedio de las bombillas es menor a 2000 horas. Por lo que, se puede decir que la afirmación del fabricante de que la duración promedio de sus bombillas es de 2000 horas es incorrecta, ya que la muestra proporciona suficiente evidencia para decir que la duración promedio es menor a 2000 horas.

———————————————–

EJERCICIO CONTRASTE NO PARAMETRICO

En una empresa de venta de electrodomésticos no están muy satisfechos con su plan actual de marketing. Debido a ello, han elavorado un nuevo plan de marketing que resulte más efectivo. Para determinar la efectividad de este nuevo plan de marketing, se han comparado las ventas antes y después de emplear el nuevo plan de marketing. Se tiene en cuenta que el numero de unidades vendidas no sigue una distribución normal.

Se representa un conjunto de datos que muestra el número de unidades de electrodomésticos vendidas antes y después de emplear el nuevo plan de marketing en 10 semanas a través de una tabla:

library(knitr)

data<- data.frame( 
  Semana = c(1,2,3,4,5,6,7,8,9,10), 
  Antes = c(78,73,83,88,76,81,86,89,87,98), 
  Despues = c(68,63,80,90,74,73,83,83,89,88)
  )

tabla<-kable(data, caption = "Número de unidades de electrodomésticos vendidas") 

tabla
Número de unidades de electrodomésticos vendidas
Semana Antes Despues
1 78 68
2 73 63
3 83 80
4 88 90
5 76 74
6 81 73
7 86 83
8 89 83
9 87 89
10 98 88

1. ¿Cuál es la prueba más adecuada para comparar el número de unidades vendidas antes y después implementar el nuevo plan de marketing?

Teniendo en cuenta que se trata de dos muestras emparejadas y que el enunciado nos dice que el número de unidades vendidas no sigue una distribución normal, empleamos el test no paramétrico apropiado, que en este caso es el Test de los signos.

2. Indica a continuación cuales son…

A)La hipótesis nula

B)La Hipótesis alternativa

C)El nivel de significación

Además, explica que efecto tiene el nivel de significación.

A)Hipótesis nula (H0): La mediana de las diferencias es igual a 0.

B)Hipótesis alternativa (H1): La mediana de las diferencias NO es igual a 0.

C)nivel de significacion (α) = 0.05 (Valor por defecto cuando no se indica un valor diferente)

El efecto que tiene el nivel de significación es que a medida que este disminuye, se requiere un mayor grado de diferencia entre las muestras para poder rechazar la hipótesis nula.

3. Determina el valor del estadístico (Bs) y del umbral (Bα/2). Además, indica si es necesario rechazar la hipótesis nula.

Para calcular el valor del estadístico, compruebo cuantos positivos y negativos hay y escojo el máximo:

Antes = c(78,73,83,88,76,81,86,89,87,98)
Despues = c(68,63,80,90,74,73,83,83,89,88)

sum((Antes-Despues)>0)
## [1] 8
sum((Antes-Despues)<0)
## [1] 2

Llegamos a la conclusión de hay 8 positivos y 2 negativos, por lo tanto el máximo es 8.

A continuación, calculo el umbral:

qbinom(1-(0.05/2),10,0.5)
## [1] 8

Ya que Bs no es mayor que Bα/2, no se rechaza la hipótesis nula.

4. Basándonos en los resultados obtenidos, ¿Cómo podemos valorar la efectividad del nuevo plan de marketing?

Visto que el nuevo plan de marketing no representa ninguna diferencia significativa con el anterior plan de marketing, podemos afirmar que no es efectivo.

———————————————–

EJERCICIO ANOVA

Se desea evaluar la efectividad de tres diferentes tipos de fertilizantes en el crecimiento de plantas de tomate. Se tienen tres grupos de plantas, donde cada grupo ha sido tratado con uno de los tres fertilizantes diferentes. Se midió la altura de cada planta después de tres semanas de tratamiento y se registró el resultado. Se quiere determinar si hay diferencias significativas entre los tres tipos de fertilizantes en términos de su efectividad en el crecimiento de las plantas.

library(knitr)

datos<- data.frame( 
  Tratamiento_1 = c(.46, 3.8, 4.1, 5.2, 3.7), 
  Tratamiento_2 = c(6.1, 4.9, 5.7, 6.2, 5.1), 
  Tratamiento_3 = c(5.2, 4.4, 5.5, 6.0, 5.3)
  )

tabla<-kable(datos, caption = "Anova") 

tabla
Anova
Tratamiento_1 Tratamiento_2 Tratamiento_3
0.46 6.1 5.2
3.80 4.9 4.4
4.10 5.7 5.5
5.20 6.2 6.0
3.70 5.1 5.3

1. ¿Los datos de los 3 tratamientos siguen una normal?

Para comprobar que siguen una normal hacemos uso del metodo shapiro.test()

shapiro.test(c(4.6, 3.8, 4.1, 5.2, 3.7, 6.1, 4.9, 5.7, 6.2, 5.1, 5.2, 4.4, 5.5, 6.0, 5.3))
## 
##  Shapiro-Wilk normality test
## 
## data:  c(4.6, 3.8, 4.1, 5.2, 3.7, 6.1, 4.9, 5.7, 6.2, 5.1, 5.2, 4.4, 5.5, 6, 5.3)
## W = 0.95244, p-value = 0.5637

Como p_valor es mayor mayor que el nivel de significancia (por lo general, 0.05), se acepta la hipótesis nula de que los datos provienen de una distribución normal.

2. Calcula la desviación típica de los tratamientos

Para calcular la desviación utilizamos el metodo sd() con los datos que tengamos:

datos<-c(4.6, 3.8, 4.1, 5.2, 3.7, 6.1, 4.9, 5.7, 6.2, 5.1, 5.2, 4.4, 5.5, 6.0, 5.3) 

sd(datos)
## [1] 0.8016649

3. Calcula la suma de cuadrados de los 3 tratamientos.

  • Primero calculamos la media total de los grupos y la media de cada grupo:
datos<-c(4.6, 3.8, 4.1, 5.2, 3.7, 6.1, 4.9, 5.7, 6.2, 5.1, 5.2, 4.4, 5.5, 6.0, 5.3) 
grupo1 <- c(4.6, 3.8, 4.1, 5.2, 3.7)
grupo2 <- c(6.1, 4.9, 5.7, 6.2, 5.1)
grupo3 <- c(5.2, 4.4, 5.5, 6.0, 5.3)
media_total<-mean(datos)

media_grupo1 <- mean(grupo1)
media_grupo2 <- mean(grupo2)
media_grupo3 <- mean(grupo3)
  • Calculamos SSE(suma de cuadrados entre grupos):
n<-5
SSE <- (n * ((media_grupo1 - media_total)^2 + (media_grupo2 - media_total)^2 + (media_grupo3 - media_total)^2)) 

SSE
## [1] 4.741333
  • Calculamos SSD(suma de cuadrados dentro de los grupos):
SSD <- sum((grupo1 - media_grupo1)^2) + sum((grupo2 - media_grupo2)^2) + sum((grupo3 - media_grupo3)^2)

SSD
## [1] 4.256
  • Por tanto, la variación total (SST) que tendremos será:

SST = SSE + SSD; 4.741333 + 4.256 = 8.997333

4. Calcula los cuadrados medios entre grupos y dentro de los grupos:

b(nº grupos) = 3; n(tamaño grupo) = 5

MSE(entre grupos) = \[\frac{SSE}{b-1}\] = \[\frac{4.741333}{3-1}\] = 2.370667

MSD(dentro) = \[\frac{SSD}{n-b}\] = \[\frac{4.256}{5-3}\] = 2.128

———————————————–