Distribucion binomial

el ultimo juego de video recien salido ha tenido un gran éxito, hasta el punto de que el 70% de los jugadores ya lo

han comprado. Un grupo de 5 amigos son aficionados a los videojuegos:

1 ¿Cuál es la probabilidad de que en el grupo, hayan jugado el juego 3 personas?

2¿Y cómo máximo 3?. Acumulado hasta 3, incluye: 0, 1, 2 y 3

Valores de los parametros

n <-  5
p <- 0.70 
q <- (1 - p) 
x <-  3

¿Cuál es la probabilidad de que en el grupo, hayan jugado el juego 3 personas?

dbinom(x,n, p)
## [1] 0.3087

¿Y cómo máximo 3?. Acumulado hasta 3, incluye: 0, 1, 2 y 3

x <- 2; n <- 5; p <- 0.70  
dbinom(0,n, p) + dbinom(1,n, p) + dbinom(2,n, p) + dbinom(3,n, p)
## [1] 0.47178

Plot la probabilidades desde 0 hasta 5

plot (x=c(0:5), y=dbinom(0:5, n, p), type="b", col=terrain.colors(6), pch=20, xlab = 'Variable discreta x de 0 a 5', ylab = 'Probabilidad p(x)' )

legend("topleft", inset=.03, title="Binomial", 
       as.character(paste("p(x) en ", 0:5, " = ",round(dbinom(0:5, n, p),5))), fill=terrain.colors(5), horiz=FALSE)

Probailidad hipergeométrica

Una empresa fabrica jabones que empaca en cajas de 15 unidades cada una.Asuma que un inspector selecciona al azar 5 de los 15 jabones de una caja para inspeccionarlos. Si la caja contiene exactamente 7 jabones defectuosos, ¿cuál es la probabilidad de que el inspector encuentre que uno de los cinco jabones está defectuoso? En esta aplicación n = 5 y N = 15. Si r = 7 fusibles defectuosos en la caja, la probabilidad de hallar x = 1 defectuoso es:

m <- 5; N <- 15; k <- 7; n <- N - m
m# Tamaño de la muestra
## [1] 5
n# Casos exitosos del total de lapoblación N-m
## [1] 10
k# Casos defectuoso, para el caso valor de r = 7
## [1] 7

¿cuál es la probabilidad de que el inspector encuentre que uno de los cinco jabones está defectuoso?

round(dhyper(x=1, m, n, k),4)
## [1] 0.1632

Ahora suponga que desea conocer la probabilidad de hallar por lo menos un fusible defectuoso. La manera más sencilla de contestar es calcular primero la probabilidad de que el inspector no encuentre ningún fusible defectuoso. La probabilidad de x 0 es:

round(dhyper(x=0, m, n, k),4)
## [1] 0.0186
1 - round(dhyper(x=0, m, n, k),4)
## [1] 0.9814

Distribucion poisson

Si hay doce autos que cruzan un puente por minuto en promedio, encuentre la probabilidad de tener diecisiete o más automóviles cruzando el puente en un minuto en particular. La probabilidad de tener dieciséis automóviles o menos cruzando el puente en un minuto particular viene dada por la función ppois.

ppois(16, lambda=12) 
## [1] 0.898709

Por lo tanto, la probabilidad de tener diecisiete o más automóviles cruzando el puente en un minuto está en la cola superior de la función de densidad de probabilidad.

ppois(16, lambda=12, lower=FALSE)*100
## [1] 10.1291

La probabilidad de tener 17 carros o mas cruzando es de 10.1%

Distribucion normal

Si ( X ) es una v.a. con distribución normal de media 3 y desviación típica 0,5, la probabilidad de que ( X ) sea menor que 3,5 se calcula mediante

pnorm(3.5, mean = 3, sd = 0.5)
## [1] 0.8413447

Para encontrar el cuantil 0.7 de una v.a. normal estándar ( Z ), es decir, un valor ( x ) tal que ( (Zx) = 0.7 ))

qnorm(0.7)
## [1] 0.5244005

Para calcular el mismo cuantil, pero para una v.a. normal de media 0 y desviación típica 0,5:

qnorm(0.7, sd = 0.5)
## [1] 0.2622003

Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):

x <- rnorm(100, mean = 10, sd = 1)
x
##   [1] 11.218598  8.786412  8.807052 11.039396  9.134635  9.311680 10.887465
##   [8] 10.216863  9.403180  9.862988 11.208174  9.895645 11.175657  8.405177
##  [15] 11.399771 10.493852  8.856827 10.444769 10.003139  9.773396 10.331971
##  [22] 10.819660 10.033371  9.351682 11.078752 10.815011 11.285848  9.646255
##  [29]  8.428863  8.485486 11.376939 11.213699 10.451732 10.240558 10.484529
##  [36]  9.861906  8.284113 10.009017  9.144276 10.993475  9.014689 10.568307
##  [43] 10.398544  9.449410 10.593987  9.888177 10.823783  9.887983  9.615666
##  [50] 10.771647  9.280285 10.561214  9.948741  9.299255  9.837357 10.376910
##  [57] 10.372666 10.004170 12.759968  9.492950  9.944846 10.710848  9.421752
##  [64] 10.279601 10.461318  9.238666  9.692731  9.439952  9.863487 10.882633
##  [71]  9.122656  9.834418 11.205289  8.698065 10.452732 10.199304 11.766562
##  [78] 11.628201 10.914664 10.547867  9.295907  9.668048 10.837812  9.503530
##  [85] 10.969479 10.288368  9.785628 10.241860 10.332614 10.935530 10.321096
##  [92]  9.806707  9.671320 10.791726 10.881537 10.909118  7.912845  9.807248
##  [99] 10.427527 10.219434

La descripción básica de x se obtiene de la siguiente forma:

mean(x)
## [1] 10.1252
sd(x)
## [1] 0.8495636
hist(x)

boxplot(x)

###Representamos finalmente el histograma de la muestra (normalizado para que la suma de áreas de los rectángulos sea 1) junto con la densidad de la población:

hist(x, freq = FALSE)  # freq = FALSE para que el área del hist. sea 1
curve(dnorm(x, mean = 10, sd = 1), from = 7, to = 13, add = TRUE)

Distribución T-student

T-STUDIO EN R

set.seed(10)

CREAR VARIABLE ALEATORIA

x1 <- rnorm(100,10)

CREAR VARIABLE ALEATORIA

x2 <- rnorm(100,10.5)
test <- t.test(x1,x2)

IMPRIMR

print(test)
## 
##  Welch Two Sample t-test
## 
## data:  x1 and x2
## t = -4.0081, df = 197.83, p-value = 8.665e-05
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.8080508 -0.2751220
## sample estimates:
## mean of x mean of y 
##  9.863451 10.405037

Chi cuadrado

CREAR LA TABLA

fumar = matrix(c(51,43,22,92,28,21,68,22,9),ncol=3,byrow=TRUE)
colnames(fumar) = c("alto","poco","medio")
rownames(fumar) = c("actual","pasado","nunca")
fumar = as.table(fumar)
fumar
##        alto poco medio
## actual   51   43    22
## pasado   92   28    21
## nunca    68   22     9

DETERMINAR EL CHI CUadrado

chisq.test(fumar)
## 
##  Pearson's Chi-squared test
## 
## data:  fumar
## X-squared = 18.51, df = 4, p-value = 0.0009808