Introduccion a la probabilidad

Probabilidad es el lenguaje matematico para cuantificar la incertidumbre, -wasswerman

  1. Terminologia de probabilidad: espacioo de resultados, eventos, funciones de probabilidad, Etc.
  2. Interpretacion frecuentista de la probabilidad.
  3. Probabilidad condicional y su relacion con la independencia.

Espacio de resultados y eventos

El espacio de resultados \(\Omega\) es el conjunto de resultados de un experimento aleatorio.

e.g. Si lanzamos una moneda dos veces entonces: \[ \Omega=\{AA, AS, SA, SS\} \] Un evento es un subconjunto del espacio muestral, los eventos usualmente se denotan por mayúculas. e.g. Que el primer lanzamiento resulte águila.

\[ A=\{AA, AS\} \] ## Eventos equiprobables

La probabilidad se puede ver como una extención de la idea de proporción, o cociente con respecto a un todo.

e.g. En la carrera de Ingenieria Química hay 300 estudiantes que son hombres y 700 mujeres, la proporcion de hombres es:

\[ \frac{300}{700+300}=0.3 \] Eventos equiprobables Si todos los elementos en el espacio de resultados tienen la misma oportunidad de ser elegidos, entonces la probabilidad del evento A es el número de resultados en A dividido entre el número total de posibles resultados: \[ P(A)=\frac{\#(A)}{\#(\Omega)} \]

Por lo que solo hace falta contar.

e.g Combinaciones Un comite de 5 personas será seleccionado de un grupo de 6 hombres y 9 mujeres. Si la selección es aleatoria, ¿Cuál es la probabilidad de que el comite este comformado por 3 hombres y 2 mujeres?

Hay \(\dbinom{15}{5}\) posibles comités, cada uno tiene la misma probabilidad de ser seleccionado.

Por otra parte hay \(\dbinom{6}{3} \dbinom{9}{2}\) posibles comiés que incluyen 3 hombres y 2 mujeres, por lo tanto la probabilidad que buscamos es: \[ \frac{\dbinom{6}{3} \dbinom{9}{2}} {\dbinom{15}{5}} \] y la función para calcular las combinaciones es choose(n,r)

choose(6,3) * choose(9,2) / choose(15,5)
## [1] 0.2397602

Interpretación frecuentista de la probabilidad

Una frecuencia relativa es una proporción que mida que tan seguido, o frecuente, ocurre una u otra cosa en una sucesión de observaciones.

Lanzamientos_10 <- sample(c("A","S"),10, replace= TRUE)
Lanzamientos_10
##  [1] "A" "A" "S" "S" "S" "S" "A" "S" "A" "A"

Podemos calcular las seciencias relativas de águila:

cumsum(Lanzamientos_10=="A") ##Suma acumulada de águila
##  [1] 1 2 2 2 2 2 3 3 4 5

Dividiendo

round(cumsum(Lanzamientos_10=="A")/1:10,2)
##  [1] 1.00 1.00 0.67 0.50 0.40 0.33 0.43 0.38 0.44 0.50

Distibuciones de probabilidad

**Funciones en R En R, cada distribucion de probabilidad se nombre mediante una palabra clave o alias. Las palabras clave para las distribuciones mas importantes son:

\[ \begin{array}{1|1|1|c} \text{Función} & \text{Significado} & \text{Uso} & \text{Observación} \\ \hline p & \text{Probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles(percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución especifica} & \text{---}\\ \hline \end{array} \]

Distibución Exponencial

curve(dexp(x), from = 0, to=10    )

#Representa la densidad de una exponencial de media 1 entre 0 y 10

Distribución Binomial

x <- rbinom(20,1,0.5)
x
##  [1] 1 0 1 1 0 1 1 0 1 0 0 1 1 1 0 0 1 1 0 1
#Genera 20 observaciones con distribución B(1,0.5)

Contando éxitos vs fracasos

table(x)
## x
##  0  1 
##  8 12

e.g. Distribución normal Si \(x\) es una variable aleatoria con distribución normal de media 3, y su desviacopn típica es de 0.5, ña probabilidad de que \(x\) sea menor que 3.5, se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas fórmulas para intervalos y contrastes se obtiene con el comando qnorm(a-alpha). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean=10, sd=1)
x
##   [1] 11.274538  8.602487  9.253298 10.200448  8.731481 10.131354  7.137732
##   [8] 10.600759  8.970102  9.049616  8.356556  9.363253  9.843901 11.143510
##  [15]  8.987010  9.641609  9.633237  9.903557  9.653389 10.295572 11.716860
##  [22] 10.309315 10.071594  9.047516 11.229800  8.548597  9.960022  9.301898
##  [29]  9.035408 11.745690 10.144135 12.380263 10.008951  9.277362  9.886848
##  [36]  8.157967 10.423980  9.697001 10.545558 11.248012  8.636959  9.557593
##  [43] 10.484998  9.253608  9.266168 10.680498 10.162451 10.294822 10.223619
##  [50] 10.468744  9.742240 10.991949 10.053421 10.412341 11.316991 10.787999
##  [57]  9.639684  9.065398  9.155739 12.243819 11.140838 10.471060 10.981245
##  [64]  8.933210 11.106737 10.027363  9.493326  9.926729 10.946548  8.486002
##  [71] 11.778340  9.801810  8.429738 10.978305 12.322225  8.230833 10.021063
##  [78] 10.147403 12.026939  8.891630 10.761494  9.295690 11.464506  8.863177
##  [85]  8.943894 10.931020  9.892340  8.946589 11.004630  8.998621 10.713024
##  [92]  9.960995  7.999388 11.539335  8.973790 10.752329 11.299160  9.201777
##  [99] 10.141323 10.896998
mean(x)
## [1] 10.00671
hist(x)

* Gráfico de cajas y bigote

boxplot(x)

hist(x, freq= FALSE) #Freq=FALSE, para que el area del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)

Ejercicios. 1. Si \(z\) es una variable con distribución normal estándae, calcula \(\mathbb{p}(-2.34< z < 4.78)\).

P = pnorm(4.78, mean=0, sd=1) - pnorm(-2.34, mean=0, sd=1)
P
## [1] 0.9903573
  1. Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.
#Muestra 1
x <- rnorm(10, mean=6, sd=1)
x
##  [1] 6.985603 6.672706 7.215231 4.446334 6.519220 7.548352 7.165268 5.429678
##  [9] 6.138113 5.124463
mean(x)
## [1] 6.324497
#Muestra 2 
z <- rnorm(10, mean=6, sd=1)
z
##  [1] 7.993093 6.294983 5.558214 7.033328 7.123147 6.002010 6.463238 7.751365
##  [9] 6.083158 5.771396
mean(z)
## [1] 6.607393
#Muestra 3
w <- rnorm(10, mean=6, sd=1)
w
##  [1] 4.660805 5.843890 5.750353 6.958439 5.801985 7.009245 4.510604 6.489633
##  [9] 6.851501 5.517632
mean (w)
## [1] 5.939409

Se utilizan los mismos parametros en los 3 pero estos cambian debido a la función del código que es generar números random

  1. Genera 1000 números con distribución de Poisson de parámetro \(lambda=1\). Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se paewcen a los valores teóricos?
cu <- rpois(1000,1)
cu
##    [1] 2 4 0 0 2 0 0 1 1 1 1 3 3 2 0 0 2 1 2 3 1 0 2 0 2 1 2 0 1 2 0 0 0 1 0 1 2
##   [38] 1 2 2 0 1 1 0 0 2 0 1 0 0 0 2 2 0 1 1 2 2 2 0 1 3 1 0 2 1 0 1 0 3 1 0 0 0
##   [75] 2 1 1 0 0 1 2 1 3 0 2 1 2 0 0 0 3 3 0 3 1 2 0 0 0 0 0 1 1 0 1 0 2 1 1 2 0
##  [112] 1 3 1 1 1 1 1 1 0 0 0 1 0 0 3 2 0 3 0 0 2 1 0 1 1 0 1 0 1 1 1 1 1 1 0 0 2
##  [149] 0 0 1 2 2 0 0 1 1 1 0 1 1 0 2 0 3 1 0 2 2 4 2 1 1 1 2 0 1 1 2 2 1 0 1 0 1
##  [186] 1 0 0 0 1 0 0 0 0 1 0 0 0 2 2 1 0 0 1 0 0 1 2 0 2 0 0 0 1 1 1 0 4 0 1 1 1
##  [223] 0 0 0 0 3 2 0 0 1 3 0 1 0 1 0 1 3 1 1 0 0 4 1 1 2 2 2 0 0 0 0 0 0 1 2 2 2
##  [260] 0 2 0 2 0 0 2 1 0 0 2 2 0 0 1 1 0 0 0 0 1 2 3 1 0 0 2 2 2 4 1 0 0 0 1 1 0
##  [297] 0 0 1 3 0 1 0 1 4 3 0 0 0 2 2 2 1 0 0 1 3 0 2 0 2 0 2 0 0 1 2 1 0 0 0 1 0
##  [334] 1 0 0 1 0 2 2 1 1 0 2 0 2 1 1 5 1 3 1 1 1 1 0 4 0 1 0 3 2 1 1 2 1 1 2 0 0
##  [371] 1 3 1 4 1 0 2 0 1 3 1 1 1 2 0 0 0 0 0 0 1 1 0 0 0 0 2 1 2 1 0 0 1 1 1 2 2
##  [408] 0 0 2 0 1 0 2 2 1 1 3 1 1 0 0 1 1 0 1 0 0 3 1 1 1 1 0 1 1 0 0 2 0 0 1 0 0
##  [445] 5 1 1 1 0 2 1 0 2 1 1 0 3 2 0 1 0 0 0 0 1 5 0 1 1 2 2 0 0 0 0 2 0 0 1 0 2
##  [482] 0 1 1 1 1 0 1 1 1 1 2 0 2 0 1 1 3 4 1 1 1 1 2 2 0 1 1 1 1 1 3 1 0 1 0 2 0
##  [519] 1 0 0 1 1 1 1 3 0 1 2 0 0 1 1 1 0 3 2 1 1 1 0 0 1 0 2 0 1 2 1 0 2 2 0 1 2
##  [556] 1 1 1 0 0 0 0 0 2 2 1 1 0 3 2 0 3 0 1 0 1 1 0 1 1 0 2 0 1 1 1 1 1 1 1 1 0
##  [593] 1 1 0 0 1 0 0 2 0 0 2 1 0 1 0 3 1 2 1 1 1 1 3 2 0 3 0 0 1 0 1 0 2 3 4 0 3
##  [630] 2 3 0 2 1 1 1 2 0 1 1 0 1 1 0 0 0 1 0 1 2 0 0 3 1 0 0 0 0 0 0 3 0 0 2 1 2
##  [667] 0 1 0 0 3 2 2 1 0 1 1 2 1 0 0 1 0 0 0 0 2 2 2 0 0 1 0 1 0 0 0 0 0 1 1 0 1
##  [704] 2 2 1 1 3 0 2 1 0 2 0 1 0 1 0 0 2 1 1 1 2 0 1 0 0 0 3 0 0 0 1 2 1 0 2 0 0
##  [741] 0 0 3 0 3 2 1 2 1 1 1 0 2 1 1 0 0 0 2 1 2 1 1 1 0 0 0 0 0 1 2 0 1 1 2 3 0
##  [778] 2 0 2 0 1 0 2 1 1 0 2 1 0 0 0 0 1 1 2 0 1 1 0 0 0 0 2 2 4 0 1 3 3 0 1 0 0
##  [815] 2 2 1 0 0 0 1 1 0 0 0 0 0 1 2 2 2 1 0 0 0 2 0 3 0 1 2 1 1 0 1 0 2 1 1 1 0
##  [852] 1 0 1 0 1 1 4 1 2 1 3 1 0 2 0 0 2 2 2 1 1 0 1 2 0 1 2 1 2 0 2 2 0 0 0 0 0
##  [889] 1 0 1 1 0 1 4 2 0 1 1 0 1 0 2 1 0 3 0 0 1 0 2 2 3 1 0 2 2 1 0 1 1 3 0 2 0
##  [926] 0 2 1 1 1 0 0 1 0 0 1 0 0 0 2 0 1 0 0 0 2 2 1 1 0 2 1 0 2 0 0 2 1 0 0 1 2
##  [963] 0 2 1 0 0 4 3 0 0 1 0 0 2 3 1 1 1 0 2 2 2 0 1 0 0 3 1 3 2 1 2 2 0 1 1 2 1
## [1000] 0
mean(cu)
## [1] 0.957
var(cu)
## [1] 0.9901411
hist(cu, xlab="Distribución de Poisson", ylab="Frecuencia", main="Histograma de Poisson", col="blue")

Estos valores son diferentes por los numeros random que se utilizan

  1. Calcula con R los siguientes valorea: \(t_{3,\alpha}\), \(\chi^2_{3,\alpha}\), para \(\alpha=0.05\) y \(\alpha=0.01\). Compara los valores obtenidos con los que aparecen las correspondientes tablas
t3 <- rt(0.05,0.01)
t3
## numeric(0)
x1=0.05^2
x1
## [1] 0.0025
x2=0.01^2
x2
## [1] 1e-04