This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
You can also embed plots, for example:
Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.
La probabilidad es el lenguaje matematico para cuantificar la incertidumbre- Wasserman
COnceptos funamentales de probabilidad
1.- Terminologia de probabilidad: espacio de resultados, eventos, funciones de probabilidad
2.- Interpretacion frecuentista de la probabilidad
3.- Probabilidad condicional y su relación con independencia
4.- La regla de Bayes
##Espacio de resultados y eventos
EL espacio de resultados \(\Omega\) es el conjunto de posibles resultados de un experimento aleatorio
Ejemplo: Si lanzamos una moneda 2 veces, entonces
\[ \Omega = {AA,SS,AS,SA} \] Un evento es un subconjunto del espacio muestral, los evemtos usualmente se denotan por mayúsculas. Ejemplo: si lanzamos una moneda dos veces entonces: \[ \Omega = \{AA, AS\}\]
##Eventos equiprobables
La probabilidad se puede ver como una proporcion de una parte con respecto a un todo
Si en ingenieria quimica tenemos 1000 estudiantes, de los cuales
300 son hombres 700 son mujeres
Si elegimos un estudiante al azar de ingenieria quimica Cual es la probabilidad de que sea hombre?
\[ \frac {300}{700+300} = 0.3 \]
La probabilidad entonces es de 0.3
Esto se concibe de la siguiente forma:
$$ Probabilidad = Eventos favorables / eventos posibles
$$ Eventos equiprobables Si todos los elementos en el espacio de resultados tienen la misma oportunidad de ser elegidos entonces la probabilidad del evento A es el numero de resultados en a dividido entre el numero total de posibles resultados:
\[P(A)=\frac{\#(A)}{\#(\Omega)}\] por lo que hace falta contar Ejemplo de combinaciones: Un comite de 5 personas sera seleccionado de un grupo de 6 hombres y 9 mujeres. Si la seleccion es aleatoria ¿cual es la probabilidad de que el comite este conformado por 3 hombres y 2 mujeres?
hay \(\dbinom{15}{5}\) posibles comites, cada uno tiene la misma posibilidad de ser seleccionado
Por otra parte hay \(\dbinom{6}{3}\dbinom{9}{12}\) posibles comites que incluyen 3 hombres y 2 mujeres, por lo tanto, la probabilidad que buscamos es: \[\frac{\dbinom{6}{3} \dbinom{9}{2}}{\dbinom{15}{5}}\] y la funcion para calcular las combinaciones es choose (n, r)
choose(6,3) * choose(9,2) / choose(15,5)
## [1] 0.2397602
##Interpretacion frecuentista de la probabilidad
Las probabilidades se entienden como una aproximacion matematica de frecuencias relativas cuando la frecuencia total tiende a cero
Supongamos que lanzamos una moneda 10 veces y obtenemos lo siguiente:
set.seed(123)
lanzamientos_10 <- sample(c("A", "S"), 10, replace = TRUE)
lanzamientos_10
## [1] "A" "A" "A" "S" "A" "S" "S" "S" "A" "A"
*Ahora vamos a calcular la secuencia de frecuencias relativas de aguila
cumsum(lanzamientos_10 == "A") #Suma acumulada de Aguila
## [1] 1 2 3 3 4 4 4 4 5 6
round(cumsum(lanzamientos_10 == "A") / 1:10,2)
## [1] 1.00 1.00 1.00 0.75 0.80 0.67 0.57 0.50 0.56 0.60
**Funciones en R
En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palanras clave para las distribuciones más importantes son:
$$
\[\begin{array}{1|1|1|c} \text{función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntales} & \text{Sólo uso gráfico en el caso continuo0}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array}\]$$
**Distribución Exponencial
curve(dexp(x), from = 0, to = 10)
#Representa la densidad de una exponencial de media 1 entre 0 y 10
Distribución binomial
x <- rbinom(20, 1, 0.5)
x
## [1] 1 0 1 1 0 1 0 0 0 1 1 1 1 1 1 1 1 1 0 0
#Genera 20 observaciones con distribución B(1, 0.5)
Contando éxitos vs fracasos
table(x)
## x
## 0 1
## 7 13
Ejemplo de distribución normal
Si \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:
pnorm(3.5, mean = 3, sd = 0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd = 0.5)
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean = 10, sd = 1)
x
## [1] 11.786913 10.497850 8.033383 10.701356 9.527209 8.932176 9.782025
## [8] 8.973996 9.271109 9.374961 8.313307 10.837787 10.153373 8.861863
## [15] 11.253815 10.426464 9.704929 10.895126 10.878133 10.821581 10.688640
## [22] 10.553918 9.938088 9.694037 9.619529 9.305293 9.792083 8.734604
## [29] 12.168956 11.207962 8.876891 9.597115 9.533345 10.779965 9.916631
## [36] 10.253319 9.971453 9.957130 11.368602 9.774229 11.516471 8.451247
## [43] 10.584614 10.123854 10.215942 10.379639 9.497677 9.666793 8.981425
## [50] 8.928209 10.303529 10.448210 10.053004 10.922267 12.050085 9.508969
## [57] 7.690831 11.005739 9.290799 9.311991 11.025571 9.715227 8.779282
## [64] 10.181303 9.861109 10.005764 10.385280 9.629340 10.644377 9.779513
## [71] 10.331782 11.096839 10.435181 9.674068 11.148808 10.993504 10.548397
## [78] 10.238732 9.372094 11.360652 9.399740 12.187333 11.532611 9.764300
## [85] 8.973579 9.289593 10.256884 9.753308 9.652457 9.048381 9.954972
## [92] 9.215096 8.332058 9.619773 10.918997 9.424653 10.607964 8.382117
## [99] 9.944438 10.519407
mean(x)
## [1] 10.01675
hist(x)
boxplot(x)
hist(x, freq = FALSE) #Freq = FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean = 10, sd = 1), from = 7, to = 13, add = TRUE)