**Funciones en R
En R, cada distribución de probabilidad se nombra mediante una palabra clave alias. Las palabras clave para las distribuciones más importantes son:
\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \] Distribución Exponencial
curve(dexp(x), from=0, to=0)
#representa la densidad de una exponencial de media 1 entre 0 y 10
Distribución binomial
x <- rbinom(20, 1, 0.5)
x
## [1] 0 0 1 1 0 0 1 0 0 1 0 1 1 0 1 1 0 0 1 0
# Genera 20 observaciones con distribución B(1, 0.5)
Contando exitos vs fracasos
table(x)
## x
## 0 1
## 11 9
e.g. Distribución normal
Si \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación tipica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:
pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alpha). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean= 10, sd=1 )
x
## [1] 9.079343 9.101713 9.961885 10.709311 9.988586 8.957302 10.400980
## [8] 10.821748 9.735688 11.050271 9.475116 8.409261 7.645360 11.995560
## [15] 10.126467 11.042532 9.406291 10.561588 11.004258 10.569011 9.954767
## [22] 9.623624 10.944310 11.451421 9.131708 9.255893 10.908097 7.914284
## [29] 11.137673 10.694127 8.856216 9.746519 9.653479 11.204691 11.467752
## [36] 10.095584 10.583985 10.242526 9.795578 8.286923 11.304007 12.310281
## [43] 9.258893 9.689244 8.575409 11.155407 12.385558 11.436906 9.016269
## [50] 13.091198 9.127484 9.778307 9.601004 9.650291 10.186413 10.724946
## [57] 9.869326 11.015974 9.426294 9.211073 10.078912 10.396502 9.378993
## [64] 9.860976 9.335015 9.832724 8.941360 8.482053 9.581359 11.487379
## [71] 9.107656 10.192350 12.091643 9.272641 8.743594 10.401759 9.619733
## [78] 9.388370 8.542551 8.460190 9.757277 8.942123 9.264490 11.138279
## [85] 9.520657 9.833971 8.246554 11.625482 11.261160 9.217776 9.042935
## [92] 8.723526 9.857537 11.823732 9.484744 10.984515 9.350451 10.567280
## [99] 9.987759 9.715094
mean(x)
## [1] 9.993468
hist(x)
boxplot(x)
hist(x, freq = FALSE) #freq= FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from= 7, to= 13, add=TRUE)
pnorm(4.78)
## [1] 0.9999991
En esta actividad aprendimos a organizar mejor los datos que tenemos, en tablas, organizarlos en cuantas columnas y filas queramos, vimos las distribuciones exponenciales, binomiales y normales, vimos como sacar el promedio, como crear un histograma, diferentes histogramas e intentamos hacer algunos ejercicios.