Variables Alñeatorias

La muestra, habitualmente, consiste en una serie de variables (numéricas o no), que llamamos variables estadísticas. Esta variable es la medición u observación de una característica concreta (estatura, peso, color… ) en cada uno de los individuos de la muestra.

En las variables numéricas. Si en vez de referirnos a los valores de la variable en una muestra concreta (que es una parte de una población) nos referimos a los valores de la variable en TODA la población, tendremos una variable aleatoria.

El nombre de variable aleatoria hace referencia a que los valores de esta variable dependen del azar, mediante alguna ley concreta. El proceso de comprensión o interpretación matemática de esa aleatoriedad es el que realizaremos en este tema.

Ejemplo:

Cuando lanzamos una moneda, por ejemplo, cien veces, y anotamos 1 si sale cara y 0 si sale cruz, tenemos una variable estadística que toma los valores 0 y 1 , con frecuencias de aparición de, por ejemplo, 59 y 41, respectivamente. Cuando consideramos el proceso general de lanzar una moneda, tenemos una variable aleatoria que toma los valores
0 y 1 con probabilidad 0.5, respectivamente.

Tipos de variables aleatorias

las variables aleatorias pueden ser discretas o continuas, en función de que tomen un número finito (o infinito numerable) de valores, o bien un número infinito no numerable de valores, respectivamente.

  • ejemplo 1. La variable número que sale al lanzar un dado con seis caras es una variable aleatoria discreta (toma los valores del 1 al 6 ).

  • La variable número de autos que pasan por un cruce en un tiempo determinado es una variable aleatoria discreta que toma un conjunto infinito pero numerable de valores.

  • La variable estatura se mueve en un rango de valores determinado por el mínimo y el máximo de la población. Los valores que puede tomar dependen de la precisión del aparato de medida, con lo cual se trata de un conjunto no numerable de valores, es decir un intervalo [a,b]

Variables Aleatorias Discretas

X P(X=xi)
x1 p1
x2 p2
xn pn

con p1+...+pn=1. Esta tabla se conoce como ley de probabilidad, distribución de probabilidad, función de probabilidad o función de masa de probabilidad.

Ejemplo

Ante la observación de un paciente, la variable aleatoria que toma los valores 1 y 0( 1 si el paciente tiene una enfermedad, 0 si no la tiene).

X P(X=xi)
0 1p
1 p

variable aleatoria de Bernoulli de parámetro p , siendo p la probabilidad de tener la enfermedad.

Ejemplo

Cuando realizamos el experimento aleatorio “elegir un número al azar entre 1 y N”, la variable aleatoria
X=“valor que se observa” se llama variable uniforme discreta.

X P(X=xi)
1 1/N
2 1/N
N 1/N

Esperanza Matemática de una variable aleatoria

Es la generalización de la media aritmética a toda la población, es decir, es la media de la variable aleatoria. También se llama valor medio, valor esperado o esperanza matemática, y se representa por la letra griega μ

Si X es una variable aleatoria discreta (representada, de manera general, por una tabla de valores
xi y probabilidades pi=P(X=xi))

X P(X=xi)
x1 p1
x2 p2
xn pn

la esperanza se calcula como la media aritmética de los valores, es decir la suma de los valores por sus probabilidades (las probabilidades serían las frecuencias relativas).

μ=E(X)=ki=1xipi

Varianza de una variable aleatoria

Se representa σ2=Var(X), y la desviación típica σ es la raíz cuadrada (con signo positivo) de la varianza.

σ2=Var(X)=E[(Xμ)2].

σ2=E[X2]μ2

Si X es una variable discreta , la forma de hacer los cálculos será

σ2=ki=1(xiμ)2pi=(ki=1x2ipi)μ2

Ejemplo:

Consideremos la variable aleatoria que representa el número que puede salir en el lanzamiento de un dado:

X P(X=xi)
1 1/6
2 1/6
6 1/6

E(X)=ki=1xipi=6i=1i16=166i=1i=1621=3.5

Variables aleatorias discretas

Para cada distribución hay cuatro comandos. Los comandos para cada distribución están precedidos de una letra para indicar la funcionalidad:

  • d: devuelve la función de densidad de probabilidad
  • p: devuelve la función de densidad acumulada
  • q: quantiles
  • r: devuelve los números generados aleatoriamente

La distribución de Bernoull

En una serie de experimento repetidos en donde sus resultados son éxito y fracaso, y sus probabilidades son respectivamente p y 1p, entonces el número de éxitos, 0 y 1, tiene una distribución probabilidad de Bernoulli:

f(X;p)=px(1p)1x

  • Cualquier variable aleatoria cuyo único valor posible son 0 y 1 se llama variable aleatoria de Bernoulli.

El valor medio de una variable de Bernoulli es:

μ=p

Así que le número esperado de los S en cualquier ensayo es únicamente p.

Distribución de probabilidad binomial

  • Existe una serie de N ensayos.
  • en cada ensayo, sólo existe dos posibles resultados.
  • en cada ensayo, los dos posibles resultados son mutuamente excluyentes. Existe independencia entre los resultados en cada ensayo.
  • La probabilidad de cada posible resultado en cualquier ensayo se mantiene igual de un ensayo a otro.

La probabilidad de obtener x éxitos en n intentos independientes es:

f(x,n,p)=(nx)px(1p)nx

donde p es la probabilidad constante de un éxito por cada intento.

La La función de distribución acumulativa puede expresarse como

F(x;n,p) = \mbox{Pr}(X\leq x) = \sum_{i=0}^{x}\binom{n}{i} p^i (1-p)^{n-i}

library(tigerstats)
pbinomGC(4, region="below", size= 6, prob = 0.6, graph = T)

## [1] 0.76672

Para el valor medio o esperado de una distribución binomial $X~Bin(n,p ) $ esta dado por :

\begin{equation} E\left( X\right) =np \end{equation}

la varianza por

\begin{equation} V\left( X\right)=np\left(1-p \right) =npq \end{equation}

Ejercicio

Suponga que hay doce preguntas de opción múltiple en un examen de matemáticas. Cada pregunta tiene cinco posibles respuestas, y sólo una de ellas es correcta. Encuentre la probabilidad de tener cuatro o menos respuestas correctas si un estudiante intenta responder a cada pregunta al azar.

Ejercicio

Un jugador de baloncesto tiene un porcentaje en tiros libres del 75%. - Calcular la probabilidad de que en 4 lanzamientos de tiros libres consiga 2 canastas. - Calcular la probabilidad de que en 8 lanzamientos de tiros libres consiga 4 canastas. - ¿Cuántos lanzamientos debe realizar para que el número esperado de canastas sea mayor que 7?

Variable de Poisson

Un proceso de Poisson es un experimento aleatorio donde se observa la aparición de un suceso concreto (éxito) sobre un soporte continuo (generalmente el tiempo). Además, debe cumplirse que los sucesos ocurren de forma independiente y con media estable (el número medio de sucesos por unidad de medida es constante).

Ejemplos de procesos de Poisson son:

  • Clientes que acuden a un mostrador por unidad de tiempo
  • Llamadas por unidad de tiempo a callcenter,
  • Defectos por metro de cable
  • Huecos por kilometro de autopista…

En un proceso de Poisson, la variable
X=número de éxitos en un intervalo se dice que sigue una distribución de Poisson de parámetro \lambda. Se escribe
X \in Pois(\lambda)

Su distribución de probabilidad es:

P(X=k)=e^{-\lambda }\frac{\lambda ^{k}}{k!},\ \ \ k=0,1,2,... Se verifica que:

E(X)=Var(X)=\lambda

es decir, que el parámetro \lambda es precisamente el número medio de sucesos que estamos contando, y, en este caso, también coincide con la varianza de la variable.

Ejercicios:

Si hay doce coches cruzando un puente por minuto en promedio, encuentre la probabilidad de tener diecisiete o más coches cruzando el puente en un minuto en particular.

La probabilidad de tener dieciséis automóviles o menos cruzando el puente en un minuto particular viene dada por la función ppois.

ppois(16, lambda=12)   
## [1] 0.898709

Por lo tanto, la probabilidad de tener diecisiete o más automóviles cruzando el puente en un minuto está en la cola superior de la función de densidad de probabilidad.

ppois(16, lambda=12, lower=FALSE)   
## [1] 0.101291

Respuesta La probabilidad de tener 17 carros o mas cruzando es de 10.1%

Distribuciones Continuas

Distreibución normal

De manera general, una variable aleatoria continua
X se dice que sigue una distribución normal o gaussiana de parámetros
\mu y \sigma si su función de densidad es de la forma

f(x)=\dfrac{1}{\sigma \sqrt{2\pi }}e^{-\dfrac{(x-\mu )^2}{2\sigma ^{2}}},\ \ -\infty <x<\infty

se verifica que

E(X)=\int_{-\infty }^{\infty } xf(x)dx = \mu, \ \ \ Var(X)=\int_{-\infty }^{\infty } (x-\mu )^2f(x)dx = \sigma^2

  • Esta variable, cuando se consideran los valores $ y \sigma=1 , se llama Normal estándar o Normal tipificada.

  • Si tenemos una variable X con media \mu y desviación típica \sigma , a partir de ella se puede construir lo que se conoce como variable tipificada o estandarizada Z=\frac{x-\mu}{\sigma} , verificándose que esta variable Z tiene media cero y desviación típica uno.

Ejercicio

X es una variable normalmente distribuida con una media de \mu=30 y una desviación estándar de \sigma=4 Encontrar

  • P(x<40)

  • P(x>21)

  • P(30<x<35)

Continua distribución normal