Curso de Capacitación en Estadística

El curso se divide en cuatro módulos:

  1. Estadística Descriptiva y Gráficos, con R. (6 horas)

  2. Probabilidad y Distribuciones usuales en la investigación. (6 horas)

  3. Inferencia Estadística para la investigación. (4 horas)

  4. Regresión simple .(2 horas)

Introducción

En está primera parte del curso vamos a explicar los primeros conceptos elementales de la estadística descriptiva. Estudiaremos las nociones de población, muestra y variable. Explicaremos también algunas formas de clasificar las variables y mencionaremos las escalas de medición que se pueden usar para cada variable

¿Qué es la estadística descriptiva?

La estadística descriptiva es un conjunto de técnicas y procedimientos estadísticos que ayudan a describir, mostrar y resumir, la información de un conjunto de datos.

Población

Una población es un conjunto de personas, objetos o eventos, de los cuales nos interesa estudiar algunas de sus características.

  • Personas mayores a 18 años que son fumadoras

  • Artículos producidos por una maquinaria

  • Velocidades a las que viajan automovilistas en un cierto punto de una avenida

  • Números de semillas en las naranjas de cierta especie cultivadas en una región en una cierta temporada

Muestra

Una muestra es cualquier subconjunto de una población. Al número de elementos de la muestra se le llama tamaño de la muestra.

Unidad de observación

Una unidad de observación es un grupo de elementos de una población, de la cual se tiene, o es posible obtener, su información de manera conjunta.

Variables

Una variable es una característica de interés que posee cada elemento de una población y que podemos medir.

Datos

Mediante el término datos se entiende al conjunto de observaciones de una o varias variables de interés para todos los elementos de una muestra.

Ejemplos:

edad=c(18,19,NA,18,24,17,22,15,22,25)
sexo=c(0,1,0,0,1,0,0,1,1,0)
estudios=c(1,2,0,1,3,2,3,1,2,3)
Datos<-data.frame(edad,sexo,estudios)
library(knitr)
kable(Datos)
edad sexo estudios
18 0 1
19 1 2
NA 0 0
18 0 1
24 1 3
17 0 2
22 0 3
15 1 1
22 1 2
25 0 3

Ejercicio 1

Crear un data.frame en R con los siguientes datos:

Ejercicio 1

Clasificación de variables

Cuantitativa

Una variable es cuantitativa si sus valores son números y representan una cantidad.

Discreta

Una variable cuantitativa es discreta si el conjunto de todos sus posibles valores tiene un número finito de elementos, o bien es infinito, pero se pueden numerar uno por uno de acuerdo al conjunto de número naturales.

Continua

Una variable cuantitativa es continua si puede tomar todos los valores dentro de un intervalo \((a, b)\) de números reales y no toma valores aislados.

Cualitativa

Una variable es cualitativa si sus valores representan una cualidad, un atributo o una categoría. Se les llama también variables categóricas.

Nominal

Las variables cualitativas nominales son categorías que no se pueden clasificar.

Ordinal

La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme.

Clasificación de variables

Ejercicio 2

Clasifica las siguientes variables:

1-> El nivel de felicidad de una persona.

2-> El tiempo de vida útil de un foco.

3-> El número de hijos en las familias.

4-> El estado civil de una persona.

5-> La precipitación pluvial en una región.

6-> La estatura promedio de un equipo de basketbol.

Descripciones numéricas

En está parte del curso estudiaremos varias fórmulas que tienen como objetivo resumir o representar en uno, o varios números, la información de un conjunto de datos, principalmente numéricos. Supondremos que tenemos un conjunto de \(n\) medicione

\[x_1,x_2,..,x_n\]

que representan valores observados de cierta variable de interés.

Descripciones numéricas

Medidas de tendencia central

Media

La media o media aritmética es simplemente el promedio de los números \(x_1,...,x_n\), esto es, se suman todos estos datos y se divide entre \(n\). A la cantidad resultante la denotaremos por \(\overline{x}\) (se lee \(x\) barra).

\[\overline{x}=\frac{x_1+x_2+\cdots+x_n}{n}\]

Por ejemplo, supongamos que tenemos el siguiente conjunto de \(n=6\) datos que representan estaturas de personas medidas en metros

Ejemplo

#Insertamos los valores de x
x <- c(1.65,1.70,1.71,1.70,1.85,1.80) 
# Comando para la media
mean(x)
## [1] 1.735

En el ejemplo mostrado, el valor \(\overline{x}=1.735\) es la estatura promedio del conjunto de personas considerado.

Ejercicio 3

Calcular la media de los siguientes datos:

\[-1,-1,-1, 0, 1, 1, 2, 2, 2, 3\]

La media de un conjunto de datos puede interpretarse como el centro de gravedad de las observaciones cuando éstas son consideradas como pesos. Esto es, supongamos que sobre el eje horizontal se coloca un peso de cierta magnitud en cada uno de los valores observados \(x_1,...,x_n\).Veamos esto, usando el resultado encontrado en el Ejercicio 3.

La media como punto de equilibrio de pesos.

En ocasiones las \(n\) observaciones numéricas de una variable se encuentran registradas de la siguiente forma: \(k\) valores observados distintos \(x_1,...,x_k\) junto con las frecuencias con las que se han registrado estos valores. Estas frecuencias \(f_1,...,f_k\) son números enteros mayores o iguales a cero y la suma de todas ellas es igual al tamaño de la muestra n. La media se calcula como hemos indicado antes pero en este caso se reduce a la siguiente expresión

\[\overline{x}=\frac{1}{n}\sum_{i=1}^{n}x_if_i\]

Por ejemplo, supongamos que se tiene una serie de 10 observaciones de los valores \(-1, 0\) y \(1\) con frecuencias 3, 5 y 2, respectivamente. La media es entonces

\[\overline{x}=\frac{1}{10}(-1\cdot(3)+0\cdot(5)+1\cdot(2))=-0.1\]

x1<-c(-1,-1,-1,0,0,0,0,0,1,1)
table(x1)
## x1
## -1  0  1 
##  3  5  2
mean(x1)
## [1] -0.1

Moda

La moda es el valor que aparece con mayor frecuencia en el conjunto de datos, si lo hubiera.

Datos

La moda es el dato 15 pues éste aparece con más frecuencia que los otros datos. Para calcular la moda de un conjunto de datos en el paquete estadístico R, no existe una función predefinida, sin embargo, pueden usarse los siguientes comandos.

x <- c(15,20,15,20,25,15)
names(sort(-table(x)))[1]
## [1] "15"

Consideremos ahora un ejemplo de una variable cualitativa que mide las condiciones de un producto y que tiene como posibles valores: Malo, Regular, Bueno. Suponga que tenemos el siguiente conjunto de 6 observaciones

Datos

Entonces es claro que la moda es el valor “Bueno”. En R el cálculo anterior se lleva a cabo de manera similar al caso de valores numéricos

x <- c("Malo","Bueno","Bueno","Regular","Malo","Bueno")
names(sort(-table(x)))[1]
## [1] "Bueno"

De esta forma, la moda es una medida de tendencia central de los datos pues indica el valor observado con mayor frecuencia. No existe una notación estándar para la moda. Se puede usar, por ejemplo, la expresión Moda\((x)\).

Mediana

Otra medida de tendencia central para datos numéricos es la mediana. Supongamos nuevamente que tenemos una colección de \(n\) números

\[x_1,x_2,..,x_n\]

Podemos ordenar estos números de menor a mayor, incluyendo repeticiones, y obtener la colección

\[x_{(1)},x_{(2)},..,x_{(n)}\]

en donde \(x_{(1)}\) denota el número más pequeño, \(x_{(2)}\) denota el segundo númro más pequeño, etcétera, hasta \(x_{(n)}\) que denota el número más grande. Es claro que algunos de estos números pueden repetirse, es decir, algunos de estos datos pueden aparecer varias veces en esta ordenación.

La mediana es el dato ordenado de en medio, esto es,

  • Si el número de datos \(n\) es par, entonces existen dos datos ordenados de en medio y la mediana es el promedio de estos dos números, esto es \(\displaystyle \frac{x_{(n/2)}+x_{(n/2+1)}}{2}\)

  • Si el número de datos \(n\) es impar, entonces el dato ordenado de en medio es \(x_{((n-1)/2)}\) y esta es la mediana.

Ejemplo

Veamos algunos ejemplos del cálculo de la mediana considerando un número pequeño de datos. Supongamos que tenemos el registro de las siguientes estaturas (en centímetros) de 6 personas:

Ejemplo

Ordenando estos números de menor a mayor, incluyendo repeticiones, se obtiene el siguiente arreglo:

Ejemplo

Como se trata de un número par de datos, la mediana es el promedio de los dos datos centrales, esto es,

\[\begin{align*} \tilde{x}&=\frac{170+172}{2}\\ &=171 \end{align*}\]

En este caso la mediana es un valor no observado. Usando el paquete R la mediana se calcula mediante la función median() como se muestra a continuación:

x <- c(165,172,170,165,174,182)
median(x)
## [1] 171

Vamos a agregar el dato 175 en el ejemplo anterior para así tener 7 datos. Tenemos ahora un número impar de datos. Los datos ordenados son

Ejemplo

Como se trata de un número impar de datos, la mediana es el dato central, esto es, el dato 172. Se puede comprobar este cálculo de la mediana en el paquete R de la siguiente forma:

x <- c(165,172,170,165,174,182,175)
median(x)
## [1] 172

Medidas de dispersión

Ahora estudiaremos algunas cantidades que permiten medir el grado de dispersión de un conjunto de datos numéricos. En casi todas estas medidas de dispersión es necesario considerar un valor central de los datos como punto de referencia. Como tal valor central tomaremos a la media \(\overline{x}\). Cualquier otra medida de localización puede usarse como valor central pero, siguiendo lo mayormente usado, la media es nuestra elección.

Varianza

La varianza es un promedio de la distancia al cuadrado de cada uno de los datos \(x_i\) respecto de la media \(\overline{x}\) y es la medida de dispersión más comúnmente usada. Se calcula de la forma siguiente.

\[s^2=\frac{1}{n}\sum_{i=1}^{n}(x_i-\overline{x})^2\]

Para especificar que se trata de la varianza de un conjunto de datos denotado por \(x\), a la varianza la denotaremos también por los símbolos \(s^2_x\), \(s^2(x)\) o también por var\((x)\). Es claro que para calcular la varianza primero es necesario encontrar la media \(\overline{x}\). Por ejemplo, consideremos el siguiente conjunto de pesos en kilogramos de 6 personas:

Ejemplo

Puede comprobarse que la media es \(\overline{x}=69\) y por lo tanto la varianza se obtiene como sigue:

\[s^2=\frac{1}{6}\left((70-69)^2+(68-69)^2+(75-69)^2+(66-69)^2+(70-69)^2+(65-69)^2\right)=10.666\]

x <- c(70,68,75,66,70,65)
var(x)
## [1] 12.8

Se puede observar que hay una diferencia entre el valor presentado antes y el que reporta el paquete R en el cálculo de esta varianza. La razón se encuentra en que la varianza también puede definirse como se indica en la siguiente fórmula y es la que usa R en su cálculo.

\[s^2=\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\overline{x})^2\]

Desviación estándar

A la raíz cuadrada positiva de la varianza se le llama desviación estándar o desviación típica, y se le denota por la letra \(s\). Así, para su cálculo se usa la siguiente fórmula:

\[s=\sqrt{\frac{1}{n}\sum_{i=1}^{n}(x_i-\overline{x})^2}\]

Por ejemplo, para el conjunto de datos de pesos dados en kilogramos de 6 personas mostrados líneas arriba para el cálculo de la varianza, tenemos que la desviación estándar es

\[s=\sqrt{10.6666}=3.265986\]

Lo cual en R se puede calcular mediante la función sd(). Las letras sd provienen del término en inglés standard deviation.

 x <- c(70,68,75,66,70,65)
sd(x)
## [1] 3.577709

Rango

Ahora definiremos el rango de una colección de números \(x_1,...,x_n\). Para calcular esta cantidad es necesario identificar el dato más pequeño \(x_{(1)}\) y el dato más grande \(x_{(n)}\). El rango de la colección de números dada se denota por la letra \(r\) y es simplemente el dato mayor menos el dato menor.

\[r=x_{(n)}-x_{(1)}\]}

El rango de un conjunto de datos numéricos puede calcularse en R mediante el comando range(). La aplicación de esta función en R produce el cálculo del valor mínimo y el valor máximo del conjunto de datos numéricos dado. La diferencia de estas dos cantidades produce el número que hemos definido como rango. Aquí tenemos un ejemplo

x <- c(13,25,12,10,24,14)
range(x)
## [1] 10 25

Medidas de posición

Cuantiles

Consideremos nuevamente que \(x_1,...,x_n\) es un conjunto de \(n\) observaciones de una cierta variable cuantitativa de interés, y que estos valores se ordenan de menor a mayor, conservando las repeticiones. Un cuantil es un número que separa a los datos en dos partes: un cierto porcentaje de los datos son menores o iguales al cuantil y el porcentaje complementario corresponde a datos que son mayores o iguales al cuantil.

Para dar una definición más precisa de cuantil consideraremos que \(p\) es un número cualquiera conocido tal que \(0<p\leq 1\). Este valor determinará los porcentajes de los que hablamos en el párrafo anterior.

Por ejemplo, podemos suponer que \(p =0.2\). Entonces un cuantil es un número \(c\) tal que la proporción de valores \(x_i\) que son menores o iguales a \(c\) es del \(20 \%\) y, al mismo tiempo, la proporción de valores \(x_i\) que son mayores o iguales a \(c\) es el porcentaje complementario, esto es, el \(80 \%\).

Cuantiles

  • Cuando \(p =\) 0.25, 0.50 ó 0.75, a los cuantiles correspondientes se le llama cuartiles, y se usan las expresiones: primer cuartil, segundo cuartil y tercer cuartil, respectivamente.

  • Cuando \(p = 0.1, 0.2,..., 0.9\), a los cuantiles correspondientes se les llama deciles. Podemos referirnos al primer decil de un conjunto de datos, al segundo decil, etcétera.

  • En otras ocasiones se requiere dividir al conjunto de datos en cien porcentajes iguales, y entonces cuando \(p=\) 0.01, 0.02,…, 0.99 a los cuantiles correspondientes se les llama percentiles.

Ejemplo:

Supongamos que tenemos ahora una colección de $n =4 $ números y que éstos son

\[0,0,1,2\]

¿ Cómo encontramos los cuantiles para \(p=0.2,0.5, 0.8\)?

En el paquete estadístico R, los tres cálculos anteriores pueden reproducirse a un mismo tiempo usando el siguiente código.

 x <- c(0,0,1,2)
 quantile(x,c(0.2,0.5,0.8),type=2)
## 20% 50% 80% 
## 0.0 0.5 2.0

Medidas de forma

Coeficiente de asimetría (Skewness)

Un conjunto de datos numéricos es simétrico si estas cantidades se encuentran distribuidas simétricamente alrededor de la media. En la isguiente figura en donde se muestra un ejemplo gráfico de datos simétricos y otro ejemplo de datos no simétricos.

Asimetría

La cantidad que llamaremos coeficiente de asimetría (en inglés skewness) es una medida de la asimetría (falta de simetría) de un conjunto de datos numéricos \(x_1,...,x_n\).

\[s_k=\frac{1}{s^3}\left(\frac{1}{n}\sum_{i=1}^{n}(x_i-\overline{x})^3\right)\]

Veamos un ejemplo, un conjunto de datos simétricos:

x<-c(1,2,2,3,3,3,4,4,5)
barplot(table(x))
abline(v=mean(x),col="red")

library(moments)
skewness(x)
## [1] 0

Ahora tomemos un conjunto de datos asímetricos:

set.seed(2)
edad<-round(runif(20,15,30),0)
barplot(table(edad))
abline(v=mean(edad),col="blue")

mean(edad)
## [1] 22.75
skewness(edad)
## [1] 0.1386743

Curtosis

La curtosis es un número mayor o igual a cero que no tiene una unidad de medición. Una curtosis grande puede indicar un mayor número de datos alejados de la media, hacia uno u otro lado, y por lo tanto a la curtosis se le interpreta como una medida de la forma de las colas de la distribución o del conjunto de datos.

\[k=\frac{1}{s^4}\left(\frac{1}{n}\sum_{i=1}^{n}(x_i-\overline{x})^4\right)\]

Debido a que la curtosis de la distribución normal estándar es igual a 3, con esta nueva definición la curtosis de la distribución normal es ahora cero.

\[k_3=\frac{1}{s^4}\left(\frac{1}{n}\sum_{i=1}^{n}(x_i-\overline{x})^4\right)-3\]

Curtosis

library(moments)
 x <- c(0,0,0,1,1,2)

barplot(table(x))
abline(v=mean(x),col="red")

kurtosis(x)-3
## [1] -0.96

Descripciones gráficas

Hasta un cierto nivel de precisión, la información representada mediante gráficas es más fácil de entender para la mente humana. Por ejemplo, las gráficas son de gran ayuda para comprender rápidamente la comparación en magnitud entre dos o mas cantidades, o bien en un gráfica se puede observar con claridad un posible comportamiento creciente (o decreciente) de una cierta cantidad, se puede tener también una idea de la velocidad del crecimiento (o del decrecimiento) de una variable, e incluso de manera intuitiva la mente humana puede hacer predicciones del comportamiento de la cantidad en estudio.

Gráfica de barras

Esta es una gráfica simple que consiste de varias barras que representan las categorías (o agrupamiento de valores) de una variable. En el eje horizontal se colocan las categorías, se dibuja una barra para cada categoría y la altura de la barra es la frecuencia o número de veces que se observa la categoría. El ancho de la barra no es relevante y puede no ser homogéneo para todas las categorías, en caso de que se decida agrupar algunas de ellas.

sexo<-c(rep("M",50),rep("H",30))
table(sexo)
## sexo
##  H  M 
## 30 50
barplot(table(sexo))

### Ejercicio 4

Para la siguiente tabla, realice un gráfico de barras

Ejercicio 4

f <- c(12,28,16,24)
gs <- c("A","B","AB","O")
barplot(f,names.arg=gs,xlab="Grupo sanguíneo",ylab="Frecuencia")

## Histograma

Un histograma es una gráfica muy similar a una gráfica de barras. Adquiere este nombre cuando existe un orden entre los valores de la variable a graficar. Salvo esta condición, los datos puede ser cualitativos o cuantitativos. Nuevamente, para cada valor, categoría o clase de la variable, se asocia una barra cuya altura es la frecuencia con la que se observa la categoría. Como las categorías tienen un orden, se representan regularmente en el eje horizontal de menor a mayor. Como en las gráficas de barras y para mayor información, en la parte superior de cada barra se puede colocar la frecuencia absoluta, la frecuencia relativa o la frecuencia porcentual.

x<-round(runif(100,15,45),0)
hist(x)

## Gráfica de pastel

Para variables cualitativas o bien para variables cuantitativas agrupadas, se pueden elaborar gráficas de pastel, también llamadas pie charts. Estas son gráficas circulares divididas en sectores que permiten comparar visualmente las frecuencias porcentuales de los valores observados de una variable.

sexo<-c(rep("M",50),rep("H",30))
table(sexo)
## sexo
##  H  M 
## 30 50
pie(table(sexo))

Ejercicio 5

Ingrese la siguiente rutina y realice dos gráficos de pastel

sectores <- c(15,35,20,30)
categorias <- c("A","B","AB","O")
pie(sectores, labels = categorias)

Para el segundo ejemplo, se puede generar una gráfica básica en tercera dimensión de la siguiente forma, suponiendo instalada la biblioteca plotrix.

library(plotrix)
sectores <- c(2,4,10)
categorias <- c("JP", "JE", "JG")
pie3D(sectores, labels=categorias, explode=0.1)

Gráfica de tallo y hojas

Esta es otra forma gráfica de representar un conjunto de datos numéricos. Su aspecto es muy similar al de un histograma dibujado horizontalmente. Daremos varios ejemplos para ilustrar la construcción de este tipo de gráficas.

Consideremos el siguiente conjunto de datos

Datos

En el paquete R se pueden obtener gráficas de tallo y hojas usando el comando stem(). La palabra en inglés stem se traduce como tallo. A continuación repetimos el ejemplo mostrado pero ahora en R.

x<-c(126,102,84,100,67,89,73,124,113,91,92,96,112,70,82,95,121,126,72,84,87,92,107,100)
stem(x,scale=2)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##    6 | 7
##    7 | 023
##    8 | 24479
##    9 | 12256
##   10 | 0027
##   11 | 23
##   12 | 1466

Diagrama de caja y brazos

Esta es una forma gráfica de representar de manera resumida un conjunto de datos numéricos \(x_1,...,x_n\). Esta representación está compuesta por una caja y por dos marcas en dos de sus extremos opuestos que asemejan brazos. A este tipo de gráficas se les conoce también como diagramas de caja y bigotes, y por los términos en inglés boxplots o whiskers. Para dibujar estos diagramas se necesita determinar el centro de la caja, su altura y los tamaños de los brazos superior e inferior. Explicaremos dos maneras en las que se pueden determinar estos parámetros.

x <- c(-5,1,2,3,4,5,6,7,8,9,10,15)
boxplot(x)

# Paquete ggplot2

El paquete ggplot2 permite personalizar los gráficos con temas. Es posible personalizar cada detalle de un gráfico, como los colores, tipos de líneas, fuentes o alineación, entre otros, usando los componentes de la función theme. Además, la librería proporciona otras funciones que permiten añadir títulos, subtítulos, líneas, flechas o textos.

install.packages(“ggplot2”) #1- Instalar el paquete ggplot2

library(ggplot2) #2- Cargar el paquete en memoria

Cuando usamos ggplot2 para hacer gráficos, en realidad lo que hacemos es crear un contenedor, al que le tendremos que incorporar la información de:

  • los datos que vamos a usar

  • los ejes que se van a representar

  • y una capa por cada gráfico que se quiera dibujar en esos ejes

Así, para cada diagrama que se dibuje con ggplot2 debemos definir al menos:

  • data= es obligatoriamente un conjunto de datos o “data.frame”

  • aes() es la configuración de los ejes

  • y la capa de gráficos propiamente dicha

Por ejemplo, para el conjunto de datos denominado “iris” (que contiene datos sobre 3 especies de esta planta):

iris setosa, iris versicolor e iris virginica. En este caso, representaremos la totalidad de los datos buscando un

patrón entre “Sepal.Length” y “Petal.Length”.

Empezaremos creando el contenedor:

ggplot(data=iris, aes(Sepal.Length, Petal.Length))

Como se puede observar, hemos creado el “contendor” del gráfico, con sus ejes, y etiqueta los ejes. Cabe destacar que el “contenedor” del gráfico averigua el rango que necesita cada eje para representar los datos. Pero falta lo principal, ¿dónde están los puntos?¿o las líneas?¿o el área?. La respuesta es que aún no la hemos dibujado. Está todo preparado pero falta pedir que tipo de gráfico queremos hacer. Vamos a probar con un nube de puntos o “scatterplot”:

ggplot(data=iris, aes(Sepal.Length, Petal.Length)) + geom_point()

Ahora prbaremos a usar líneas (aunque no es la mejor opción en este caso):

ggplot(data=iris, aes(Sepal.Length, Petal.Length)) + geom_line()

Con la librería ggplot2 podemos mejorar fácilmente la representación gráfica. Al principio puede parecer mas tedioso tener que abrir un contenedor de gráficos y luego añadir el diagrama que se desee, pero esto a su vez es útil cuando se quieren usar algunas representaciones comunes. Por ejemplo, si queremos agregar un sombreado basado en cálculos estadísticos de funciones de suavizado, podemos hacerlo simplemente agregando “stat_smooth()”.

ggplot(data=iris, aes(Sepal.Length, Petal.Length)) + geom_point() + stat_smooth()
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'

Agrupar elementos por colores

Podemos pintar los puntos con distintos colores, según la especie por ejemplo:

ggplot(data=iris, aes(Sepal.Length, Petal.Length,color=Species)) + geom_point()

Ahora le agregaremos la líneas de suavizado, con sus bandas de confianza, también por especies:

# Creamos el contenedor de ggplot
ggplot(data=iris, aes(Sepal.Length, Petal.Length,color=Species)) +
geom_point() + # los puntos
stat_smooth() # líneas y bandas de suavizado (smooth)
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'

# Ahora sin banda de confianza
# Creamos el contenedor de ggplot
ggplot(data=iris, aes(Sepal.Length, Petal.Length,color=Species)) +
geom_point() + # los puntos
stat_smooth(se=FALSE) # líneas y bandas de suavizado (smooth)
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'

Si queremos que los puntos tengan la información de especie (coloreados por especie por ejemplo) pero queremos mostrar la tendencia global (sin agrupar por especie), entonces sería así:

# Creamos el contenedor de ggplot
ggplot(data=iris) +
geom_point( aes(x=Sepal.Length, y=Petal.Length,color=Species)) + # SOLO los puntos coloreados
stat_smooth(aes(x=Sepal.Length, y=Petal.Length))
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'

Para seguir trabajando con ggplot2, recomiendo seguir trabajando con este enlace:

https://rua.ua.es/dspace/bitstream/10045/69767/1/Modulo_4_-_Graficos_avanzados_con_ggplot2.pdf

Paquete Esquisse en Programación R

Los paquetes en la programación R son una colección de funciones R, código compilado y datos de muestra. Se almacenan en un directorio llamado » biblioteca » en el entorno R. De forma predeterminada, R instala un conjunto de paquetes durante la instalación. Uno de los paquetes más importantes de R es el paquete Esquisse . El paquete Esquisse ayuda a explorar y visualizar sus datos de forma interactiva. Es un gadget brillante para crear gráficos ggplot de forma interactiva con arrastrar y soltar para mapear sus variables. Uno puede visualizar rápidamente los datos según su tipo, exportarlos a ‘PNG’ o ‘PowerPoint’ y recuperar el código para reproducir el gráfico.

Instalación

Para usar un paquete en la programación R, primero debe instalar el paquete. Esta tarea se puede realizar con el comando install.packages(esquisse) .

Para trabajar, vamos a revisar el siguuiente enlace https://barcelonageeks.com/paquete-esquisse-en-programacion-r/

Ejercicio 6

Vamos a explorar el conjunto de datos dado, posibles gráficos con Esquisse, que nos ayude a relizar diferentes gráficos y poder entender que tenemos en nuestros datos.

Probabilidad

El papel que la probabilidad desempeña para hacer inferencias se estudiará con detalle después de sentar una base adecuada para la teoría de probabilidad. En este punto presentaremos un tratamiento elemental de esta teoría por medio de un ejemplo y una petición a su intuición.

Considere a un jugador que desea hacer una inferencia respecto al balance de un dado. La población conceptual de interés es el conjunto de números que se generarían si el dado se tirara un número infinito de veces. Si el dado estuviera perfectamente balanceado, un sexto de las mediciones de esta población serían los números 1, un sexto de números 2, un sexto de números 3 y así sucesivamente. La correspondiente distribución de frecuencia.

x<-c(1,2,3,4,5,6)
table(x)
## x
## 1 2 3 4 5 6 
## 1 1 1 1 1 1
px<-prop.table(table(x))
barplot(px)

Si se usa el método científico, un jugador propone la hipótesis de que el dado está balanceado y busca observaciones de la naturaleza para contradecir la teoría, si es falsa. Se selecciona una muestra de diez tiros de la población al tirar el dado diez veces; los diez tiros resultan en números 1. El jugador estima este resultado de la naturaleza con un ojo envidioso y concluye que su hipótesis no está de acuerdo con la naturaleza y por tanto que el dado no está balanceado.

Hagmos un ejemplo:

set.seed(2)
dado<-round(runif(100,1,6),0)
table(dado)
## dado
##  1  2  3  4  5  6 
##  8 25 22 14 20 11
propdado<-prop.table(table(dado))
barplot(propdado,main="¿Qué podemos decir?")

El razonamiento empleado por el jugador identifica el papel que desempeña la probabilidad para hacer inferencias. El jugador rechazó su hipótesis (y concluyó que el dado no está balanceado) no porque sea imposible tirar diez números 1 en diez tiros de un dado balanceado sino porque esto es altamente improbable.

Su evaluación de la probabilidad fue principalmente subjetiva. Esto es, el jugador puede no haber sabido cómo calcular la probabilidad de diez números 1 en diez tiros, pero tenía una impresión intuitiva de que este evento era muy poco probable si el dado estuviera balanceado. El punto a observar es que su decisión estuvo basada en la probabilidad de la muestra observada.

Un modelo probabilístico para un experimento: el caso discreto

Nos referimos al experimento de lanzar un dado cuando observamos el número que aparecía en la cara superior. Usaremos el término experimento para incluir observaciones obtenidas de situaciones incontrolables por completo (por ejemplo observaciones en el precio diario de una acción en particular) así como aquellas hechas en condiciones controladas de laboratorio. Tenemos la siguiente definición:

Experimento

Un experimento es el proceso por medio del cual se hace una observación.

Ejemplos:

Ejemplos de experimentos incluyen el tiro de monedas y dados, medir el cociente de inteligencia (IQ) de una persona o determinar el número de bacterias por centímetro cúbico en una porción de alimento procesado.

Cuando se realiza un experimento, puede terminar en uno o más resultados que se llaman eventos. En nuestras exposiciones, los eventos se denotarán con letras mayúsculas. Si el experimento consiste en contar el número de bacterias en una porción de alimento, algunos eventos de interés podrían ser

A: Exactamente 110 bacterias están presentes.

B: Más de 200 bacterias están presentes.

C: El número de bacterias presentes está entre 100 y 300.

Algunos eventos asociados con un solo tiro de un dado balanceado son los siguientes:

A: Observar un número impar.

B: Observar un número menor que 5.

C: Observar un 2 o un 3.

\(E_1\): Observar un 1.

\(E_2\): Observar un 2.

\(E_3\): Observar un 3.

\(E_4\): Observar un 4.

\(E_5\): Observar un 5.

\(E_6\): Observar un 6.

Evento simple

Un evento simple no se puede descomponer. Cada evento simple corresponde a un y sólo un punto muestral. La letra E con un subíndice se empleará para denotar un evento simple o el correspondiente punto muestral.

Evento simple

Espacio muestral

El espacio muestral asociado con un experimento es el conjunto formado por todos los posibles puntos muestrales. Un espacio muestral estará denotado por \(S\).

Ejemplo:

Fácilmente podemos ver que el espacio muestral S asociado con el experimento de lanzar un dado está formado por seis puntos muestrales correspondientes a los seis eventos simples

\[S=\{E_1,E_2,E_3,E_4,E_5,E_6\}\]

Espacio muestral

Un espacio muestral discreto es aquel que está formado ya sea por un número fi nito o uno contable de puntos muestrales distintos.

Para experimentos con espacios muestrales discretos, los eventos compuestos se pueden ver como grupos (conjuntos) de puntos muestrales o bien, de manera equivalente, como uniones de los conjuntos de puntos muestrales simples correspondientes a los eventos simples apropiados. Por ejemplo, el evento \(A\) de lanzar un dado (observar un número impar)

Evento muestral

ocurrirá si y sólo si ocurre uno de los eventos simples \(E_1\), \(E_3\) o \(E_5\). Así,

\[A=\{E_1,E_3,E_5\}, \text{ ó } A=E_1\cup E_3\cup E_5\]

Del mismo modo, \(B\) (observar un número menor que 5) se puede escribir como

\[B=\{E_1,E_2,E_3,E_4\} \text{ ó }B=E_1\cup E_2\cup E_3\cup E_4\]

La regla para determinar cuáles eventos simples incluir en un evento compuesto es muy precisa. Un evento simple \(E_i\) se incluye en el evento \(A\) si y sólo si \(A\) ocurre siempre que ocurra \(E_i\).

Espacio muestral discreto

Un evento en un espacio muestral discreto \(S\) es un conjunto de puntos muestrales, es decir, cualquier subconjunto de \(S\).

Evento muestral

Definición de probabilidad

Suponga que \(S\) es un espacio muestral asociado con un experimento. \(A\) todo evento \(A\) en \(S\) (\(A\) es el subconjunto de \(S\)) le asignamos un número, \(P(A)\), llamado probabilidad de \(A\), de modo que se cumplen los siguientes axiomas:

Axioma 1: \(P(A) \geq 0\).

Axioma 2: \(P(S) = 1\).

Axioma 3: Si \(A_1, A_2, A_3\),… forman una secuencia de eventos por pares mutuamente excluyentes en \(S\) (es decir, \(A_i \cap A_j = \phi\) si \(i \neq j\)), entonces

\[P(A_1\cup A_2\cup A_3\cup...\cup A_n )=\sum_{i=1}^nP(A_i)\]

Ejemplo: Un fabricante tiene cinco terminales de computadora aparentemente idénticas listas para ser enviadas. Sin que él lo sepa, dos de las cinco están defectuosas. Un pedido en particular solicita dos de las terminales y el pedido se surte seleccionando al azar dos de las cinco de que se dispone.

  1. Indique el espacio muestral para el experimento.

  2. Denote con \(A\) el evento de que el pedido se surta con dos terminales no defectuosas. Indique los puntos muestrales en \(A\).

  3. Construya un diagrama de Venn para el experimento que ilustre el evento \(A\).

  4. Asigne probabilidades a los eventos simples en tal forma que se use la información acerca del experimento y se satisfagan los axiomas de la Definición de probabilidad.

  5. Encuentre la probabilidad del evento \(A\).

Solución:

  1. Marquemos con \(D_1\) y \(D_2\) las dos terminales defectuosas y con \(G_1\), \(G_2\) y \(G_3\) las tres terminales buenas. Cualquier punto muestral estará formado por una lista de las dos terminales seleccionadas para envío. Los eventos simples pueden denotarse con

Ejemplo

Así, hay diez puntos muestrales en \(S\), y \(S =\{E_1,E_2,..., E_{10}\}\).

  1. Evento \(A=\{E_8,E_9,E_{10}\}\).

Ejemplo

  1. Debido a que las terminales se seleccionan al azar, cualquier par de terminales es tan probable de ser seleccionado como cualquier otro. Entonces,\(\displaystyle P(E_i)=\frac{1}{10}\), para \(i=1,2,...,10\), es una asignación razonable de probabilidades..

  2. Como \(\displaystyle A=E_8\cup E_9\cup E_{10}=\frac{1}{10}+\frac{1}{10}+\frac{1}{10}=\frac{3}{10}\).

Probabilidad condicional y la independencia de eventos

La probabilidad de un evento en ocasiones depende de si sabemos que han ocurrido otros eventos. Por ejemplo, los pescadores deportivos de Florida están vitalmente interesados en la probabilidad de lluvia. La probabilidad de lluvia en un día determinado, si no se hace caso de las condiciones atmosféricas diarias o de otros eventos, es la fracción de días en los que hay lluvia en un largo periodo. Ésta es la probabilidad incondicional del evento “lluvia en un día determinado”. Ahora suponga que deseamos considerar la probabilidad de lluvia mañana.

Definición: La probabilidad condicional de un evento \(A\), dado que un evento \(B\) ha ocurrido, es igual a

\[P(A|B)=\frac{P(A \cap B)}{P(B)}\]

siempre que \(P(B)>0\).

Ejemplo:

Suponga que un dado balanceado se tira una vez. Use la definición para hallar la probabilidad de un 1, dado que se obtuvo un número impar.

Solución:

Defi na estos eventos:

\(A\): observar un 1.

\(B\): observar un número impar.

Buscamos la probabilidad de \(A\) dado que el evento \(B\) ha ocurrido. El evento \(A \cap B\) requiere que se observen un 1 y un número impar. En este caso, \(A \subset B\), de modo que \(A \cap B = A\) y \(P(A \cap B) = P(A) = 1/6\). También, \(P(B) = 1/2\) y, \[P(A|B)=\frac{P(A \cap B)}{P(B)}=\frac{\frac{1}{6}}{\frac{1}{2}}=\frac{2}{6}=\frac{1}{3}\]

Nótese que este resultado está en completo acuerdo con nuestra anterior evaluación intuitiva de esta probabilidad.

Ejercicio

Un estudio de conducta, después de un tratamiento hecho a gran número adictos a las drogas, sugiere que la probabilidad de hallarlos culpables no más de dos años después del tratamiento depende de la educación de los infractores. Las proporciones del número total de casos que caen en cuatro categorías de educación-culpabilidad se muestran en la tabla siguiente:

Ejercicio

Suponga que se selecciona un solo infractor del programa de tratamiento. Defina los eventos:

A: el infractor tiene 10 o más años de educación.

B: el infractor es hallado culpable en no más de dos años después de terminar el tratamiento.

Encuentre lo siguiente:

  1. \(P(A)=0.4\)

  2. \(P(B)=0.37\)

  3. \(P(A\cap B)=0.1\)

  4. \(P(A\cup B)=P(A)+p(B)-p(A\cap B)=0.1+0.37-0.1=0.67\)

  5. \(P(\overline{A})=1-0.4=0.6\)

  6. \(P(\overline{A\cup B})=1-0.67=0.33\)

  7. \(P(\overline{A\cap B})=1-0.1=0.9\)

  8. \(\displaystyle P(A|B)=\frac{P(A\cap B)}{P(B)}=\frac{0.1}{0.37}=0.72\)

  9. \(\displaystyle P(B|A)=\frac{P(B\cap A)}{P(A)}=\frac{0.1}{0.4}=0.25\)

Ley de probabilidad total y regla de Bayes

El método de composición de evento para resolver problemas de probabilidad en ocasiones se facilita al ver el espacio muestral, \(S\), como una unión de subconjuntos mutuamente excluyentes y usar la siguiente ley de probabilidad total. Los resultados de esta sección están basados en la siguiente construcción.

Definición: Para algún entero positivo \(k\), sean los conjuntos \(B_1, B_2, … , B_k\) tales que

  1. \(S=B_1\cup B_2\cup ...\cup B_k\)

  2. \(B_i\cap B_j\neq\phi\), para \(i\neq j\)

Entonces se dice que la colección de conjuntos \(\{B_1, B_2, … , B_k\}\) es una partición de \(S\).

Si \(A\) es cualquier subconjunto de \(S\) y \(\{B_1, B_2, … , B_k\}\) es una partición de \(S\), \(A\) puede descomponerse como sigue:

\[A=(A\cap B_1)\cup(A\cap B_2)\cup ...\cup (A\cap B_k)\]

Partición

Regla de Bayes

Suponga que \(\{B_1, B_2, … , B_k\}\) es una partición de \(S\) tal que \(P(B_i) > 0\), para \(i = 1, 2, . . . , k\). Entonces

\[P(B_j|A)=\frac{P(A|B_j)P(B_j)}{\sum_{i=1}^{k}P(A|B_i)P(B_i) }\]

Ejemplo:

Una población de electores contiene 40% de republicanos y 60% de demócratas. Se publica que 30% de los republicanos y 70% de los demócratas están a favor de un tema de elección. Se encuentra que una persona seleccionada al azar de esta población está a favor del tema en cuestión. Encuentre la probabilidad condicional de que esta persona sea un demócrata.

Solución:

Definamos los siguientes eventos:

\(D\): Persona demócrata

\(R\): Persona republicana

\(F\): Personas que están a favor

La pregunta: la probabilidad condicional de que esta persona sea un demócrata.

\[P(D|F)=\frac{P(F|D)P(D)}{P(F|D)P(D)+P(F|R)P(R)}=\frac{0.7\cdot 0.6}{0.7\cdot 0.6+0.3\cdot 0.4}\]

(0.7*0.6)/(0.7*0.6+0.3*0.4)
## [1] 0.7777778

\[P(D|F)=0.7777778\]

Ejemplo:

Se observa que hombres y mujeres reaccionan de modo diferente a un conjunto determinado de circunstancias; se sabe que 70% de las mujeres reaccionan positivamente a estas circunstancias mientras que de este mismo modo reaccionan sólo 40% de los hombres. Un grupo de 20 personas, 15 mujeres y 5 hombres, se sometió a estas circunstancias y a los sujetos se les pidió describieran sus reacciones en un cuestionario escrito. Una respuesta escogida al azar de las 20 fue negativa. ¿Cuál es la probabilidad de que haya sido de un hombre?

Solución:

Definamos los eventos:

\(P\): Reacciona de manera positiva

\(M\): La encuesta sea de un hombre

\(F\): La encuesta sea de una mujer

Que tenemos de datos:

\[P(P|F)=0.7, \, \, \, \, P(P|M)=0.4, \, \, \, \, P(M)=\frac{5}{20}=0.25\]

Pregunta: Una respuesta escogida al azar de las 20 fue negativa. ¿Cuál es la probabilidad de que haya sido de un hombre?

\[P(M|\overline{P})=\frac{P(\overline{P}|M)P(M)}{P(\overline{P}|M)P(M)+P(\overline{P}|F)P(F)}\]

Necesitamos saber:

\[P(\overline{P}|M)=1-P(P|M)=1-0.4=0.6\] \[P(\overline{P}|F)=1-P(P|F)=1-0.7=0.3\]

entonces:

\[P(M|\overline{P})=\frac{P(\overline{P}|M)P(M)}{P(\overline{P}|M)P(M)+P(\overline{P}|F)P(F)}=\frac{0.6\cdot 0.25}{0.6\cdot 0.25+0.3\cdot0.3\cdot0.75}\]

(0.6*0.25)/(0.6*0.25+0.3*0.75)
## [1] 0.4

\[P(M|\overline{P})=0.4\]

Eventos numéricos y variables aleatorias

Los eventos de mayor interés para el científico, ingeniero u hombre de negocios son los identificados por números, llamados eventos numéricos. El médico investigador está interesado en el evento de que diez de cada diez pacientes tratados sobreviva a una enfermedad; el hombre de negocios está interesado en el evento de que sus ventas en el año próximo lleguen a 5 millones de dólares. Denote con \(Y\) una variable a ser medida en un experimento. Como el valor de \(Y\) varía dependiendo del resultado del experimento, se denomina variable aleatoria. A cada punto del espacio muestral le asignaremos un número real que denote el valor de la variable \(Y\). El valor asignado a \(Y\) varía de un punto muestral a otro, pero a algunos puntos se les puede asignar el mismo valor numérico. Entonces, hemos definido una variable que es una función de los puntos muestrales en \(S\) y todos los puntos muestrales donde \(Y = a\) es el evento numérico asignado al número \(a\).

Ejemplo:

Definir un experimento como lanzar dos monedas al aire y observar los resultados. Sea \(Y\) igual al número de caras obtenido. Identifique los puntos muestrales en \(S\), asigne un valor de \(Y\) a cada punto muestral e identifique los puntos muestrales asociados con cada valor de la variable aleatoria \(Y\).

Solución:

Representemos con \(H\) y \(T\) cara y cruz, respectivamente, e identifique con un par ordenado de símbolos al resultado de las monedas primera y segunda.

\(E_1=HH\)

\(E_2=HT\)

\(E_3=TH\)

\(E_4=TT\)

Como \(Y\) es igual al número de caras obtenido, se tiene:

\[\{Y=0\}=\{E_4\}\] \[\{Y=1\}=\{E_2,E_3\}\] \[\{Y=2\}=\{E_1\}\]

Denote con \(y\) un valor observado de la variable aleatoria \(Y\). Entonces \(P(Y = y)\) es la suma de las probabilidades de los puntos muestrales a los que se asigna el valor \(y\).

Calcule las probabilidades para cada valor de \(Y\):

\[P(Y=0)=P(E_4)=\frac{1}{4}\]

\[P(Y=1)=P(E_2)+P(E_3)=\frac{1}{4}+\frac{1}{4}=\frac{1}{2}\]

\[P(Y=2)=P(E_4)=\frac{1}{4}\]

Distribución de probabilidad para una variable aleatoria continua

Antes de que podamos expresar una defi nición formal para una variable aleatoria continua, debemos defi nir la función de distribución (o función de distribución acumulativa) asociada con una variable aleatoria.

Definición: Denote con \(Y\) cualquier variable aleatoria. La función de distribución de \(Y\), denotada por \(F(y)\), es tal que \(F(y) = P(Y \leq y)\) para \(-\infty < y < \infty\).

La distribución de probabilidad normal

La distribución de probabilidad continua que más se utiliza es la distribución normal, con la conocida forma de campana que estudiamos en relación con la regla empírica. La función de densidad normal es como sigue:

Definición:

Se dice que una variable \(Y\) tiene una distribución normal de probabilidad si y sólo si, para \(\sigma>0\) y \(-\infty < y < \infty\), la función de densidad de \(Y\) es

\[f(y)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(y-\mu)^2}{2\sigma^2}},\, \, \, \, \, \, -\infty < y < \infty\]

Observe que la función de densidad normal contiene dos parámetros, \(\mu\) y \(\sigma\).

# Rejilla de valores para el eje X
x <- seq(-4, 8, 0.1)

#-----------------------------------------
# Misma desviación típica, distinta media
#-----------------------------------------
# Media 0, desviación típica 1
plot(x, dnorm(x, mean = 0, sd = 1), type = "l",
     ylim = c(0, 0.6), ylab = "", lwd = 2, col = "red")
# Media 3, desviación típica 1
lines(x, dnorm(x, mean = 3, sd = 1), col = "blue", lty = 1, lwd = 2)

# Añadimos una leyenda
legend("topright", c(expression(paste(, mu, " ", sigma)), "0 1", "3 1"),
       lty = c(0, 1, 1), col = c("blue", "red"), box.lty = 0, lwd = 2)

#-----------------------------------------
# Misma media, distinta desviación típica
#-----------------------------------------
# Media 1, desviación típica 1
plot(x, dnorm(x, mean = 1, sd = 1), type = "l",
     ylim = c(0, 1), ylab = "", lwd = 2, col = "red")
# Media 1, desviación típica 0.5
lines(x, dnorm(x, mean = 1, sd = 0.5), col = "blue", lty = 1, lwd = 2)

# Añadimos una leyenda
legend("topright", c(expression(paste(, mu, " ", sigma)), "1 1", "1 0.5"),
       lty = c(0, 1, 1), col = c("blue", "red"), box.lty = 0, lwd = 2)

Ejemplo:

Denote con \(Z\) una variable aleatoria normal con media 0 y desviación estándar 1

x<- seq(-3, 3, length = 100)
plot(x, dnorm(x, mean = 0, sd = 1), type = "l",
     ylim = c(0, 0.4), ylab = "", lwd = 2, col = "blue")

  1. Encuentre \(P(Z \leq 2.5)\).
x<- seq(-3, 3, length = 100)
plot(x, dnorm(x, mean = 0, sd = 1), type = "l",
     ylim = c(0, 0.4), ylab = "", lwd = 2, col = "blue")
abline(v=2.5,col="red")

pnorm(2.5, 0, 1)
## [1] 0.9937903
  1. Encuentre \(P(Z > 2)=1-P(Z\leq 2)\).
x<- seq(-3, 3, length = 100)
plot(x, dnorm(x, mean = 0, sd = 1), type = "l",
     ylim = c(0, 0.4), ylab = "", lwd = 2, col = "blue")
abline(v=2.5,col="red")

1-pnorm(2.5, 0, 1)
## [1] 0.006209665
  1. Encuentre \(P(-2\leq Z\leq 2)\).
pnorm(2, 0, 1)-pnorm(-2, 0, 1)
## [1] 0.9544997
  1. Encuentre \(P(0\leq Z\leq 1.73)\).
pnorm(1.73, 0, 1)-0.5
## [1] 0.4581849

Ejercicio:

Las calificaciones para un examen de admisión a una universidad están normalmente distribuidas con media de 75 y desviación estándar 10. ¿Qué fracción de las calificaciones se encuentra entre 80 y 90?

pnorm(90, 75, 10)-pnorm(80, 75, 10)
## [1] 0.2417303

Ejercicio:

Los promedios de calificaciones (GPA, por sus siglas en inglés) de una gran población de estudiantes universitarios están normalmente distribuidos en forma aproximada, con media de 2.4 y desviación estándar 0.8. ¿Qué fracción de los estudiantes alcanzarán un GPA de más de 3.0?

1-pnorm(3, 2.4, 0.8)
## [1] 0.2266274

Ejercicio

Un método para llegar a pronósticos económicos es usar un método de consenso. Un pronóstico se obtiene de todos y cada uno de un gran número de analistas; el promedio de los pronósticos de estas personas es el pronóstico de consenso. Suponga que los pronósticos de tasa de interés preferencial de enero de 1996 de todos los analistas económicos están distribuidos normalmente en forma aproximada con media de 7% y desviación estándar de 2.6%. Si un solo analista se selecciona al azar entre este grupo, ¿cuál es la probabilidad de que el pronóstico del analista de la tasa de interés preferencial

  1. exceda de 11%?
1-pnorm(0.11, 0.07, 0.026)
## [1] 0.0619679
  1. sea menor que 9%?
pnorm(0.09, 0.07, 0.026)
## [1] 0.7791218

Ejercicio

Se supone que las califi caciones de un examen están normalmente distribuidas con media de 78 y varianza de 36.

  1. ¿Cuál es la probabilidad de que una persona que haga el examen alcance calificaciones mayores de 72?

  2. Suponga que los estudiantes que alcancen el 10% más alto de esta distribución reciben una calificación de A. ¿Cuál es la califi cación mínima que un estudiante debe recibir para ganar una calificación de A?

  3. ¿Cuál debe ser el punto límite para pasar el examen si el examinador desea pasar sólo a 28.1% más alto de todas las califi caciones?

  4. ¿Aproximadamente qué proporción de estudiantes tienen calificaciones de 5 o más puntos arriba de la calificación que corta al 25% más bajo?

  5. Si se sabe que la calificación de un estudiante es mayor que 72, ¿cuál es la probabilidad de que su calificación sea, de hecho, superior a 84?

La distribución de probabilidad gamma

lgunas variables aleatorias son siempre no negativas y por varias razones dan distribuciones de datos que está sesgadas (no simétricas) a la derecha. Esto es, casi toda el área bajo la función de densidad está ubicada cerca del origen y la función de densidad cae gradualmente conforme y aumenta.

Función de densidad de probabilidad sesgada

Los intervalos de tiempo entre mal funcionamiento de motores de aviones poseen una distribución de frecuencia sesgada, al igual que los intervalos de llegada en una fila de espera en las cajas de un supermercado (esto es, la fila de espera para llegar a la caja a pagar). Del mismo modo, los intervalos de tiempo para completar una revisión de mantenimiento para un motor de automóvil o de avión poseen una distribución de frecuencia sesgada. La población asociada con estas variables aleatorias posee con frecuencia funciones de densidad que son modeladas de manera adecuada por una función de densidad gamma.

Definición:

Se dice que una variable aleatoria \(Y\) tiene una distribución gamma con parámetros \(\alpha>0\) y \(\beta>0\) si y sólo si la función de densidad de \(Y\) es

\[f(y)=\begin{cases}\frac{y^{\alpha-1}e^{-y/\beta}}{\beta^\alpha\Gamma(\alpha)}&0\leq y<\infty\\ 0&\text{en otro caso}\end{cases}\] donde \[\Gamma(\alpha)=\int_{0}^{\infty}y^{\alpha-1}e^{-y}\, dy\]

Función Gamma

Ejemplo:

Sea \(\chi\sim\)Gamma\(\{2,3\}\), calcular la probabilidad de que \(4<Y<9\)

alpha<-2
beta<-3
area<-seq(4,9,0.01)
xP <- c(4,area,9)
yP <- c(0,dgamma(area,alpha,1/beta),0)
curve(dgamma(x,alpha,1/beta),xlim=c(0,20),yaxs="i",ylim=c(0,0.15),ylab="f(y)",
      main='Densidad gamma(2,3)') 
polygon(xP,yP,col="orange2")
box()

pgamma(9,alpha,1/beta)-pgamma(4,alpha,1/beta)
## [1] 0.4159117

Calcular la probabilidad de que \(Y\leq7\)

pgamma(7,alpha,1/beta)
## [1] 0.6767601

Calcular la probabilidad de que \(Y>4.5\)

1-pgamma(4.5,alpha,1/beta)
## [1] 0.5578254

Si \(P(Y\leq K)=0.3\), ¿cual es el valor de \(k\)?

qgamma(0.3,alpha,1/beta)
## [1] 3.292048

Si \(Y\) tiene una distribución gamma con parámetros \(\alpha\) y \(\beta\), entonces

\[\mu=\alpha\beta\hspace{2cm} \sigma^2=\alpha\beta^2\]

Ejercicio:

La magnitud de temblores registrados en una región de América del Norte puede modelarse como si tuviera una distribución exponencial con media 2.4, según se mide en la escala de Richter. Encuentre la probabilidad de que un temblor que ocurra en esta región

  1. sea mayor que 3.0 en la escala de Richter. \(P(X>3)\)
a<-1
b<-2.4
1-pgamma(3,a,1/b)
## [1] 0.2865048
  1. caiga entre 2.0 y 3.0 en la escala de Richter. \(P(2<X<3)\)
a<-1
b<-2.4
pgamma(3,a,1/b)-pgamma(2,a,1/b)
## [1] 0.1480934

Ejercicio:

El operador de una estación de bombeo ha observado que la demanda de agua durante las primeras horas de la tarde tiene una distribución aproximadamente exponencial con media de 100 pes (pcs cúbicos por segundo).

  1. Encuentre la probabilidad de que la demanda sea mayor que 200 pcs durante las primeras horas de la tarde en un día seleccionado al azar. \(P(X>200)\)
a<-1
b<-100
1-pgamma(200,a,1/b)
## [1] 0.1353353

Distribución \(\chi^2\)

En teoría de la probabilidad y en estadística, la distribución ji al cuadrado (también llamada distribución de Pearson o distribución \(\chi^2\) con \(k\in\mathbb{N}\) grados de libertad es la distribución de la suma del cuadrado de \(k\) variables aleatorias independientes con distribución normal estándar. La distribución chi cuadrada es un caso especial de la distribución gamma y es una de las distribuciones de probabilidad más usadas en Inferencia Estadística, principalmente en pruebas de hipótesis y en la construcción de intervalos de confianza.

Teorema:

Sea \(\chi\) una variable aleatoria ji-cuadrada con \(k\) grados de libertad, entonces su función de densidad es:

\[f_k(y)=\frac{1}{2^{k/2}\Gamma\left(\frac{k}{2}\right)}y^{k/2-1}e^{-y/2}, \text{ para }x\geq0\]

Obsérvese que la función de densidad ji-cuadrada corresponde a una densidad gamma con parámetros

\[\beta=2, \, \, \, \alpha=\frac{k}{2}\]

x<-seq(0,50,0.01)
k<-6
alpha<-k/2
k1<-12
a1<-k1/2
k2<-18
a2<-k2/2
k3<-30
a3<-k3/2
beta<-2
curve(dgamma(x,alpha,1/beta),xlim=c(0,50),yaxs="i",ylim=c(0,0.15),ylab="f(y)",
      main='Densidad ji cuadrada, k=6',col = "red", lty = 1, lwd = 2) 
lines(x, dgamma(x,a1,1/beta), col = "blue", lty = 1, lwd = 2)
lines(x, dgamma(x,a2,1/beta), col = "green", lty = 1, lwd = 2)
lines(x, dgamma(x,a3,1/beta), col = "orange", lty = 1, lwd = 2)
legend("topright", c(expression( "k", "6 ", "12","18","30")),
       lty = c(0, 1, 1,1,1), col = c("","red", "blue","green","orange"), box.lty = 0, lwd = 2)