FACET - UNC

Probabilidad y Estadística I


Capitulo 1


Bienvenidos a la clase de Probabilidad y Estadística I, iniciamos la primera clase definiendo lo que es la estadística descriptiva, viendo ejemplos y ejercicios resueltos para realizar las actividades poniendo ya a prueba nuestros conocimientos adquiridos, para el desarrollo de las clases se utilizará esta plataforma para tener información de los contenidos a ser desarrollados, acontinuación damos inicio al tema a desarrollar utilizando el libro de (Walpole et al. 1992) y libro de (Canavos y Medal 1987).

¿Qué es la estadística?

La estadística es una rama de la matemática que se ocupa de los métodos de recolección, organización, análisis de datos y que permite tomar decisiones de acuerdo a los resultados obtenidos durante el proceso del análisis.

Tipos de estadística

Existen dos tipos de estadística, Descríptiva e Inferencial.

Estadística descriptiva

Se puede decir que la estadística descriptiva es una disciplina que se encarga de recoger datos, almacenarlos, ordenar y realizar tablas o gráficos, calcular parámetros básicos sobre el conjunto de datos que se tiene.

Estadístca inferencial

La Estadística inferencial es una rama de la Estadística , también conocida como inductiva, es aquella estadística que realiza predicciones, proyecciones y juicios valorativos respecto a un gran conjunto de informaciones, basados en datos reunidos a partir de una serie de informaciones más pequeña.


Ejemplo de estadística descriptiva

Los siguientes datos son la vida útil de 40 baterias de automóvil, elabora una tabla de frecuencias y hallar las medidas de tendencia central.

Vida de 40 baterías de automóvil
2,2 4,1 3,5 4,5 3,2 3,7
3,0 2,6 3,4 1,6 3,1 3,3
3,8 3,1 4,7 3,7 2,5 4,3
3,4 3,6 2,9 3,3 3,9 3,1
3,3 3,1 3,7 4,4 3,2 4,1
1,9 3,4 4,7 3,8 3,2 2,6
3,9 3,0 4,2 3,5
Resolución del ejemplo

[X]- Para trabajar con tablas de frecuencia en R studio necesitamos descargar de la libreria el paquete fdth con la instrucción en la consola install.packages(fdth)

Para cargar los datos de la matriz en R studio se procede de la siguiente manera:

A<-matrix(data=c(2.2, 4.1, 3.5, 4.5, 3.2, 3.7, 3.0, 2.6, 3.4, 1.6, 3.1, 3.3, 3.8, 3.1, 4.7, 3.7, 2.5, 4.3, 3.4, 3.6, 2.9, 3.3, 3.9, 3.1, 3.3, 3.1, 3.7, 4.4, 3.2, 4.1, 1.9, 3.4, 4.7, 3.8, 3.2, 2.6, 3.9, 3.0, 4.2, 3.5), nrow = 8, ncol = 5, byrow = TRUE)
A
##      [,1] [,2] [,3] [,4] [,5]
## [1,]  2.2  4.1  3.5  4.5  3.2
## [2,]  3.7  3.0  2.6  3.4  1.6
## [3,]  3.1  3.3  3.8  3.1  4.7
## [4,]  3.7  2.5  4.3  3.4  3.6
## [5,]  2.9  3.3  3.9  3.1  3.3
## [6,]  3.1  3.7  4.4  3.2  4.1
## [7,]  1.9  3.4  4.7  3.8  3.2
## [8,]  2.6  3.9  3.0  4.2  3.5

Los datos no estan ordenados lo hacemos con la siguiente instrucción:

matriz<-sort(A, decreasing = FALSE)

Para visualizar como lo ordena la función sort solo escribes en la consola:

matriz
##  [1] 1.6 1.9 2.2 2.5 2.6 2.6 2.9 3.0 3.0 3.1 3.1 3.1 3.1 3.2 3.2 3.2 3.3 3.3 3.3
## [20] 3.4 3.4 3.4 3.5 3.5 3.6 3.7 3.7 3.7 3.8 3.8 3.9 3.9 4.1 4.1 4.2 4.3 4.4 4.5
## [39] 4.7 4.7

Ahora los datos estan ordenados de menor a mayor, lo siguiente sería guardar estos datos en un data.frame, cambiando el nombre de nuestra matriz datos lo guardaremso ahora como vida.

vida<-data.frame(matriz)

Para visualizar nuestro data.frame ponemos la función view(vida)

Nuestra matriz de datos ahora se llama vida, el siguiente paso es amarrar con attachlos datos para no volver a escribir los datos en la matriz, hacemos lo siguiente.

names(vida)
## [1] "matriz"
attach(vida)
## The following object is masked _by_ .GlobalEnv:
## 
##     matriz

Luego de hacer estos pasos usemos la libreria(fdth)

library(fdth)
distribution<-fdt(matriz, start=1.6, end=5, h=0.5)

Guardamos la distribución de frecuencias en una tabla llamada distribution.

Un punto muy importante es que para usar este paquete tenemos que calcular previamente el tamaño del intervalo que viene dado por la fórmula:

\[h = \frac{\max - \min}{m}\] Donde \(h\) es el tamaño del intervalo, \(\max\) es el valor más grande de nuestros datos, \(\min\) es el valor más pequeño y \(m\) es el número de clases.

La fórmula para el número de clases viene dada por la ecuación de Sturges:

\[m = 1 + 3,322 \cdot \log(n)\]

Cálculo auxiliar

Veamos el orden de nuestros datos, observa que \(n =40\), luego tenemos que el valor máximo \(\max = 4.7\) y el valor mínimo \(\min = 1.6\), reemplanzado en la fórmula:

\[ m = 1 + 3,322 \cdot \log(40) \approx 6\] Por último cáculamos el intervalo de clase:

\[h = \frac{4.7 - 1.6}{6} \approx 0.5\] Para construir nuestra tabla de frecuencias utilizamos la siguiente instrucción:

distribution<-fdt(matriz, start=1.6, end=5.1, h=0.5)

Para visualizar la tabla:

##  Class limits  f   rf rf(%) cf cf(%)
##     [1.6,2.1)  2 0.05   5.0  2   5.0
##     [2.1,2.6)  2 0.05   5.0  4  10.0
##     [2.6,3.1)  5 0.12  12.5  9  22.5
##     [3.1,3.6) 15 0.38  37.5 24  60.0
##     [3.6,4.1)  8 0.20  20.0 32  80.0
##     [4.1,4.6)  6 0.15  15.0 38  95.0
##     [4.6,5.1)  2 0.05   5.0 40 100.0
Class limits f rf rf(%) cf cf(%)
[1.6,2.1) 2 0.050 5.0 2 5.0
[2.1,2.6) 2 0.050 5.0 4 10.0
[2.6,3.1) 5 0.125 12.5 9 22.5
[3.1,3.6) 15 0.375 37.5 24 60.0
[3.6,4.1) 8 0.200 20.0 32 80.0
[4.1,4.6) 6 0.150 15.0 38 95.0
[4.6,5.1) 2 0.050 5.0 40 100.0
x
start 1.6
end 5.1
h 0.5
right 0.0

El histograma de frecuencia

Para graficar el histograma usamos la función plot.

plot(distribution,type ="fh", col="#a432a8")

Gráfica de la ojiva
plot(distribution,type ="cfp", col="#9c170e")


Ejercicios

1- Los siguientes datos son los lapsos, en minutos, necesarios para que 50 clientes de un banco comercial, lleve a cabo una transacción bancaria:

2.3 0.2 2.9 0.4 2.8
2.4 4.4 5.8 2.8 3.3
3.3 9.7 2.5 5.6 9.5
1.8 4.7 0.7 6.2 1.2
7.8 0.8 0.9 0.4 1.3
3.1 3.7 7.2 1.6 1.9
2.4 4.6 3.8 1.5 2.7
0.4 1.3 1.1 5.5 3.4
4.2 1.2 0.5 6.8 5.2
6.3 7.6 1.4 0.5 1.4

a- Construir una tabla de frecuencia relativa

b- Construir una distribución de frecuencia relativa acumulada

c- Construir un histograma

d- Construir la ojiva y el polígono de frecuencias


2- La siguiente información agrupada representa el número de puntos anotados por equipo y por juego en la liga Nacional del futbol paraguayo durante la temporada de 2020.

Gurpo Frecuencia
0 - 3 27
4 - 10 66
11 - 17 91
18 - 24 70
25 - 31 57
32 - 38 34
39 - 45 16
46 - 52 3

a- Graficar la distribución de frecuencia relativa.

b- Graficar la ojiva y el polígono de frecuencia.


3- Los siguientes datos agrupados representan los pagos por almacenamiento para los 50 más grandes detallistas durante el año 2016.

Límites de estructura de la clase Frecuencia
1.10 - 1.86 4
1.87 - 2.63 14
2.64 - 3.40 11
3.41 - 4.17 9
4.18 - 4.49 7
4.95 - 5.71 1
5.72 - 6.48 2

Capitulo 2


Medidas de tendencia central para datos no agrupados

Media

La media de las observaciones \(x_{1}, x_{2}, x_{3}, \cdots , x_{n}\) es el promedio aritmético de éstas y se denota por:

\[\begin{equation} \overline{x} = \frac{1}{n} \sum_{i=1}^{n} x_{i} \end{equation}\]

Mediana

La mediana es el valor para el cual, cuando todas las observaciones se ordenan de manera creciente, la mitad de estas es menor que este valor y la otra mitad mayor.

  1. En caso de que \(n\) sea impar:

\[\begin{equation} \widetilde{x}= x_{\frac{n+1}{2}} \end{equation}\]

  1. En caso de que \(n\) sea par:

\[\begin{equation} \widetilde{x} = \frac{x_{\frac{n}{2}} + x_{\frac{n}{2}+1}}{2} \end{equation}\]

Moda

La moda de un conjunto es el valor de la observación que ocurre con mayor frecuencia en el conjunto

Variabilidad para datos no agrupados

Varianza

La varianza de las observaciones \(x_1\), \(x_2\), \(\cdots\), \(x_n\) es en esencia el promedio del cuadrado de las distancias entre cada observación y la media

\[\begin{equation} S^{2} = \frac{1}{n-1} \sum_{i=1}^{n}(x_{i} - \bar{x})^2 \end{equation}\]

Desviación estándar

Desviación estándar se denomina a la raíz cuadrada positiva de la varianza y se denota por:

\[\begin{equation} S = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n}(x_{i} - \overline{x})^2} \end{equation}\]

Desviación media

La desviación media es el promedio de los valores absolutos de las diferencias entre cada observación y la media de las observaciones.

\[\begin{equation} D.M. = \frac{1}{n} \sum_{i=1}^{n} |x_{i} - \overline{x}| \end{equation}\]

Desviación Mediana

\[\begin{equation} D.Me = \frac{1}{n} \sum_{i=1}^{n} |x_{i} - \widetilde{x}| \end{equation}\]


Ejercicios resueltos

Calculo de las medidas de tendencia central

Teniendo en cuenta el ejemplo de la clase 1

Vida de 40 baterías de automóvil

2,2 4,1 3,5 4,5 3,2 3,7
3,0 2,6 3,4 1,6 3,1 3,3
3,8 3,1 4,7 3,7 2,5 4,3
3,4 3,6 2,9 3,3 3,9 3,1
3,3 3,1 3,7 4,4 3,2 4,1
1,9 3,4 4,7 3,8 3,2 2,6
3,9 3,0 4,2 3,5

Hemos cargado los datos de la siguiente manera:

A<-matrix(data=c(2.2, 4.1, 3.5, 4.5, 3.2, 3.7, 3.0, 2.6, 3.4, 1.6, 3.1, 3.3, 3.8, 3.1, 4.7, 3.7, 2.5, 4.3, 3.4, 3.6, 2.9, 3.3, 3.9, 3.1, 3.3, 3.1, 3.7, 4.4, 3.2, 4.1, 1.9, 3.4, 4.7, 3.8, 3.2, 2.6, 3.9, 3.0, 4.2, 3.5), nrow = 8, ncol = 5, byrow = TRUE)

Utilizaremos la función mean para calcular el promedio de esta matriz de datos.

La media

promedio<-mean(A)
paste("La media de la matriz A es: ", promedio)
## [1] "La media de la matriz A es:  3.4125"

La mediana

mediana<-median(A)
paste("La mediana de la matriz A es: ", mediana)
## [1] "La mediana de la matriz A es:  3.4"

La moda

Para calcular la moda debemos descargar el paquete modeest escribiendo en la consola de rstudio install.packages(modeest)

Una vez que hayamos instalado el paquete escribimos:

library(modeest)

No olvidemos que estamos trabajando con nuestra matriz A, entonces el calculo sería de la siguiente manera usando la función mlv que se encuentra dentro del paquete modeest:

moda<-mlv(A, method="mfv") # en method podemos usar: meanshift, mlv y mfv

paste("El valor de la moda es: ", moda)
## [1] "El valor de la moda es:  3.1"

Calculo de la variabilidad

Del mismo ejemplo en la que estuvimos trabajando veremos como calcular en Rstudio la varianza, la desviación media y la desviación mediana.

La varianza

Dada que nuestra matriz de datos es A lo primero que tenemos que hacer es ordenar estos datos con la función sort de tal forma que nos facilite los calculos.

ordenado<-sort(A, decreasing = FALSE)
ordenado
##  [1] 1.6 1.9 2.2 2.5 2.6 2.6 2.9 3.0 3.0 3.1 3.1 3.1 3.1 3.2 3.2 3.2 3.3 3.3 3.3
## [20] 3.4 3.4 3.4 3.5 3.5 3.6 3.7 3.7 3.7 3.8 3.8 3.9 3.9 4.1 4.1 4.2 4.3 4.4 4.5
## [39] 4.7 4.7

Ahora procedemos a calcular la varianza de estos datos:

varianza<-var(ordenado)
print( sprintf(varianza, fmt = '%.6f')  ) # %.nf donde n es el número de decimales que nosotros queremos que imprima
## [1] "0.493942"

La desviación estándar

Usaremos la función sd lo cual nos devolverá el valor de la desviación estándar.

standar<-sd(ordenado)
print( sprintf(standar, fmt = '%.6f')  ) # %.nf donde n es el número de decimales que nosotros queremos que imprima
## [1] "0.702810"

La desviación media

Previamente habiamos calculado el promedio de la matriz A cuyo valor es promedio = mean(A) igual a 3.4125

des_med<-mean(abs(A-promedio)) # Esto devuelve el valor de la desviación media
print( sprintf(des_med, fmt = '%.4f')  ) # %.nf donde n es el número de decimales que nosotros queremos que imprima
## [1] "0.5337"

La desviación mediana

des_mediana<-mean(abs(A-mediana)) # Esto devuelve el valor de la desviación mediana
print( sprintf(des_mediana, fmt = '%.6f')  ) # %.nf donde n es el número de decimales que nosotros queremos que imprima
## [1] "0.532500"

Capitulo 3


Medidas de tendencia central para datos agrupados

Media

Sean \(x_{i}\) el punto medio y \(f_{i}\) la frecuencia de la i-ésima clase. El valor aproximado de la media es:

\[\begin{equation} \bar{x} = \frac{1}{n}\cdot \sum_{i=1}^{k} f_{i} \cdot x_{i} \end{equation}\]

  • \(x_{i}\) es la marca de clase.

Mediana

Para calcular la mediana con datos agrupados, debemos identificar primeramente la clase de la mediana es decir \(\frac{n}{2}\), donde \(n\) es la cantidad de datos que disponemos:

El valor aproximado de la mediana con datos agrupados, se calcula por la fórmula:

\[\begin{equation} Me = L_{i} + A\cdot \left(\frac{\frac{N}{2} - F_{i-1}}{f_{i}}\right) \end{equation}\]

  1. Donde A es la amplitud 1.

  2. \(L_{i}\) es el límite inferior.

  3. \(F_{i-1}\) es la frecuencia acumulada anterior.

  4. \(N\) es el número total de datos que se dispone.

Moda

El valor aproximado de la moda en datos agrupados, es el punto medio \(x_{i}\) de la clase con mayor frecuencia. También se recurre a la siguiente fórmula que viene dada por:

\[\begin{equation} Mo = L_{i} + \frac{f_{i} - f_{i-1}}{(f_{i} - f_{i-1})+(f_{i} - f_{i+1})} \times A \end{equation}\]


Variabilidad para datos agrupados

La varianza

Sean \(x_{i}\) el punto medio y \(f_{i}\) la frecuencia de la i-ésima clase. El valor aproximado de la varianza es:

\[\begin{equation} S^{2} = \frac{1}{n-1} \cdot \sum_{i=1}^{k} f_{i} \cdot (x_{i} - \bar{x})^2 \end{equation}\]

La desviación estándar

La desviación estándar tiene como valor aproximado, la raíz cuadrada de la varianza:

\[\begin{equation} S = \sqrt{\frac{1}{n-1} \cdot \sum_{i=1}^{k} f_{i} \cdot (x_{i} - \bar{x})^2} \end{equation}\]

La desviación media

Sean \(x_{i}\) el punto medio y \(f_{i}\) la frecuencia de la i-ésima clase. La desviación media aproximada es:

\[\begin{equation} D.M = \frac{1}{n} \cdot \sum_{i=1}^{k} f_{i} \cdot |x_{i} - \bar{x}| \end{equation}\]

La desviación mediana

Sean \(x_{i}\) el punto medio y \(f_{i}\) la frecuencia de la i-ésima clase. La desviación mediana aproximada es:

\[\begin{equation} D.Me = \frac{1}{n} \cdot \sum_{i=1}^{k} f_{i} \cdot |x_{i} - Me| \end{equation}\]


Ejercicios resueltos

Medidas de tendencia central

¿Cómo calcular la media?

Para calcular la media con datos agrupados, necesitamos calcular primeramente el punto medio \(x_{i}\) de cada clase.

A nuestra matriz de distribución de frecuencias debemos añadir \(x_{i}\) que es la marca de clase:

Tabla de distribución de frecuencias
Lim inf Lim sup fi Xi f.Xi
1.6 2.1 2 \(\frac{1.6+2.1}{2}= 1.85\) \(2\times 1.85= 3.7\)
2.1 2.6 2 \(\frac{2.1+2.6}{2}= 2.35\) \(2\times 2.35= 4.7\)
2.6 3.1 5 \(\frac{2.6+3.1}{2}= 2.85\) \(5\times 2.85= 14.25\)
3.1 3.6 15 \(\frac{3.1+3.6}{2}= 3.35\) \(15\times 3.35= 50.25\)
3.6 4.1 8 \(\frac{3.6+4.1}{2}= 3.85\) \(8\times 3.85= 30.8\)
4.1 4.6 6 \(\frac{4.1+4.6}{2}= 4.35\) \(6\times 4.35= 26.1\)
4.6 5.1 2 \(\frac{4.6+5.1}{2}= 4.85\) \(2\times 4.85= 9.7\)
\(n=40\) \(\sum f\cdot x_{i} = 139.5\)

Luego tenemos que el valor de la media es:

\[\bar{x} = \frac{1}{40} \times 139.5= 3.4875 \]


¿Cómo calcular la mediana?

Para calcular la mediana con datos agrupados, debemos identificar primeramente la clase de la mediana:

Tabla de distribución de frecuencias
Lim inf Lim sup \(f_{i}\) \(F_{i}\)
1.6 2.1 2 2
2.1 2.6 2 4
2.6 3.1 5 9
3.1 3.6 15 24
3.6 4.1 8 32
4.1 4.6 6 38
4.6 5.1 2 40
\(n=40\)

Ahora observa que los números que estan en negrita son los datos que usaremos para aplicar la fórmula de la mediana, la razón por la que utilizaremos estos datos proviene del hecho que \(\frac{n}{2} = 20\) donde el valor de la \(n=40\), y observamos en la columna de frecuencia acumulada \(F_{i}\) donde el valor que alcanza a 20 se encuentra en la cuarta fila marcarda en negrita.

\[Me = 3.1 + 0.5\cdot \left(\frac{\frac{40}{2} - 9}{15}\right) = 3.4667\]


¿Cómo calcular la moda?

El valor aproximado de la moda en datos agrupados, es el punto medio \(x_{i}\) de la clase con mayor frecuencia. en este caso el valor de la moda sería:

\[Mo = 3.35\]

Tabla de distribución de frecuencias
Lim inf Lim sup \(f_{i}\) \(x_{i}\)
1.6 2.1 2 1.85
2.1 2.6 2 2.35
2.6 3.1 5 2.85
3.1 3.6 15 3.35
3.6 4.1 8 3.85
4.1 4.6 6 4.35
4.6 5.1 2 4.85
\(n=40\)

Ahora si aplicacamos la fórmula de la fórmula de la moda, tendremos de la siguiente manera:

\[Mo = 3.1+\frac{15 - 5}{(15 - 5)+(15 - 8)} \times 0.5 = 3.394\]


Resumen del ejemplo:

Vida en años de 40 baterías de automóviles
Medidas numéricas Datos no agrupados Datos agrupados
Media 3.4125 3.4875
Mediana 3.4 3.4667
Moda 3.1 3.394

Variabilidad para datos agrupados

La varianza

Tabla de distribución de frecuencias
Lim inf Lim sup \(f_{i}\) \(x_{i}\) \((x_{i}-\bar{x})^2\) \(f_{i}\cdot(x_{i}-\bar{x})^2\)
1.6 2.1 2 1.85 \((1.85-3.4875)^2 = 2.6814\) \(2\times 2.6814=5.3628\)
2.1 2.6 2 2.35 \((2.35-3.4875)^2 = 1.2939\) \(2\times 1.2939=2.5878\)
2.6 3.1 5 2.85 \((2.85-3.4875)^2 = 0.4064\) \(5\times 0.4064=2.0320\)
3.1 3.6 15 3.35 \((3.35-3.4875)^2 = 0.0189\) \(15\times 0.0189=0.2835\)
3.6 4.1 8 3.85 \((3.85-3.4875)^2 = 0.1314\) \(8\times 0.1314=1.0512\)
4.1 4.6 6 4.35 \((4.35-3.4875)^2 = 0.7439\) \(6\times 0.7439=4.4634\)
4.6 5.1 2 4.85 \((4.85-3.4875)^2 = 1.8564\) \(2\times 1.8564=3.7128\)
\(n=40\) \(\sum = 19.4935\)

Una vez obtenida esta tabla aplicamos la fórmula de la varianza:

\[S^2 = \frac{1}{39} \times 19.4935 = 0.4998\]


La desviación estándar

Para calcular la desviación estándar basta calcular utilizando la fórmula @ref(eq:desvia) o simplemente hallar la raíz cuadrada de la varianza es decir:

\[S=\sqrt{S} = \sqrt{0.4998} = 0.7070\]


La desviación media

Tabla de distribución de frecuencias
Lim inf Lim sup \(f_{i}\) \(x_{i}\) \(|x_{i}-\bar{x}|\) \(f_{i}\cdot|x_{i}-\bar{x}|\)
1.6 2.1 2 1.85 \(|1.85-3.4875| = 1.6375\) \(2\times 1.6375=3.2750\)
2.1 2.6 2 2.35 \(|2.35-3.4875| = 1.1375\) \(2\times 1.1375=2.2750\)
2.6 3.1 5 2.85 \(|2.85-3.4875| = 0.6375\) \(5\times 0.6375=3.1875\)
3.1 3.6 15 3.35 \(|3.35-3.4875| = 0.1375\) \(15\times 0.1375=2.0625\)
3.6 4.1 8 3.85 \(|3.85-3.4875| = 0.3625\) \(8\times 0.3625=2.9\)
4.1 4.6 6 4.35 \(|4.35-3.4875| = 0.8625\) \(6\times 0.8625=5.1750\)
4.6 5.1 2 4.85 \(|4.85-3.4875| = 1.3625\) \(2\times 1.3625=2.7250\)
\(n=40\) \(\sum = 21.6\)

Ahora aplicando la fórmula de la desviación media obtendremos el siguiente resultado:

\[D.M = \frac{1}{40} \times 21.6 = 0.54\]


La desviación mediana

Tabla de distribución de frecuencias
Lim inf Lim sup \(f_{i}\) \(x_{i}\) \(|x_{i}-Me|\) \(f_{i}\cdot|x_{i}-Me|\)
1.6 2.1 2 1.85 \(|1.85-3.4667| = 1.6167\) \(2\times 1.6167=3.2334\)
2.1 2.6 2 2.35 \(|2.35-3.4667| = 1.1167\) \(2\times 1.1167=2.2334\)
2.6 3.1 5 2.85 \(|2.85-3.4667| = 0.6167\) \(5\times 0.6167=3.0835\)
3.1 3.6 15 3.35 \(|3.35-3.4667| = 0.1167\) \(15\times 0.1167=1.7505\)
3.6 4.1 8 3.85 \(|3.85-3.4667| = 0.3833\) \(8\times 0.3833=3.0664\)
4.1 4.6 6 4.35 \(|4.35-3.4667| = 0.8833\) \(6\times 0.8833=5.2998\)
4.6 5.1 2 4.85 \(|4.85-3.4667| = 1.3833\) \(2\times 1.3833=2.7666\)
\(n=40\) \(\sum = 21.4336\)

Ahora aplicando la fórmula de la desviación mediana obtendremos el siguiente resultado:

\[D.Me = \frac{1}{40} \times 21.4336 = 0.53584\]


Tabla de resumen del ejercicio resuelto

Medidas numéricas Datos no agrupados Datos agrupados
Varianza 0.4939 0.4998
Desviación estándar 0.7028 0.7070
Desviación media 0.5337 0.54
Desviación mediana 0.5325 0.5358

Ejercicios propuestos

1- Los siguientes datos son los lapsos, en minutos, necesarios para que 50 clientes de un banco comercial, lleven acabo una transacción bancaria:

2.3 0.2 2.9 0.4 2.8
2.4 4.4 5.8 2.8 3.3
3.3 9.7 2.5 5.6 9.5
1.8 4.7 0.7 6.2 1.2
7.8 0.8 0.9 0.4 1.3
3.1 3.7 7.2 1.6 1.9
2.4 4.6 3.8 1.5 2.7
0.4 1.3 1.1 5.5 3.4
4.2 1.2 0.5 6.8 5.2
6.3 7.6 1.4 0.5 1.4

Calcule para datos no agrupados y para los datos agrupados las siguientes medidas:

a- Media, Mediana y Moda

b- Varianza, Desviación Estándar, Desviación Media y Desviación Mediana

c- Compare los resultados

2- Aquí se presenta tres conjuntos de datos:

1, 2, 3, 4, 5, 6;

1, 1, 1, 6, 6, 6;

-13, 2, 3, 4, 5, 20.

Calcular la media y la varianza para cada conjunto de datos. ¿Qué se puede concluir?


Capitulo 4


Probabilidad

Conceptualizaciones

  • Interpretaciones de la probabilidad

Desarrollo axiomático

  • Probabilidad conjunta, marginal y condicional.

  • Eventos estadísticamente independientes.

  • Teorema de Bayes.


Conceptualizaciones

  • Interpretaciones de la probabilidad
    • Definición clásica
    • Interpretación como frecuencia relativa
    • Interpretación subjetiva

Definición clásica de probabilidad

Supongamos que se tiran dos dados ¿Cuál es la probabilidad que la suma sea 7?

1 2 3 4 5 6
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

Definición: Si un evento que está sujeto al azar, resulta de \(n\) formas igualmente probables y mutuamente excluyentes, y si \(n_{A}\) de estos resultados tienen un atributo \(A\), la probabilidad de \(A\) es la proporción de \(n_{A}\) con respecto a \(n\).

\[\begin{equation} P(A) = \frac{n_{A}}{n} \end{equation}\]

  • Aplicando la fórmula, tenemos que:

\(n = 36\) y \(n_{A} = 6\)

luego;

\[P(A) = \frac{6}{36} = 0,1666 \cdots\]

Probabilidad como frecuencia relativa

En un proceso de fabricación, se realiza un muestro para determinar la proporción de defectuosos. En base a los datos de la tabla ¿cuál es la probabilidad de encontrar un artículo defectuoso en el proceso?

Número de unidades muestreadas (n) Número de unidades defectuosas observadas Frecuencia relativa
20 2 0.10
100 4 0.04
500 28 0.056
2000 97 0.0485
10000 504 0.0504

Definición: Si un experimento se repite 𝒏 bajo las mismas condiciones y si \(n_{B}\) de los resultados son favorables a un atributo \(B\), el límite de \(\displaystyle{\frac{n_{B}}{n}}\) cuando \(n\) se vuelve grande, se define como probabilidad del atributo \(B\).

\[\begin{equation} P(B) = \lim_{n \to \infty } \frac{n_{B}}{n} \end{equation}\]

Ejemplo

En un proceso de fabricación, se realiza un muestro para determinar la proporción de defectuosos. En base a los datos de la tabla ¿cuál es la probabilidad de encontrar un artículo defectuoso en el proceso?

Número de unidades muestreadas (n) Número de unidades defectuosas observadas Frecuencia relativa
20 2 0.10
100 4 0.04
500 28 0.056
2000 97 0.0485
10000 504 0.0504

Solución

\[P(B) \approx 0,05\]

Interpretación Subjetiva de la Probabilidad

Definición: La probabilidad se interpreta como el grado de creencia o de convicción con respecto a la ocurrencia de una afirmación.

En este contexto, la probabilidad representa el juicio personal acerca de un fenómeno impredecible.


Ejercicios

I- Los empleados de la compañia New Horizons se encuentran separados en tres divisiones: administración, operación de planta y ventas. La siguiente tabla indica el número de empleados en cada división clasificados por sexo:

Tabla 1
Mujer (M) Hombre(H) Totales
Adminstración (A) 20 30 50
Operación de planta (O) 60 140 200
Ventas (V) 100 50 150
Totales 180 220 400

Si se elige aleatoriamente un empleado:

1- ¿Cuál es la probabilidad de que sea mujer?

2- ¿Cuál es la probabilidad de que trabaje en ventas?

3- ¿Cuál es la probabilidad de que sea hombre y trabaje en la división de administración?

4- ¿Cuál es la probabilidad de que trabaje en la división de operación de planta, si es mujer?

5- ¿Cuál es la probabilidad de que sea mujer si trabaja en la división de operación de planta?

II- Se lanza una moneda diez veces y en todos los lanzamientos el resultado es cara. ¿Cuál es la probabilidad de este evento?. ¿Cuál es la probabilidad de que en el decimoprimero lanzamiento el resultado sea cruz?

¿Qué tipo de probabilidad utilicé en cada ejercicio?


Capítulo 5

Desarrollo axiomático

Espacio muestral

Definición: El conjunto de todos los posibles resultados de un experimento aleatorio recibe el nombre de espacio muestral \(S\).


El espacio muestral puede ser discreto o continuo:

Discreto

  • \(S =\{ x \in \mathbb{Z} / x > 0\}\)

    • \(S = \{0,1,2, \cdots \}\)

Continuo

  • \(S = \{x \in \mathbb{R} / a\leq x \leq b\}\)

    • \(S = \{x \in \mathbb{R} / 0 \leq x \leq 500\}\)

Eventos

Definición. Un evento \(𝑬\) del espacio muestral \(𝑺\) es un grupo de resultados contenidos en este, cuyos miembros tienen un característica común.

El evento que contiene a ningún resultado del espacio muestral recibe el nombre de Vacío \(\emptyset\)


Unión de eventos

Sean \(𝑬_𝟏\) y \(𝑬_𝟐\) dos eventos que se encuentran en un espacio muestral \(𝑺\).

El evento formado por todos los posibles resultados en \(𝑬_𝟏\) o \(𝑬_𝟐\) o en ambos recibe el nombre de unión.

\[𝑬_𝟏 \bigcup 𝑬_𝟐\]


Intersección de eventos

Sean \(𝑬_𝟏\) y \(𝑬_𝟐\) dos eventos que se encuentran en un espacio muestral \(𝑺\).

El evento formado por todos los resultados comunes tanto a \(𝑬_𝟏\) como \(𝑬_𝟐\) recibe el nombre de intersección.

\[𝑬_{𝟏} \bigcap 𝑬_{𝟐}\]


Eventos mutuamente excluyentes

Sean \(𝑬_𝟏\) y \(𝑬_𝟐\) dos eventos que se encuentran en un espacio muestral \(𝑺\).

Se dice que los eventos \(𝑬_𝟏\) y \(𝑬_𝟐\) son mutuamente excluyentes o disjuntos si no tienen resultados en común.

\[𝑬_𝟏\bigcap𝑬_𝟐=\emptyset\]


Eventos como subconjuntos

Sean \(𝑬_𝟏\) y \(𝑬_𝟐\) dos eventos que se encuentran en un espacio muestral \(𝑺\).

Si cualquier resultado de \(𝑬_𝟏\) también es resultados de \(𝑬_𝟐\) se dice que \(𝑬_𝟏\) está contenido en \(𝑬_𝟐\).

\[𝑬_𝟏\subset 𝑬_𝟐\]


Eventos complementarios

Sean \(𝑬\) un evento del espacio muestral \(𝑺\).

El complemento de un evento \(𝑬\) con respecto al espacio muestral \(𝑺\), es aquel que contiene todos los resultados de \(𝑺\) que no se encuentran en \(𝑬\).

Se denota por \(\overline{\text{E}}\)


Desarrollo axiomático de la probabilidad

Sea \(𝑺\) un espacio muestral y \(𝑬\) un evento cualquiera. Se llamará función de probabilidad \(𝑷(𝑬)\) sobre el espacio muestral \(𝑺\) si satisface los siguientes axiomas:

  • Axioma 1

\[P(E) \geq 0\]

  • Axioma 2

\[P(S) = 1\]

  • Axioma 3: Si para los eventos \(E_{1}\), \(E_{2}\), \(E_{3}\), \(\cdots\)

\[E_{i} \bigcap E_{j} = \emptyset \quad \text{para toda} \quad i\neq j\]

\[\begin{equation} P(E_{1} \bigcup E_{2} \bigcup \cdots) = P(E_{1}) + P(E_{2}) + \cdots \end{equation}\]


\(P(\emptyset)=0\)

Si para cualquier evento \(E \subset S\), \[0 \leq P(E) \leq 1\]

Sea \(S\) un espacio muestral que contiene a cualesquiera dos eventos \(A\) y \(B\), entonces: \[P\left(A \bigcup B\right) = P(A) + P(B) - P\left(A \bigcap B\right)\]


Probabilidad Conjunta y Marginal

Tabla 1
Mujer (M) Hombre(H) Totales
Adminstración (A) 20 30 50
Operación de planta (O) 60 140 200
Ventas (V) 100 50 150
Totales 180 220 400
M H
A \(P(A\cap M)\) \(P(A\cap H)\) \(P(A)\)
O \(P(O\cap M)\) \(P(O\cap H)\) \(P(O)\)
V \(P(V\cap M)\) \(P(V\cap H)\) \(P(V)\)
\(P(M)\) \(P(H)\) \(P(S)\)

Probabilidad conjunta

La probabilidad conjunta es la probabilidad de la ocurrencia simultánea de dos eventos. \[P(A_{i} \cap B_{j}) = \frac{n_{ij}}{n}\]

\(B_1\) \(B_2\)
\(A_1\) \(n_{11}\) \(n_{12}\)
\(A_2\) \(n_{21}\) \(n_{22}\)

\[\sum_{j} \sum_{i} n_{ij} = n\]

Probabilidad Marginal

Si el interés recae en determinar la probabilidad de \(A_{i}\) sin considerar el evento \(B_{j}\) \[P(A_{i}) = \frac{\sum_{j} n_{ij}}{n}\]

\(B_1\) \(B_2\)
\(A_1\) \(n_{11}\) \(n_{12}\)
\(A_2\) \(n_{21}\) \(n_{22}\)

\[\sum_{j} \sum_{i} n_{ij} = n\]


Probabilidad Condicional

Tabla 1
Mujer (M) Hombre(H) Totales
Adminstración (A) 20 30 50
Operación de planta (O) 60 140 200
Ventas (V) 100 50 150
Totales 180 220 400

¿Cuál es la probabilidad que un empleado sea Mujer si trabaja en la división de ventas?

M H
A \(P(A\cap M)\) \(P(A\cap H)\) \(P(A)\)
O \(P(O\cap M)\) \(P(O\cap H)\) \(P(O)\)
V \(P(V\cap M)\) \(P(V\cap H)\) \(P(V)\)
\(P(M)\) \(P(H)\) \(P(S)\)

\[\begin{equation} P(M/V) = \frac{P(V \cap M)}{P(V)} \end{equation}\]

Definición. Sean \(𝑨\) y \(𝑩\) dos eventos que se encuentran en un espacio muestral \(𝑺\) de manera tal que \(𝑷(𝑩)>𝟎\). La probabilidad condicional de \(𝑨\) al ocurrir el evento \(𝑩\), es el cociente de la probabilidad conjunta de \(𝑨\) y \(𝑩\) con respecto a la probabilidad marginal de \(𝑩\). De esta manera se tiene:

\[\begin{equation} P(A/B) = \frac{P(A \cap B)}{P(B)}, \quad P(B)>0 \end{equation}\]

Regla de multiplicación

Si se escribe la fórmula de probabilidad condicional como producto da como resultado la regla de multiplicación de probabilidades.

\[\begin{equation} P(A/B) = \frac{P(A \cap B)}{P(B)} \quad \Longrightarrow \quad P(A \cap B) = P(B) P(A/B) \end{equation}\]


Eventos estadísticamente independientes

Definición. Los eventos \(𝑨_𝟏\),\(𝑨_𝟐\),\(\cdots\), \(𝑨_𝒌\) de un espacio muestral \(𝑺\) son estadísticamente independientes si y solo si la probabilidad conjunta de cualquier \(2\), \(3\), \(\cdots\), \(k\), de ellos es igual al producto de sus respectivas probabilidades marginales.

\[\begin{equation} P(A_1 \cap A_2 \cap \cdots A_k)=P(A_1)P(A_2) \cdots P(A_{k}) \end{equation}\]


Probabilidad Total

\[\sum_{i=1}^{n} P(B_{i}) = 1\]

Si existen \(𝒏\) eventos mutuamente excluyentes \(𝑩_𝟏\), \(𝑩_𝟐\), \(\cdots\), \(𝑩_𝒏\) de un espacio muestral 𝑺. La probabilidad total de un evento \(𝑨\), está dada por:

\[\begin{equation} P(A) = \sum_{i=1}^{n} P(B_i) P(A/B_i) \end{equation}\]


Teorema de Bayes

\[P(B_j /A) \text{?}\]

\[P(B_j / A) = \frac{P(B_j \cap A)}{P(A)}\]


Ejercicios

1- Demuéstrese que para dos eventos cualesquiera \(A\) y \(B\), \(P(A/B) + P(\overline{\text{A}} /B) = 1\) con tal que \(P(B) \neq 0\)

2- Demuestre el teorema de probabilidad Total

3- Demuestre el teorema de Bayes

4- Un sistema contiene cinco componentes que se encuentran conectadas entre si como se muestra en la figura, donde las probabilidades indican la seguridad de que la componente funcione adecuadamente. Si se supone que el funcionamiento de una componente en particular es independiente del de las demás, ¿Cuál es la probabilidad de que el sistema trabaje?

5- Sean \(A\) y \(B\) dos eventos cualesquiera de \(S\). Si \(A\) y \(B\) son mutuamente excluyentes, muéstrese que no pueden ser independientes. Dedúzcase cuándo dos eventos independientes son, mutuamente excluyentes.

6- Una familia tiene tres hijos. Determinar todas las posible permutaciones, con respecto al sexo de los hijos. Bajo suposiciones adecuadas, ¿Cuál es la probabilidad de que, exactamente, dos de los hijos tengan el mismo sexo?, ¿Cuál es la probabilidad de tener un varón y dos mujeres?, ¿Cuál es la probabilidad de tener tres hijos del mismo sexo?

7- Se lanza una moneda diez veces y en todos los lanzamientos el resultado es cara. ¿Cuál es la probabilidad de este evento?, ¿Cuál es la probabilidad de que en el decimoprimero lanzamiento el resultado sea cruz?

8- Se lanza una moneda con una probabilidad de \(\displaystyle{\frac{2}{3}}\) que el resultado sea cara. Si aparece una cara, se extrae una pelota, aleatoriamente, de una urna que contiene dos pelotas rojas y tres verdes. Si el resultado es cruz se extrae una pelota, de otra urna, que contiene dos rojas y dos verdes. ¿Cuál es la probabilidad de extraer una pelota roja?

9- La probabilidad de que cierto componente eléctrico funcione es de 0.9. un aparato contiene dos de éstos componentes. El aparato funcionará mientras lo haga, por lo menos, uno de los componentes.

a- Sin importar cuál de los dos componentes funcione o no ¿Cuáles son los posibles resultados y sus respectivas probabilidades? (Puede suponerse independencia en la operación entre los componentes)

b- ¿Cuál es la probabilidad de que el aparato funcione?

10- Durante los últimos año se ha escrito sobre la posible relación entre fumar y el cáncer pulmonar. Supóngase que en un centro médico, de todos los fumadores de quienes se sospecha que tenían cáncer pulmonar, el \(90\%\) lo tenía mientras que únicamente el \(5\%\) de los no fumadores lo padecía. Si la proporción de fumadores es de 0.45, ¿Cuál es la probabilidad de que un paciente con cáncer pulmonar, seleccionado al azar, sea fumador?

11- El \(5\%\) de las unidades producidas en una fábrica se encuentran defectuosas cuando el proceso de fabricación se encuentra bajo control. Si el proceso se encuentra fuera de control, se produce una 30% de unidades defectuosas. La probabilidad marginal de que el proceso se encuentre bajo control es de 0.92. Si se escoge aleatoriamente una unidad y se encuentra que es defectuosa, ¿Cuál es la probabilidad de que el proceso se encuentre bajo control?


Capítulo 6

Ejercicios Resueltos

Ejercicio 5

Sean \(A\) y \(B\) dos eventos cualesquiera de \(S\). Si \(A\) y \(B\) son mutuamente excluyentes, muéstrese que no pueden ser independientes. Dedúzcase cuándo dos eventos independientes son, mutuamente excluyentes.

Solución

Si \(A\) y \(B\) son mutuamente excluyentes, es decir \(𝑨\cap𝑩= \emptyset\) , entonces \[P(A\cap B)=P(\emptyset)=0\]

Para que \(A\) y \(B\) sean independientes se debe cumplir \[P(A)𝑷(B)= P(A\cap B)=0\]

Esto solo puede ocurrir en el caso que

\[P(A)=0 \vee P(B)=0\]

\[A =\emptyset \vee B=\emptyset\]

Ejercicio 6

Una familia tiene tres hijos. Determinar todas las posible permutaciones, con respecto al sexo de los hijos. Bajo suposiciones adecuadas, ¿Cuál es la probabilidad de que, exactamente, dos de los hijos tengan el mismo sexo?, ¿Cuál es la probabilidad de tener un varón y dos mujeres?, ¿Cuál es la probabilidad de tener tres hijos del mismo sexo?

Todas las posibles permutaciones son:

\[S=\{VVV, VVM, VMV, VMM, MVV, MVM, MMV, MMM\}\]

Probabilidad de que exactamente dos tengan el mismo sexo

\(P(\text{2 del mismo sexo}) = \left(\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{1}{2}\right)+ \left(\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{1}{2}\right)+ \left(\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{1}{2}\right)\)

\(\Longrightarrow + \left(\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{1}{2}\right)+ \left(\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{1}{2}\right) + \left(\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{1}{2}\right) = \frac{3}{4}\)

\(P(\text{2 del mismo sexo}) = \displaystyle{\frac{3}{4} = 0,75}\)

\(P(\text{1 varón y 2 mujeres})= \displaystyle{\left(\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{1}{2}\right)+ \left(\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{1}{2}\right) + \left(\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{1}{2}\right) = \frac{3}{8}}\)

\(P(\text{1 varón y 2 mujeres})= \displaystyle{\frac{3}{8} = 0,375}\)

\(P(\text{3 hijos del mismo sexo}) = \displaystyle{\left(\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{1}{2}\right)+ \left(\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{1}{2}\right) = \frac{1}{4}}\)

\(P(\text{3 hijos del mismo sexo}) = \displaystyle{\frac{1}{4} = 0,25}\)


Ejercicio 9

La probabilidad de que cierto componente eléctrico funcione es de 0.9. un aparato contiene dos de éstos componentes. El aparato funcionará mientras lo haga, por lo menos, uno de los componentes.

a- Sin importar cuál de los dos componentes funcione o no ¿Cuáles son los posibles resultados y sus respectivas probabilidades? (Puede suponerse independencia en la operación entre los componentes)

b- ¿Cuál es la probabilidad de que el aparato funcione?

Posibles resultados y probabilidades

  • \(\displaystyle{P(A_{1} \cap A_{2}) = P(A_1) \cdot P(A_2)}\)

  • \(\displaystyle{P(A_{1}' \cap A_{2}) = P(A_{1}') \cdot P(A_{2})}\)

  • \(\displaystyle{P(A_{1} \cap A_{2}') = P(A_{1}) \cdot P(A_{2}')}\)

  • \(\displaystyle{P(A_{1}' \cap A_{2}') = P(A_{1}') \cdot P(A_{2}')}\)

Probabilidad de que el sistema funcione

\[\displaystyle{P(A_{1} \cup A_{2}) = P(A_1) + P(A_2) - P(A_1 \cap A_2)}\]


Ejercicio 11

El \(5\%\) de las unidades producidas en una fábrica se encuentran defectuosas cuando el proceso de fabricación se encuentra bajo control. Si el proceso se encuentra fuera de control, se produce una \(30\%\) de unidades defectuosas. La probabilidad marginal de que el proceso se encuentre bajo control es de 0.92. Si se escoge aleatoriamente una unidad y se encuentra que es defectuosa, ¿Cuál es la probabilidad de que el proceso se encuentre bajo control?


Capítulo 7


Variables aleatorias

  • Concepto y clasificación
  • Distribución de Probabilidad

Distribuciones de probabilidad

  • Distribución discreta
  • Distribución continua

Valor esperado

  • Media de variable aleatoria
  • Varianza de variable aleatoria

Concepto de variable aleatoria

Definición. Sea \(S\) un espacio muestral sobre el que se encuentra definida un función de probabilidad. Sea \(X\) una función de valor real definida sobre \(S\), de manera que transforme los resultados de \(S\) sobre la recta de los reales. Entonces se dice que \(X\) es una variable aleatoria.

Tipos de variable

Discreta

Si el número de valores que puede tomar es contable (finito o infinito) y si pueden arreglarse a una secuencia de valores enteros.

Ejemplo: \(X = \{0,1,2, \cdots \}\)

Continua

Si sus valores consisten en uno o más intervalos de la recta de los reales

Ejemplo: \(X=\{0 < x < a\}\)


Distribución de Probabilidad

Al considerar los valores de una variable aleatoria es posible desarrollar una función matemática que asigne una probabilidad a cada realización \(x\) de la variable aleatoria \(X\). Esta función recibe el nombre de función de probabilidad de la variable aleatoria \(X\).


Distribución discreta de probabilidad

Definición. Sea \(X\) una variable aleatoria discreta. Se llamará \(p(x)=P(X=x)\) función de probabilidad de la variable aleatoria \(X\). Si satisface las siguientes propiedades:

  1. \(p(x) \geq 0\) para todos los \(X\).

  2. \(\displaystyle{\sum_{x} p(x) = 1}\)


Ejercicios

  1. Sea \(X\) una variable aleatoria que representa el número de llamadas telefónicas que recibe un conmutador en un intervalo de cinco minutos y cuya función de probabilidad está dada por \(p(x) = e^{-x}(3)^x\)!, \(x= 0,1,2,\cdots\)

a- Determinar las probabilidades de que \(X\) sea igual a \(0,1,2,3,4,5,6\) y \(7\).

b- Graficar la función de probabilidad para estos valores de \(X\).


Distribución discreta de probabilidad

Definición. La función de distribución acumulativa de la variable aleatoria \(X\) es la probabilidad que \(X\) sea menor o igual a un valor específico de \(x\) y está dada por:

\[\begin{equation} F(x) = P(X \leq x) = \sum_{x_{i} \leq x} p(x_{i}) \end{equation}\]


\(F(x)\) de una variable aleatoria discreta es una función no decreciente de los valores de \(X\), de tal manera que:

  1. \(0 \leq F(x) \leq 1\) para cualquier \(x\).

  2. \(F(x_{i}) \geq F(x_{j})\) para todo \(x_{i} \geq x_{j}\)

  3. \(P(X >x) = 1-F(x)\)

  4. \(P(X=x) = F(x) - F(x-1)\)

  5. \(P(x_{i} \leq X \leq x_{j}) = F(x_{j} - F(x_{i} -1)\)


  1. Sea \(X\) una variable aleatoria que representa el número de llamadas telefónicas que recibe un conmutador en un intervalo de cinco minutos y cuya función de probabilidad está dada por \(p(x) = e^{-x}(3)^x\)!, \(x= 0,1,2,\cdots\)

a- Determinar las probabilidades de que \(X\) sea igual a \(0,1,2,3,4,5,6\) y \(7\).

b- Graficar la función de probabilidad para estos valores de \(X\).

c- Determinar la función de distribución acumulativa para estos valores de \(X\).

d- Graficar la función de distribución acumulativa.


Distribución continua de probabilidad

Definición. Si para cualesquiera a y b, existe una función \(f(x)\) tal que:

  1. \(f(x) \geq 0\) para \(- \infty \leq x \leq \infty\)

  2. \(\displaystyle{\int_{-\infty}^{\infty} f(x) dx = 1}\)

  3. \(P(a\leq x \leq b) = \displaystyle{\int_{a}^{b} f(x) dx}\)

Entonces \(f(x)\) es la función densidad de probabilidad de la variable aleatoria continua \(X\).


  1. Sea \(X\) una variable aleatoria continua.

a- Determinar el valor de \(k\), de manera tal que la función.

\[f(x) = \left\{\begin{matrix} kx^2 & -1\leq x \leq 1 \\ 0 & \text{para cualquier otro valor} \end{matrix}\right.\]

sea la función de densidad de probabilidad de \(X\).


Definición

Definición. La función de distribución acumulativa de una variable aleatoria continua \(X\) es la probabilidad que \(X\) tome un valor menor o igual que un \(x\).

\[\begin{equation} P(X\leq x) = F(x) = \int_{-\infty}^{x} f(t) dt \end{equation}\]

Donde \(t\) es una variable artificial de integración.


\(F(x)\) es una función lisa no decreciente de los valores de la variable aleatoria con las siguientes propiedades:

  1. \(F(-\infty) = 0\)

  2. \(F(\infty) = 1\)

  3. \(P(a<x<b)=F(𝑏)-F(a)\)

  4. \(\displaystyle{\frac{dF(x)}{dx} = f(x)}\)


  1. Sea \(X\) una variable aleatoria continua.

a- Determinar el valor de \(k\), de manera tal que la función.

\[f(x) = \left\{\begin{matrix} kx^2 & -1\leq x \leq 1 \\ 0 & \text{para cualquier otro valor} \end{matrix}\right.\]

sea la función de densidad de probabilidad de \(X\).

b- Determinar la función de distribución acumulativa de \(x\) y graficar \(F(x)\).

c- Calcular \(\displaystyle{P(x \geq \frac{1}{2})}\) y \(\displaystyle{-\frac{1}{2} \leq x \leq \frac{1}{2}}\)


  1. Sea \(X\) una variable aleatoria discreta. Determinar el valor de \(k\) para que la función \(\displaystyle{p(x) = \frac{k}{x}}\) para \(x= 1, 2,3,4,\) sea la función de probabilidad de \(X\). Determinar \(P(1\leq X \leq 3)\)

  1. Sea \(X\) una variable aleatoria continua.

a- Determinar el valor de \(k\) para que la función.

\[f(x) = \left\{\begin{matrix} k exp^{-x/5} & x>o \\ 0 & \text{para cualquier otro valor} \end{matrix}\right.\]

b- Graficar \(f(x)\)

c- Calcular \(P(X\leq 5)\) y \(P(0 \leq x \leq 8)\).

d- Determinar \(F(x)\) y graficarla.

  1. La duración en horas de un componente electrónico, es una variable aleatoria cuya función de distribución acumulativa es \(F(x) = 1 - exp(-x/100)\), \(x>0\).

a- Determinar la función de probabilidad de \(X\).

b- Determinar la probabilidad de que el componente trabaje más de 200 horas


Capítulo 8


Valor esperado de una variable aleatoria

El valor esperado de una variable aleatoria \(X\) (o media de la variable aleatoria \(X\)) y está dado por:

\[\begin{equation} E(X) = \sum_{x} xp(x) \quad \longrightarrow \quad \text{si X es una variable discreta} \end{equation}\]

\[\begin{equation} E(X) = \int_{-\infty}^{\infty} xf(x) dx \quad \longrightarrow \quad \text{si X es una variable continua} \end{equation}\]

en donde \(p(x)\) y \(f(x)\) son la función de probabilidad y densidad de probabilidad, respectivamente


Ejemplo con una variable aleatoria discreta

Sea \(X\) una variable aleatoria que representa el número de clientes que llega a una tienda en un periodo de una hora. Dada la siguiente información.

x 0 1 2 3 4 5 6 7 8
p(x) 0.05 0.10 0.10 0.10 0.20 0.25 0.10 0.05 0.05

\(\displaystyle{E(X) = \sum_{x} xp(x) }\)

x<-c(0,1,2,3,4,5,6,7,8)
prob.x<-c(0.05,0.10,0.10,0.10,0.20,0.25,0.10,0.05,0.05)
v.e<-sum(x*prob.x)
v.e
## [1] 4

\(E(X) = 4\)

Ejemplo con una variable aleatoria continua

La función de densidad de probabilidad de una variable aleatoria \(X\) está dada por:

\[f(x) = \left\{\begin{matrix} 2(1-x) & 0<x<1 \\ 0 & \text{para cualquier otro valor} \end{matrix}\right.\]

\(\displaystyle{E(x) = \int_{-\infty}^{\infty} xf(x) dx}\)

\(\displaystyle{E(x) = \int_{-\infty}^{\infty} x\cdot (1-x) dx}\)

\(\displaystyle{E(x) = 2 \int_{0}^{1} \left[\frac{x^2}{2} - \frac{x^3}{3}\right]_{0}^{1}}\)

\(\displaystyle{E(x) = 2 \cdot \left(\frac{1}{2} - \frac{1}{3}\right) = \frac{1}{3}}\)

\(\displaystyle{E(x) = \frac{1}{3}}\)


Aplicación en Rstudio

integrate(function(x) 2*(1-x)*x,0,1)
## 0.3333333 with absolute error < 3.7e-15

Valor esperado de una función de variable aleatoria

En general el valor esperado de la función \(g(x)\) de una variable aleatoria \(X\) está dado por:

\[\begin{equation} E\left[g(x)\right] = \sum_{x} g(x)\cdot p(x) \quad \longrightarrow \quad \text{si X es una variable discreta} \end{equation}\]

\[\begin{equation} E\left[g(x)\right] = \int_{-\infty}^{\infty} g(x)\cdot f(x) dx \quad \longrightarrow \quad \text{si X es una variable continua} \end{equation}\]

en donde \(p(x)\) y \(f(x)\) son la función de probabilidad y densidad de probabilidad de \(X\), respectivamente.


Propiedades del valor esperado

  1. \(E(c)=c\) donde \(c\) es una constante

  2. \(E(aX + b)= aE(X)+b\) donde \(a\) y \(b\) son constantes

  3. \(E[g(X)+h(X)]=E[g(X)]+E[h(X)]\) donde \(g(X)\) y \(h(X)\) son funciones de la variable aleatoria \(X\).


Varianza de una variable aleatoria

\[\begin{equation} V(X)= E(X -\mu)^2 \end{equation}\]

\[\begin{equation} V(X) = \sum_{x} (x - \mu)^2 p(x) \quad \longrightarrow \quad \text{si X es una variable discreta} \end{equation}\]

\[\begin{equation} V(X) = \int_{-\infty}^{\infty} (x- \mu)^2 f(x) dx \quad \longrightarrow \quad \text{si X es una variable continua} \end{equation}\]


Propiedad del valor esperado

\(V(X) = E(X - \mu)^2= E(X^2-2X\mu +\mu ^2) = E(X^2) -2\mu E(X) + E(\mu ^2)\)

\(V(X) = E(X^2) - 2\mu \cdot \mu + \mu ^2 = E(X^2) - \mu ^2\)


Ejemplo con variable aleatoria discreta

Sea \(X\) una variable aleatoria que representa el número de clientes que llega a una tienda en un periodo de una hora. Dada la siguiente información.

x 0 1 2 3 4 5 6 7 8
p(x) 0.05 0.10 0.10 0.10 0.20 0.25 0.10 0.05 0.05

\(V(X) = E(X^2) - \mu ^2\)

\(E(x) = \mu = 4\)

Calculo de \(E(X^2)\)

x<-c(0,1,2,3,4,5,6,7,8)
prob.x<-c(0.05,0.10,0.10,0.10,0.20,0.25,0.10,0.05,0.05)
EX2<-sum((x^2)*prob.x)
EX2
## [1] 20.1

Por lo tanto \(E(X^2) = 20.1\)

Luego:

var <- sum((x - v.e) ^ 2 * prob.x)
var
## [1] 4.1

o también podríamos calcularlo de la siguiente forma:

var <- EX2-(v.e)^2
var
## [1] 4.1

que es lo mismo a decir:

\[V(X) = 20.1 - 4^2 = 4.1\]


Resumen

Para calcular la probabilidad acumulada tendríamos que aplicar el siguiente calculo:

prob.acum.x <- c(sum(prob.x[1]), sum(prob.x[1:2]), sum(prob.x[1:3]),
                 sum(prob.x[1:4]), sum(prob.x[1:5]), sum(prob.x[1:6]),
                 sum(prob.x[1:7]), sum(prob.x[1:8]), sum(prob.x[1:9]))

Veamos en nuestro resumen de la tabla:

tabla <- data.frame(1:9, x, prob.x, prob.acum.x, x * prob.x, (x - v.e) ^ 2, (x - v.e) ^ 2 * prob.x)

colnames(tabla) <- c("i","x", "prob.x", "prob.acum.x", "x.prob.x", "x-v.e^2", "x-v.e^2prob.x")
knitr::kable(tabla)
i x prob.x prob.acum.x x.prob.x x-v.e^2 x-v.e^2prob.x
1 0 0.05 0.05 0.00 16 0.80
2 1 0.10 0.15 0.10 9 0.90
3 2 0.10 0.25 0.20 4 0.40
4 3 0.10 0.35 0.30 1 0.10
5 4 0.20 0.55 0.80 0 0.00
6 5 0.25 0.80 1.25 1 0.25
7 6 0.10 0.90 0.60 4 0.40
8 7 0.05 0.95 0.35 9 0.45
9 8 0.05 1.00 0.40 16 0.80

Para visualizar la gráfica de barra de la variable aleatoria x con respecto a su probabilidad

Escribimos en Rstudio la función barplot

barplot(height = tabla$prob.x, names.arg = tabla$x, col="#b00b69" )


Si queremos Visualizar la gráfica de la probabilidad acumulada F(x)

plot(x,prob.acum.x, type = 'b',col="#8d349b")


Ejemplo con variable aleatoria continua

La función de densidad de probabilidad de una variable aleatoria \(X\) está dada por:

\[f(x) = \left\{\begin{matrix} 2(1-x) & 0<x<1 \\ 0 & \text{para cualquier otro valor} \end{matrix}\right.\]

\(V(X) = E(X^2) - \mu ^2\)

\(\displaystyle{E(x) = \int_{-\infty}^{\infty} xf(x) dx}\)

\(\displaystyle{E(X^2) = \int_{-\infty}^{\infty} x^2\cdot [2\cdot (1-x)] dx}\)

\(\displaystyle{E(X^2) = 2 \cdot \int_{0}^{1} (x^2-x^3)dx}\)

\(\displaystyle{E(X^2) = 2 \int_{0}^{1} \left[\frac{x^3}{3} - \frac{x^4}{4}\right]_{0}^{1}}\)

\(\displaystyle{E(X^2) = 2 \cdot \left(\frac{1}{3} - \frac{1}{4}\right) = \frac{1}{6}}\)

\(E(X) = \mu = \displaystyle{\frac{1}{3}}\)

\(\displaystyle{V(X) = E(X^2) - \mu ^2 =\frac{1}{6} - \left(\frac{1}{3}\right)^2 = \frac{1}{18}}\)


Aplicación en Rstudio

integrate(function(x) 2*(1-x)*x^2,0,1)
## 0.1666667 with absolute error < 1.9e-15

Resumen

table <- data.frame(1,1/3,1/6, 1/6-(1/3)^2)
colnames(table) <- c("i","E(X)", "E(X2)", "V(X)")
knitr::kable(table)
i E(X) E(X2) V(X)
1 0.3333333 0.1666667 0.0555556

Ejercicios

  1. Supóngase que la duración en minutos de una llamada de negocios, es una variable aleatoria cuya función de densidad de probabilidad está determinada.

\[f(x) = \left\{\begin{matrix} \frac{1}{4}exp(-x/4) & x>0, \\ 0 & \text{para cualquier otro valor} \end{matrix}\right.\]

Determinar:

  1. \(E(X)\)

  2. \(Var(X)\)


  1. Sea \(X\) una variable aleatoria con media \(\mu\) y varianza \(\sigma ^2\).
  1. Evaluar \(E(X-c)^2\) en términos de \(\mu\) y \(\sigma ^2\) en donde \(c\) es una constante.

  2. ¿Para qué valor de \(c\) es \(E(X-c)^2\) mínimo?


Capítulo 9


Distribuciones de Probabilidad

  1. Distribuciones discretas
    • Distribución Binomial
    • Distribución Hipergeométrica
    • Distribución de Poisson
Distribución Función en R
Binomial binom
Poisson pois
Geométrica geom
Hipergeométrica hyper
  1. Distribuciones Continuas
    • Distribución uniforme
    • Distribución Normal
Distribución Función en R
Uniforme unif
Normal norm
t-Student t
Chi-cuadrado chisq

Distribución Binomial

Supóngase un experimento donde los resultados posibles son: la ocurrencia (éxito) o no ocurrencia (fracaso) de un evento. Sea \(p\) la probabilidad de éxito cada vez que el experimento se lleva a cabo. El experimento se realiza \(𝒏\) veces, y cada uno es independiente a los demás. Sea \(X\) la variable aleatoria que representa el número de éxitos en \(𝒏\) ensayos.

Definición. Sea \(X\) una variable aleatoria que representa el número de éxitos en \(n\) ensayos y \(p\) la probabilidad de éxito con cualquiera de éstos. Se dice entonces que \(X\) tiene una distribución binomial con función de probabilidad:

\[\begin{equation} P(X=x)= \left\{\begin{matrix} \frac{n!}{(n-x)!x!}p^x (1-p)^x & x=0,1,2,3,\cdots, n\\ 0 & \text{para cualquier otro valor} \end{matrix}\right. \end{equation}\]

Tengamos en cuenta que \(\displaystyle{nCx = \frac{n!}{(n-x)!x!}}\)

Además se demostrar que \(E(x) = n\cdot p\) y \(V(x) = n\cdot p \cdot (1-p)\)


Ejericicios

1- Todos los días se seleccionan, de manera aleatoria, 15 unidades de un proceso de manufactura con el propósito de verificar el porcentaje de unidades defectuosas en la producción. Con base en información pasada, la probabilidad de tener una unidad defectuosa es de 0.05. La gerencia ha decidido detener la producción cada vez que una muestra de 15 unidades tenga dos o más defectuosas. ¿Cuál es la probabilidad de que, en cualquier día, la producción se detenga?

2- Sea \(X\) una variable aleatoria distribuida binomialmente con \(n = 10\) y \(p = 0.5\)

a- Determinar las probabilidades de que $X$ se encuentre dentro de una desviación estándar de la media y a dos desviaciones estándares de la media.

3- En una fábrica de circuitos electrónicos, se afirma que la proporción de unidades defectuosas de cierto componente que ésta produce, es del \(5\%\). Un buen comprador de estos componentes revisa 15 unidades seleccionadas al azar y encuentra cuatro defectuosas. Si la compañia se encuentra en locorrecto y prevalecen las supociones para que la distribución binomial sea el modelo de probabilidad adecuado para esta situación. ¿Cuál es la probabilidad de este hecho?. Con base en el resultado anterior ¿Puede concluirse que la compañia está equivocada?


Distribución Hipergeométrica

Definición. Sea \(N\) el número total de objetos en una población finita, de manera tal que \(k\) de éstos es de un tipo y \(N-k\) de otros. Si se selecciona un muestra aleatoria “sin reemplazo” constituida por 𝒏 objetos. La probabilidad de que 𝒙 sea de un tipo exactamente y \(n-x\) sea del otro está dada por la función:

\[\begin{equation} P(X=x) = \left\{\begin{matrix} \frac{\binom{k}{x} \binom{N-k}{n-x}}{\binom{N}{n}} & x=0,1,2,\cdots, n\\ 0 & \text{para cualquier otro valor} \end{matrix}\right. \end{equation}\]

  • Donde \(\displaystyle{kCx = \binom{k}{x}}\).

  • Además se puede demostrar que \(\displaystyle{E(X)= \frac{nk}{N}}\) y \(\displaystyle{V(X) = np(1-p)\frac{(N-n)}{N-1}}\)


Ejercicios

1- Considérese un fabricante de automóviles que compra los motores a una compañia donde se fabrican bajo estrictas especificaciones. El fabricante recibe un lote de 40 motores. Su plan para aceptar el lote consiste en seleccionar ocho, de manera aleatoria, y someterlos a prueba. Si encuentra que ninguno de los motores presenta serios defectos, el fabricante acepta el lote; de otra forma lo rechaza. Si el lote contiene dos motores con serios defectos, ¿Cuál es la probabilidad de que sea aceptado?

2- El Departamento de Protección del Ambiente ha adquirido 40 instrumentos de precisión para medir la contaminación del aire en distintas localidades. Se seleccionan aleatoriamente ocho instrumentos y se someten a una prueba para encontrar defectos. Si cuatro de los 40 instrumentos se encuentran defectuosos, ¿Cuál es la probabilidad de que la muestra contenga no más de un instrumento defectuoso?


Distribución de Poisson

Definición. Sea \(X\) una variable aleatoria que representa el número de eventos aleatorios independientes que ocurren a una rapidez constante sobre el tiempo o el espacio. Se dice entonces que la variable aleatoria \(X\) tiene una distribución de Poisson con función de probabilidad.

\[\begin{equation} P(X=x) = \left\{\begin{matrix} \frac{e^{-\lambda} \lambda^x}{x!} & x=0,1,2,\cdots\\ 0 & \text{para cualquier otro valor} \end{matrix}\right. \end{equation}\]

  • Además se puede demostrar que \(E(X) =\lambda\) y \(V(X) = \lambda\)

Ejercicios

1- Después de una prueba de laboratorio muy rigurosa con cierto componente eléctrico, el fabricante determina que en promedio, sólo fallarán dos componentes antes de tener 1000 horas de operación. Un comprador observa que son cinco los que fallan antes de las 1000 horas. Si el número de componentes que fallan es una variable aleatoria de Poisson, ¿existe suficiente evidencia para dudar de la conclusión del fabricante?

2- Para un volumen fijo, el número de células sanguíneas rojas es una variable aleatoria que se presenta con una frecuencia constante. Si el número promedio para un volumn dado es de nueve células para personas normales, determinar la probabilidad de que el número de célular rojas para una persona se encuentra dentro de una desviación estándar del valor promedio y a dos desviaciones estándar del promedio


Distribución Uniforme

Definición. Se dice que una variable aleatoria \(X\) está distribuida uniformemente sobre el intervalo \((a,b)\) si su función de densidad de probabilidad está dada por:

\[\begin{equation} f(x) = \left\{\begin{matrix} \frac{1}{b-a} & a \leq x \leq b \\ 0 & \text{para cualquier otro valor} \end{matrix}\right. \end{equation}\]

La media de la distribución uniforme

\[\displaystyle{E(X) = \mu =\frac{a+b}{2}}\]

La varianza de la distribución uniforme

\[\sigma^2 = \displaystyle{\frac{(b-a)^2}{12}}\]


Ejercicios

1. Sea \(X\) una variable aleatoria con distribución uniforme sobre el intervalo \((a,b)\). Si \(E(X) = 10\) y \(Var(X)=12\), encontrar los valores de \(a\) y de \(b\).

2. Supóngase la concentración de cierto contaminante se encuentra distribuida de una manera uniforme en elintervalo de 4 a 20 ppm (partes por millón). Si se considera como tóxica una concentración de 15 ppm o más, ¿cuál es la probabilidad de que al tomarse una muestra la concentración de ésta sea tóxica?


Distribución Normal \(N(\mu, \sigma ^2)\)

Definición. Se dice que una variable aleatoria \(X\) está distribuida normalmente si su función de densidad de probabilidad está dada por:

\[\begin{equation} f(x) = \left\{\begin{matrix} \frac{1}{\sqrt{2\pi} \sigma} e^{\frac{1}{2}\left(\frac{x - \mu}{\sigma} \right )^2} & -\infty \leq x \leq \infty \\ 0& \text{para cualquier otro valor} \end{matrix}\right. \end{equation}\]

  • Además se puede demostrar que \(E(X) = \mu\) y \(V(X) = \sigma ^2\)

  • \(\mu\) es la media de la distribución

  • \(\sigma\) es la desviación estándar \((\sigma > 0)\)

  • Para estandarizar la distribución Normal consiste en transformar la variable \(N(\mu, \sigma)\) en \(N(0,1)\), es decir:

\[Z = \frac{X- \mu}{\sigma} \sim N(0,1)\]


Ejemplos resueltos

1- Dada una distribución normal estándar, calcule el área bajo la curva que se localiza

a- A la derecha de \(z =1.84\)

1-pnorm(1.84)
## [1] 0.03288412

b- entre \(z = –1.97\) y \(z =0.86.\)

pnorm(0.86)-pnorm(-1.97)
## [1] 0.7806863

Ejercicios

1- Sea \(X \sim N(200,20)\). Determinar las siguientes probabilidades.

  1. \(P (185<X<210)\)
pnorm(210,mean = 200,sd=20,lower.tail = TRUE)-pnorm(185,mean = 200,sd=20,lower.tail = TRUE)
## [1] 0.4648351

Salida gráfica

La función dnorm nos ayudará a construir el gráfico de la distribución de probabilidad de \(X\) con la ayuda del comando curve

  1. \(P(215 < X<250)\)

  2. \(P(X>240)\)

pnorm(240,mean = 200,sd=20,lower.tail = TRUE)
## [1] 0.9772499
  1. \(P(X>178)\)

2- Una universidad espera recibir, para el siguiente año escolar, 16000 solicitudes de ingreso al primer año de licenciatura. Se supone que las calificaciones obtenidas por los aspirantes en prueba SAT se pueden calcular, de manera adecuada, por una distribución normal con media 950 y desviación estándar 100. Si la universidad decide admitir al \(25\%\) de todos los aspirantes que obtengan las calificaciones más altas en la prueba SAT, ¿cuál es la mínima calificación que es necesario obtener en esta prueba, para ser admitido por la universidad?


Capítulo 10


Distribuciones de muestreo

Muestreo aleatorio Distribuciones muestrales
Poblaciones y Muestras Distribución muestral de \(\overline{X}\)
Estadísticos Distribución muestral de \(S^2\)

Poblaciones y Muestras

  • Una población consta de la totalidad de las observaciones en las que estamos interesados.

  • Una muestra es un subconjunto de una población.


Muestra aleatoria

Sea \(X_1\), \(X_2\),\(\cdots\), \(X_n\) variables aleatorias independientes \(n\), cada una con la misma distribución de probabilidad \(f(x)\). Definimos \(X_1\), \(X_2\),\(\cdots\), \(X_n\) como una muestra aleatoria de tamaño \(n\) de la población \(f(x)\) y escribimos su distribución de probabilidad conjunta como:

\[\begin{equation} f(x_{1}, x_{2}, \cdots, x_{n}) = f(x_1)f(x_2)\cdots f(x_{n}) \end{equation}\]


Estadísticos

Cualquier función de las variables aleatorias que forman una muestra aleatoria se llama Estadístico.

  1. Media muestral:

\[\begin{equation} \overline{X} = \frac{1}{n} \sum_{i=1}^{n} x_{i} \end{equation}\]

  1. Mediana muestral

\[\begin{equation} \widetilde{X}= \left\{\begin{matrix} x_{\frac{(n+1)}{2}} & \text{si n es impar}\\ \frac{1}{2} \left(x_{\frac{n}{2}} + x_{\frac{n}{2}+1} \right )& \text{si n es par} \end{matrix}\right. \end{equation}\]

  1. La moda muestral es el valor que ocurre con mayor frecuencia en la muestra

  2. La varianza muestral

\[\begin{equation} S^2 = \frac{1}{n-1} \sum_{i=1}^{n} \left(X_{i} - \overline{X} \right)^2 \end{equation}\]

  1. Desviación estándar muestral

\[\begin{equation} S = \sqrt{S^2} \end{equation}\]


Ejercicios

Ejercicio 1

Calcule la media, la mediana y la moda para la muestra cuyas observaciones, 15, 7 ,8, 95, 191,12, 8, 22 y 14 representa el número de días de incapacidad médica reportados en 9 solicitudes de devolución de impuestos. ¿Qué valor parece ser la mejor medida del centro de esos datos? Explique las razones de su preferencia.

Ejercicio 2

  1. Demuestre que la varianza de la muestra permanece sin cambio si a cada valor de la muestra se le suma o se le resta una constante \(c\).

Distribuciones muestrales

La distribución de probabilidad de un estadístico se denomina distribución muestral.

La distribución muestral de un estadístico depende de la distribución de la población, del tamaño de las muestras y del metodo de selección de las muestras.


¿Qué es la distribución muestral de \(\overline{X}\) ?

Se deberían considerar las distribuciones muestrales de \(\overline{X}\) y \(S^2\) como los mecanismos a partir de los cuales se puede hacer inferencias acerca de los parámetros \(\mu\) y \(\sigma ^2\). La distribución muestral de \(\overline{X}\) con tamaño muestral \(n\) es la distribución que resulta cuando un experimento se lleva a cabo una y otra vez (siempre muestra de tamaño \(n\)) y resultan los diversos valores de \(\overline{X}\). Por lo tanto, esta distribución muestral describe la variabilidad de los promedios muestrales alrededor de la media de la población \(\mu\).


Teorema de Límite Central

Teorema de límite central: Si \(\overline{X}\) es la media de una muestra aleatoria de tamaño \(n\), tomada de una población con media \(\mu\) y varianza finita \(\sigma ^2\), entonces la forma de la distribución de

\[\begin{equation} Z = \frac{\overline{X} - \mu}{\sigma/ \sqrt{n}} \end{equation}\]

a medida que \(n \to \infty\), es la distribución estándar \(n(z;0,1).\)


Ejemplo

Una empresa de material eléctrico fabrica bombillas que tienen una duración que se distribuye aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40 horas. Calcule la probabilidad de que una muestra aleatoria de 16 bombillas tenga una vida promedio de menos de 775 horas.

pnorm(775,mean = 800,sd=10,lower.tail = TRUE)
## [1] 0.006209665
curve(dnorm(x, mean = 800, sd = 10), xlim = c(775,840), xlab = "Valores de X", ylab = "Densidad de X", col="blue")


Ejercicios

1- La vida media de una máquina para elaboar pan es de 7 años, con una desviación estándar de 1 año. Suponga que la vida de estas máquinas sigue aproximadamente una distribución normal y calcule.

a- la probabilidad de que la vida media de una muestra aleatoria de 9 máquinas de estas caiga entre 6.4 y 7.2 años: `0.6898`

b- el valor de $x$ a la derecha del cual caería $15\%$ de las medias calculadas de muestras aleatorias de tamaño 9. `7.35`

2- La cantidad de tiempo que le toma al cajero de un banco con servicio en el automóvil atender a un cliente es una variable aleatoria con media de \(\mu = 3.2\) minutos y una desviación estándar \(\sigma =1.6\) minutos. Si se observa una muestra aleatoria de 64 clientes, calcule la probabilidad de que el tiempo medio que el cliente pasa en la ventanilla del cajero sea

a- a los sumo 2.7 minutos `0.0062`

b- más de 3.5 minutos `0.0668`

c- al menos 3.2 minutos pero menos de 3.4 minutos `0.3413`

Distribución muestra de \(S^2\)

Si \(S^2\) es la varianza de una muestra aleatoria de tamaño \(n\) que se toma de una población normal que tiene la varianza \(\sigma ^2\), entonces el estadístico.

\[\begin{equation} \chi ^2 = \frac{(n-1)S^2}{\sigma ^2} = \sum_{i=1}^{n} \frac{(X_{i} - \overline{X})^2}{\sigma ^2} \end{equation}\]

tiene una distribución chi cuadrada con \(v=n-1\) grados de libertad.


Ejemplo

1- Suponga que las varianzas muestrales son mediciones continuas. Calcule la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal con varianza \(\sigma ^2 =6\), tenga una varianza muestral \(S^2\).

a- mayor que 9.1

b- entre 3.462 y 10.745

Solución

a- \(P(S^2 > 9.1) = P(\chi ^2 >36.4 ) = 0.05\)

\(\chi ^2 = \displaystyle{\frac{(n-1)S^2}{\sigma ^2} = \frac{(24)(9.1)}{6} = 36.4}\)

b- \(P(3.462<s^2<10.745)= P(13.848<\chi ^2<42.980) = 0.95-0.01 = 0.94\)


Ejercicios

1- Para una distribución chi cuadrada calcule \(\chi_{\alpha}^2\), tal que.

  1. \(P(X^2 > \chi_{\alpha}^2) = 0.99\) cuando \(v=4\); 0.297

  2. \(P(X^2 > \chi_{\alpha}^2) = 0.025\) cuando \(v=19\); 32.852

  3. \(P(37.652<X^2 < \chi_{\alpha}^2) = 0.045\) cuando \(v=25\); 46.928


Ejercicio 1


PROBABILIDAD Y ESTADÍSTICA

Estadística Descriptiva

EJERCITARIO N° 01/2023


1- Se registran las siguientes mediciones para el tiempo de secado (en horas) de cierta marca

3.4 2.5 4.8 2.9 3.6 2.8 3.3 5.6 3.7 2.8 4.4 4.0
5.2 3.0 4.8

Las mediciones constituyen una muestra aleatoria simple y dada la cantidad no resulta necesaria la agrupación de los mismos en intervalos. Calcule:

a-Mediana, Mediana y Moda.

b-Varianza, Desviación Estándar, Desviación Media y Desviación Mediana.

2- Según la revista Chemical Engineering, una propiedad importante de una fibra es su absorción del agua. Se toma una muestra aleatoria de 20 pedazos de fibra de algodón y se mide la absorción de cada uno. Los valores de absorción son los siguientes:

18.71 21.41 20.72 21.81 19.29 22.43
20.17 23.71 19.44 20.50 18.92 20.33
23.00 22.85 19.25 21.77 22.11 19.77
18.04 21.12

Se solicita:

a- Determinar la distribución de frecuencias relativas de los datos agrupados en cinco intervalos y graficar en un Histograma.

b- Determinar la distribución de frecuencias acumuladas relativas y graficar en una Ojiva.

c- Calcular a partir de la tabla de frecuencias, los valores aproximados de

    1. Media, Mediana, Moda

    2. Varianza, Desviación Estándar, Desviación Media y Desviación Mediana.

3- Se realiza un estudio acerca de los efectos del tabaquismo sobre los patrones de sueño. La medición que se observa es el tiempo, en minutos, que toma quedar dormido. Se obtienen los siguientes datos:

Fumadores: 69.3 56.0 22.1 47.6 53.2 48.1 52.7
34.4 60.2 43.8 23.2 13.8
No fumadores: 28.6 25.1 26.4 34.9 29.8 28.4 38.5 30.2 30.6
31.8 41.6 21.1 36.0 37.9 13.9
a- Calcule la media y la desviación estándar de la muestra para cada grupo.

b- Comente qué clase de efecto parece tener el hecho de fumar sobre el tiempo que se requiere para quedarse dormido.

4- Las siguientes puntuaciones representan la calificación en el examen final para un curso de estadística elemental:

23 60 79 32 57 74 52 70 82 36 80
77 81 95 41 65 92 85 55 76 52 10
64 75 78 25 80 98 81 67 41 71 83
54 64 72 88 62 74 43 60 78 89 76
84 48 84 90 15 79 34 67 17 82 69
74 63 80 85 61
  • Elabore un histograma de frecuencias relativas y analice la distribución de los datos.

Ejercicio 2


PROBABILIDAD Y ESTADÍSTICA I

EJERCITARIO N° 02/2023


1- En un experimento para estudiar la relación que existe entre el hábito de fumar y la hipertensión arterial se reúne los siguientes datos para 180 individuos:

No Fumadores Fumadores Moderados Fumadores empedernidos
H 21 36 30
SH 48 26 19

donde las letras H y SH de la tabla representan Hipertensión y Sin Hipertensión, respectivamente. Si se selecciona uno de estos individuos al azar, calcule la probabilidad de que la persona…

a- Sufra hipertensión, dado que es una fumadora empedernida;

b- No fume, dado que no padece hipertensión

a- \(\displaystyle{\frac{30}{40}}\)

b- \(\displaystyle{\frac{16}{31}}\)

2- De una caja que contiene 6 bolas negras y 4 verdes se extraen 3 bolas sucesivamente y cada bola se reemplaza en la caja antes de extraer la siguiente. ¿Cuál es la probabilidad de que..

a- Las 3 sean del mismo color?

b- cada color esté representado?

a- \(\displaystyle{\frac{7}{25}}\)

b- \(\displaystyle{\frac{18}{25}}\)

3- En la figura se muestra un sistema de circuitos. Suponga que los componentes fallan de manera independiente.

a- ¿Cuál es la probabilidad de que el sistema completo funcione?

b- Dado que el sistema funciona, ¿cuál es la probabilidad de que el componente A no funcione?

a- 0.75112

b- 0.2045

4- La probabilidad de que un doctor diagnostique de manera correcta una enfermedad específica es 0.7. Dado que el doctor hace un diagnóstico incorrecto, la probabilidad de que el paciente entable una demanda legal es 0.9. ¿Cuál es la probabilidad de que el doctor haga un diagnóstico incorrecto y el paciente lo de mande? = 0.27 .

5- En cierta región del país se sabe por experiencia que la probabilidad de seleccionar un adulto mayor de 40 años de edad con cáncer es 0.05. Si la probabilidad de que un doctor diagnostique de forma correcta que una persona con cáncer tiene la enfermedad es 0.78, y la probabilidad de que diagnostique de forma incorrec ta que una persona sin cáncer tiene la enfermedad es 0.06, ¿cuál es la probabilidad de que a un adulto mayor de 40 años se le diagnostique cancer? = 0.096.

6- Una cadena de tiendas de pintura produce y vende pintura de látex y semiesmaltada. De acuerdo con las ventas a largo plazo, la probabilidad de que un cliente compre pintura de látex es 0.75. De los que compran pintura de látex, 60% también compra rodi llos. Sin embargo, sólo \(30 \%\) de los que compran pin tura semiesmaltada compra rodillos. Un comprador que se selecciona al azar adquiere un rodillo y una la ta de pintura. ¿Cuál es la probabilidad de que sea pintura de látex? = 0.857.

7- Determina el valor \(c\) de modo que cada una de las siguientes funciones sirva como distribución de probabilidad de la variable aleatoria discreta \(X\).

a- \(f(x)=c(x^2+4)\), para \(x=0,1,2,3;\)

b- \(\displaystyle{f(x) = c\binom{2}{x} \binom{3}{3-x}}\), para \(x=0,1,2,\)

a- \(\displaystyle{\frac{1}{30}}\)

b- \(\displaystyle{\frac{1}{10}}\)

8- La proporción de personas que responden a cierta encuesta enviada por correo es una variable aleatoria continua \(X\) que tiene la siguiente función de densidad:

\[f(x) = \left\{\begin{matrix} \frac{2(x+2)}{5} & 0<x<1, \\ 0, & \text{en otro caso} \end{matrix}\right.\]

a- Demuestre que \(P(0<X<1)=1\)

b- Calcule la probabilidad de que más de \(\displaystyle{\frac{1}{4}}\) pero menos de \(\displaystyle{\frac{1}{2}}\) de las personas contactadas respondan a este tipo de encuesta.

b- \(\displaystyle{\frac{19}{80}}\)

9- La distribución de probabilidad de \(X\), el número de imperfecciones que se encuentran en cada 10 metros de una tela sintética que viene en rollos continuos de ancho uniforme, está dada por:

\(x\) 0 1 2 3 4
\(f(x)\) 0.41 0.37 0.16 0.05 0.01

Construya la función de distribución acumulativa de \(X\).

10- Considere la función de densidad:

\[f(x) = \left\{\begin{matrix} k \sqrt{x}& 0<x<1, \\ 0, & \text{en otro caso} \end{matrix}\right.\]

a- Evalúe k

b- Calcule F(x) y utilice el resultado para evaluar P(0.3<X<0.6)

a- \(\displaystyle{k=\frac{1}{3}}\)

b- \(0.3004\)

11- La distribución de probabilidad de la variable aleatoria \(X\) es:

\(\displaystyle{f(x) = \binom{3}{x} \left(\frac{1}{4}\right)^{x} \left(\frac{3}{4}\right)^{3-x}}, \quad x=0,1,2,3.\)

Calcule la media de \(X\)

E(X) = 3/4

12- La función de densidad de las mediciones codificadas del diámetro de paso de los hilos de un encaje es:

\[f(x) = \left\{\begin{matrix} \frac{4}{\pi (1+x^2)}& 0<x<1, \\ 0, & \text{en otro caso} \end{matrix}\right.\]

Calcule el valor esperado de \(X\)

\(\displaystyle{E(X)=\frac{ln4}{\pi}}\)

13- Sea \(X\) una variable aleatoria con la siguiente distribución de probabilidad

\(x\) -2 3 5
\(f(x)\) 0.3 0.2 0.5

Calcule la desviación estándar de \(X\)

\(\sigma = 3.041\)

14- En una tarea de laboratorio, si el equipo está funcionando, la densidad del resultado observado \(X\) es:

\[f(x) = \left\{\begin{matrix} 2(1-x),& 0<x<1, \\ 0, & \text{en otro caso} \end{matrix}\right.\]

Calcule la desviación estándar de \(X\)

\(\sigma = 0.2357\)


Taller

PROBABILIDAD Y ESTADÍSTICA I


1- En cierto distrito de la ciudad se establece que la causa de \(75\%\) de todos los robos es la necesidad de dinero para comprar drogas. Calcule la probabili dad de que entre los siguientes cinco casos de robo que se reporten en este distrito,

a- exactamente 2 sean resultado de la necesidad de dinero para comprar drogas;

b- a lo sumo 3 resulten de la necesidad de dinero para comprar drogas.

2- Se selecciona al azar un comité de 3 perso nas a partir de 4 médicos y 2 enfermeras. Escriba una fórmula para la distribución de probabilidad de la va riable aleatoria X que representa el número de médicos en el comité. Calcule \(P(2 ≤ X ≤ 3)\)

3- Al probar cierta clase de neumático para camión en un terreno accidentado, se encuentra que el \(25\%\) de los camiones no completan la prueba de recorrido sin ponchaduras. De los siguientes 15 camiones probados, calcule la probabilidad de que

a- de 3 a 6 tengan ponchaduras;

b- menos de 4 tengan ponchaduras;

c- más de 5 tengan ponchaduras.

4- De un lote de 10 misiles, se seleccionan 4 al azar y se disparan. Si el lote contiene 3 misiles defectuosos que no pueden dispararse, ¿cuál es la probabilidad de que

a- los 4 puedan dispararse?

b- a lo sumo fallen 2?

5- Cierta área del este de Estados Unidos resulta afectada, en promedio, por 6 huracanes al año. Calcule la probabilidad de que para cierto año esta área resulte afectada por

a- menos de 4 huracanes;

b- cualquier cantidad entre 6 y 8 huracanes.

6- Un autobús llega cada 10 minutos a una parada. Se supone que el tiempo de espera para un individuo en particular es una variable aleatoria con distribución continua uniforme.

a- ¿Cuál es la probabilidad de que el individuo espe re más de 7 minutos?

b- ¿Cuál es la probabilidad de que el individuo espe re entre 2 y 7 minutos?

7- Los baches en ciertas carreteras pueden ser un problema grave y requieren reparación constante mente. Con un tipo específico de terreno y mezcla de concreto la experiencia sugiere que hay, en promedio, 2 baches por milla después de cierta cantidad de uso. Se supone que el proceso de Poisson se aplica a la variable aleatoria “número de baches”.

a- ¿Cuál es la probabilidad de que no aparezca más de un bache en un tramo de una milla?

b- ¿Cuál es la probabilidad de que no aparezcan más de 4 haches en un tramo determinado de 5 millas?

8-Las barras de pan de centeno que cierta panade ría distribuye a las tiendas locales tienen una longitud. promedio de 30 centímetros y una desviación estándar de 2 centímetros. Si se supone que las longitudes están distribuidas normalmente, ¿qué porcentaje de las ba mas son

a- más largas que 31.7 centimetros

b- de entre 29.3 y 33.5 centimetros de longitud?

c- más cortas que 25.5 centimetros?

9-Dada la variable \(X\) normalmente distribuida con una media de 18 y una desviación estándar de 2.5. calcule

a- P(X < 15):

b- el valor de k tal que P(X < k) = 0.2236:

c- el valor de k tal que P(X > k) = 0.1814:

d- P(17 < X < 21).

Bibliografía

Canavos, George C, y Edmundo Gerardo Urbina Medal. 1987. Probabilidad y estadı́stica. McGraw Hill México.
Walpole, Ronald E, Raymond H Myers, Sharon L Myers, y Ricardo Cruz. 1992. Probabilidad y estadı́stica. Vol. 624. McGraw-Hill México.

  1. La fórmula de la amplitud viene dado por \(A = \frac{R}{m}\)↩︎