A continuación se presenta el objetivo general de la práctica:
A continuación, se presenta los objetivos específicos que tiene la siguiente práctica:
Desarrollar ejercicios relacionados con variables discretas. Identificar variables discretas, las funciones de probabilidad de cada variable, la función acumulada, Visualizar la gráfica correspondiente para su correcta implementación.
Incluir en este caso, la media, la varianza y desviación estándar de distribuciones de variables discretas.
Desarrollar tres ejercicios en este caso 13, encontrados en la literatura que se encuentran en el caso 14.
Nota: Los casos son identificados de la literatura relacionada con variables aleatorias discretas.
La probabilidad y la estadística están relacionadas en una forma importante. La probabilidad se emplea como herramienta; permite que se evalúe la confiabilidad de las conclusiones acerca de la población cuando tenga sólo información muestral.
Por otra parte, la probabilidad indica el grado de certidumbre o certeza de un suceso o fenómeno estudiado, en la investigación científica existen muchos fenómenos en los cuales es necesario determinar la probabilidad de que un evento ocurra o dejen de ocurrir, para lo cual el estudio de este campo, es necesario.
Además tiene aplicaciones muy importantes en investigación; dado que es base para la inferencia estadística que permite el estudio de muestras con el objetivo de inferir o extrapolar características de estas a una población.
La definición propia de una variable aleatoria es la siguiente, de acuerdo con los estipulado por Enciclopedia en su sitio web (2022):
Una variable aleatoria es la función matemática de un experimento aleatorio.
A priori, la definición de variable aleatoria no reviste mucha complejidad. Se trata de un concepto que se puede definir en una frase. Sin embargo, es más complejo de lo que las apariencias puedan indicar.
¿Qué es una variable aleatoria?
Cómo podemos comprobar la frase se compone básicamente de dos conceptos:
Función Matemática
Experimento Aleatorio.
De manera que por aquí es por dónde debemos empezar. Es decir, por entender primero qué es una función matemática y, más tarde, por definir qué entendemos por experimento aleatorio.
Función Matemática: Dicho de manera sencilla, es una ecuación que asigna valores a una variable (variable dependiente) en función de otras variables (variables independientes).
Experimento Aleatorio: Es un fenómeno de la vida real cuyos resultados se deben completamente al azar. Es decir, bajo las mismas condiciones iniciales arroja resultados diferentes.
El valor numérico de la variable aleatoria depende del resultado del experimento. Una variable aleatoria puede ser discreta o continua, depende del tipo de valores numéricos que asuma.
En cualquier experimento aleatorio, los resultados se presentan al azar; así, a este se le denomina variable aleatoria.
Una función de probabilidad, una función de masa de probabilidad o una distribución de probabilidad de la variable aleatoria discreta X si, para cada resultado x posible.
Toda función de probabilidad debe ser mayor o igual que \(0\). \[f(x) \geq 0\]
La suma de las probabilidad de todas las variables \(x\) debe ser igual a \(1\) o la suma de los valores de cada función de probabilidad con respecto a \(x\) debe ser \(1\) \[\sum _xf(x) = 1\]
La probabilidad de cada variable \(x\) es igual a la función de probabilidad con respeto a \(x\) \[P(X=x) = f(x)\]
Por otra parte, la función de la distribución acumulativa F(x) ó probabilidad acumulada de una variable aleatoria discreta \(X\) con distribución de probabilidad \(f(x)\) está dada por la suma de sus probabilidades de \(t\) siendo \(t\) menor o igual a \(x\).
Es decir, la probabilidad acumulada suma los valores de las funciones de probabilidad a partir del valor inicial de \(x\). El valor final con respecto a valor final de \(x\) debe ser igual a 1. \[F(x)=P(X \le x) = \sum_{t \le x}f(t)\]
La media de una distribución discreta es también recibe el nombre de valor esperado. Se trata de un promedio ponderado de los posibles valores de una variable aleatoria se ponderan con sus correspondientes probabilidades de ocurrencia.
La fórmula para el valor esperado es: \[\mu = \sum x \cdot P(x)\]
La varianza de una distribución discreta constituye un valor típico para resumir una distribución de probabilidad discreta, describe el grado de dispersión (variación) en una distribución.
Su fórmula es: \[\alpha^2 = \sum(x-\mu)^2\cdot P(x)\]
La fórmula anterior significa:
La media se resta de cada valor de la variable aleatoria y la diferencia se eleva al cuadrado.
Cada diferencia al cuadrado se multiplica por su probabilidad.
Se suman los productos resultantes para obtener la varianza.
La desviación estándar, \(\alpha\), se determina al extraer la raíz cuadrada positiva de \(\alpha^2\); es decir, \(\alpha = \sqrt{\alpha^2}\).
Para cada ejercicio algunos vistos en el caso anterior y otros nuevos para este caso, se describe y define su contexto.
Se construye su tabla de probabilidad que contenga los valores de la variable aleatoria, la función de probabilidad y su función acumulada, la gráfica de barra de los valores de las variables aleatoria y la gráfica lineal de la función acumulada.
Con la tabla de probabilidades en algunos ejercicios se determinan y calculan probabilidades.
Se determina el valor esperado de cada ejercicio
Se determina la varianza y la desviación estándar de la distribución de las variables discretas.
library(ggplot2)
library(stringr)
library(stringi)
library(gtools)
library(dplyr)
library(knitr)
library(kableExtra)
options(scipen = 999)
Se venden 5000 billetes para una rifa a 1 euro cada uno. Existe un único premio de cierta cantidad, calcular los valores de las variables aleatorias y sus probabilidades para 0 para no gana y 1 para si gana cuando un comprador adquiere cincuenta billetes. [@course_hero_variables_nodate].
discretas <- c(0,1) # 0 Que no gane, 1 que gane
n <- 5000 # sum(casos)
casos <- c(4950,50)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades) # Acumulada
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada,
x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")
| x | casos | f.prob.x | F.acum.x | x.f.prob.x |
|---|---|---|---|---|
| 0 | 4950 | 0.99 | 0.99 | 0.00 |
| 1 | 50 | 0.01 | 1.00 | 0.01 |
Se determina el valor esperado de acuerdo a la fórmula: \[\mu = \sum xP(x)\]
# VE <- sum(tabla$x * tabla$f.prob.x)
VE <- sum(tabla$x.f.prob.x)
VE
## [1] 0.01
El valor esperado significa la media ponderada de las probabilidades o lo que es lo mismo es lo que se puede esperar.
Significa muy muy muy …. remoto la probabilidad de ganar en el sorteo de 5000 boletos 0.01
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
#tabla
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
| x | casos | f.prob.x | F.acum.x | x.f.prob.x | VE | x-VE.cuad.f.prob.x |
|---|---|---|---|---|---|---|
| 0 | 4950 | 0.99 | 0.99 | 0.00 | 0.01 | 0.000099 |
| 1 | 50 | 0.01 | 1.00 | 0.01 | 0.01 | 0.009801 |
\[\alpha^2 = \sum(x-\mu)^2P(x)\]
varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 0.0099
La raiz cuadrada de la varianza \[\alpha = \sqrt{ \alpha^2 }\]
desv.std = desviación estándard
desv.std <- sqrt(varianza)
desv.std
## [1] 0.09949874
tabla.sumatorias <- rbind(tabla, apply(tabla, 2, sum))
tabla.sumatorias[nrow(tabla.sumatorias), c(1,4,6)] <- '****'
kable(tabla.sumatorias, caption = "Tabla De Probabilidad Con Las Sumatorias")
| x | casos | f.prob.x | F.acum.x | x.f.prob.x | VE | x-VE.cuad.f.prob.x |
|---|---|---|---|---|---|---|
| 0 | 4950 | 0.99 | 0.99 | 0.00 | 0.01 | 0.000099 |
| 1 | 50 | 0.01 | 1 | 0.01 | 0.01 | 0.009801 |
| **** | 5000 | 1.00 | **** | 0.01 | **** | 0.009900 |
ggplot(data = tabla, aes(x = x, y=f.prob.x, fill=x)) +
geom_bar(stat="identity")
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point(colour="blue") +
geom_line(colour="red")
Un vendedor llamado John Rasgdale vende la mayor cantidad de automóviles el sábado, así que desarrolló la siguiente distribución de probabilidades, en la cual se muestra la cantidad de automóviles que espera vender un sábado determinado.
La variable discreta venta de automóviles: \(0,1,2,3,4\) el sábado. Los valores de la probabilidad son : \(0.1, 0.2, 0.3, 0.3, 0.1\), previamente definidos.
Ya se dan las probabilidades de tal forma que la cantidad de casos no se dispone en este ejercicio.
¿De qué tipo de distribución se trata?, variables discretas
¿Cuántos automóviles espera vender John un sábado normal?
¿Cuál es la varianza de la distribución? [@lind_estadistica_2015].
discretas <- 0:4
casos <- rep(0, 5)
probabilidades <- c(0.1, 0.2, 0.3, 0.3, 0.1)
acumulada <- cumsum(probabilidades) # Acumulada
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada,
x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado (sin número de casos)")
| x | casos | f.prob.x | F.acum.x | x.f.prob.x |
|---|---|---|---|---|
| 0 | 0 | 0.1 | 0.1 | 0.0 |
| 1 | 0 | 0.2 | 0.3 | 0.2 |
| 2 | 0 | 0.3 | 0.6 | 0.6 |
| 3 | 0 | 0.3 | 0.9 | 0.9 |
| 4 | 0 | 0.1 | 1.0 | 0.4 |
¿Cuál es la probabilidad de que se vendan DOS automóviles, es decir \(f(x=2)\) ó \(P(x=2)\)?, 30%
filter(tabla, x == 2 ) %>%
select(x, f.prob.x)
## x f.prob.x
## 1 2 0.3
¿Cuál es la probabilidad de que se vendan MENOS DE DOS automóviles, es decir \(f(x< 2)\) ó \(P(x<2)\) ? 30%
\[ \sum P(x=0) + P(x=1) \]
filter(tabla, x < 2 ) %>%
select(x, f.prob.x, F.acum.x)
## x f.prob.x F.acum.x
## 1 0 0.1 0.1
## 2 1 0.2 0.3
¿Cuál es la probabilidad de que se vendan MAS DE DOS automóviles, es decir \(f(x> 2)\) ó \(P(x>2)\) ? 40%
\[ \sum P(x=3) + P(x=4) \text{ ó } \]
\[ 1 - \sum P(x=0) + P(x=1) + P(x=2) \]
filter(tabla, x > 2 ) %>%
select(x, f.prob.x, F.acum.x)
## x f.prob.x F.acum.x
## 1 3 0.3 0.9
## 2 4 0.1 1.0
Se determina el valor esperado de acuerdo a la fórmula: \[\mu = \sum x \cdot P(x)\]
VE <- sum(tabla$x * tabla$f.prob.x)
VE
## [1] 2.1
El valor esperado significa la media ponderada de las probabilidades o lo que es lo mismo es lo que se puede esperar.
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza (sin número de casos)")
| x | casos | f.prob.x | F.acum.x | x.f.prob.x | VE | x-VE.cuad.f.prob.x |
|---|---|---|---|---|---|---|
| 0 | 0 | 0.1 | 0.1 | 0.0 | 2.1 | 0.441 |
| 1 | 0 | 0.2 | 0.3 | 0.2 | 2.1 | 0.242 |
| 2 | 0 | 0.3 | 0.6 | 0.6 | 2.1 | 0.003 |
| 3 | 0 | 0.3 | 0.9 | 0.9 | 2.1 | 0.243 |
| 4 | 0 | 0.1 | 1.0 | 0.4 | 2.1 | 0.361 |
\[\alpha^2 = \sum(x-\mu)^2\cdot P(x)\]
varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 1.29
La raiz cuadrada de la varianza \[\alpha = \sqrt{ \alpha^2 }\]
desv.std = desviación estándard
desv.std <- sqrt(varianza)
desv.std
## [1] 1.135782
tabla.sumatorias <- rbind(tabla, apply(tabla, 2, sum))
tabla.sumatorias[nrow(tabla.sumatorias), c(1,2,4,6)] <- '****'
kable(tabla.sumatorias, caption = "Tabla de probabilidad con sumatorias,(sin número de casos)")
| x | casos | f.prob.x | F.acum.x | x.f.prob.x | VE | x-VE.cuad.f.prob.x |
|---|---|---|---|---|---|---|
| 0 | 0 | 0.1 | 0.1 | 0.0 | 2.1 | 0.441 |
| 1 | 0 | 0.2 | 0.3 | 0.2 | 2.1 | 0.242 |
| 2 | 0 | 0.3 | 0.6 | 0.6 | 2.1 | 0.003 |
| 3 | 0 | 0.3 | 0.9 | 0.9 | 2.1 | 0.243 |
| 4 | 0 | 0.1 | 1 | 0.4 | 2.1 | 0.361 |
| **** | **** | 1.0 | **** | 2.1 | **** | 1.290 |
ggplot(data = tabla, aes(x = x, y=f.prob.x, fill=x)) +
geom_bar(stat="identity")
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point(colour="blue") +
geom_line(colour="red")
Una compañía tiene cinco solicitantes para dos puestos de trabajo: dos mujeres y tres hombres. Suponga que los cinco solicitantes son igualmente calificados y que no hay preferencia para elegir su género al igual que no importa el orden de género de hombres y mujeres (combinaciones).
Sea \(x\) la variable aleatoria discreta al número de mujeres elegidas para ocupar los dos puestos de trabajo. Encuentre las probabilidades para elegir 0 mujeres, 1 mujer o 2 mujeres.
Haciendo las combinaciones en donde \(M = Mujer \text{ y }H = Hombre\)
personas <- c("H1", "H2", "H3", "M1", "M2")
S.espacio.muestral <- combinations(n = 5, r = 2, v=personas)
S.espacio.muestral
## [,1] [,2]
## [1,] "H1" "H2"
## [2,] "H1" "H3"
## [3,] "H1" "M1"
## [4,] "H1" "M2"
## [5,] "H2" "H3"
## [6,] "H2" "M1"
## [7,] "H2" "M2"
## [8,] "H3" "M1"
## [9,] "H3" "M2"
## [10,] "M1" "M2"
De acuerdo al espacio muestral \(n\) con diez elementos, ¿en cúantas ocasiones hay cero mujeres?, ¿en cuántas ocasiones hay una mujer? y en cuántas ocasiones hay dos mujeres?
discretas <- c(0, 1, 2)
casos <- c(3, 6, 1 )
n <- sum(casos)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades) # Acumulada
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada,
x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")
| x | casos | f.prob.x | F.acum.x | x.f.prob.x |
|---|---|---|---|---|
| 0 | 3 | 0.3 | 0.3 | 0.0 |
| 1 | 6 | 0.6 | 0.9 | 0.6 |
| 2 | 1 | 0.1 | 1.0 | 0.2 |
¿Cuál es la probabilidad de que haya UNA MUJER?, es decir \(P(X=1)\) ó \(f(x=1)\) ? 60%
filter(tabla, x == 1 ) %>%
select(x, f.prob.x)
## x f.prob.x
## 1 1 0.6
¿Cuál es la probabilidad de que haya MENOS DE DOS MUJERES?, es decir \(P(x=0) + P(x=1)\) ó \(f(x<2)\) ? 90%
filter(tabla, x < 2 ) %>%
select(x, f.prob.x, F.acum.x)
## x f.prob.x F.acum.x
## 1 0 0.3 0.3
## 2 1 0.6 0.9
¿Cuál es la probabilidad de que haya MAS DE 1 MUJER O SEA DOS?, es decir \(P(x=2)\) ó \(f(x>1)\) ? 10%
filter(tabla, x > 1 ) %>%
select(x, f.prob.x, F.acum.x)
## x f.prob.x F.acum.x
## 1 2 0.1 1
Se determina el valor esperado de acuerdo a la fórmula: \[\mu = \sum x \cdot P(x)\]
VE <- sum(tabla$x * tabla$f.prob.x)
VE
## [1] 0.8
\[\alpha^2 = \sum(x-\mu)^2 \cdot P(x)\]
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
| x | casos | f.prob.x | F.acum.x | x.f.prob.x | VE | x-VE.cuad.f.prob.x |
|---|---|---|---|---|---|---|
| 0 | 3 | 0.3 | 0.3 | 0.0 | 0.8 | 0.192 |
| 1 | 6 | 0.6 | 0.9 | 0.6 | 0.8 | 0.024 |
| 2 | 1 | 0.1 | 1.0 | 0.2 | 0.8 | 0.144 |
Calculando la varianza
varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 0.36
\[\alpha = \sqrt{ \alpha^2 }\]
Con la raiz cuadrada de la varianza se determina la desviación estándard de la distribución de variables aleatorias.
desv.std <- sqrt(varianza)
desv.std
## [1] 0.6
tabla.sumatorias <- rbind(tabla, apply(tabla, 2, sum))
tabla.sumatorias[nrow(tabla.sumatorias), c(1,4,6)] <- '****'
kable(tabla.sumatorias, caption = "Tabla de probabilidad con sumatorias")
| x | casos | f.prob.x | F.acum.x | x.f.prob.x | VE | x-VE.cuad.f.prob.x |
|---|---|---|---|---|---|---|
| 0 | 3 | 0.3 | 0.3 | 0.0 | 0.8 | 0.192 |
| 1 | 6 | 0.6 | 0.9 | 0.6 | 0.8 | 0.024 |
| 2 | 1 | 0.1 | 1 | 0.2 | 0.8 | 0.144 |
| **** | 10 | 1.0 | **** | 0.8 | **** | 0.360 |
ggplot(data = tabla, aes(x = x, y=f.prob.x, fill=x)) +
geom_bar(stat="identity")
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point(colour="blue") +
geom_line(colour="red")
En la siguiente tabla se presenta la distribución del número de hijos de un grupo de 100 parejas (humanos): Ejercicio extraído de: [@web_descartes_estadistica_2018].
La Variable Aleatoria x No. Hijos |
La Cantidad De Parejas |
|---|---|
| 0 | 15 |
| 1 | 40 |
| 2 | 23 |
| 3 | 10 |
| 4 | 7 |
| 5 | 4 |
| 6 | 1 |
| Total Parejas Encuestadas | 100 |
discretas <- c(0, 1, 2, 3, 4, 5, 6)
casos <- c(15, 40, 23, 10, 7, 4, 1 )
n <- sum(casos)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades) # Acumulada
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada,
x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")
| x | casos | f.prob.x | F.acum.x | x.f.prob.x |
|---|---|---|---|---|
| 0 | 15 | 0.15 | 0.15 | 0.00 |
| 1 | 40 | 0.40 | 0.55 | 0.40 |
| 2 | 23 | 0.23 | 0.78 | 0.46 |
| 3 | 10 | 0.10 | 0.88 | 0.30 |
| 4 | 7 | 0.07 | 0.95 | 0.28 |
| 5 | 4 | 0.04 | 0.99 | 0.20 |
| 6 | 1 | 0.01 | 1.00 | 0.06 |
¿Cuál es la probabilidad de encontrar aletoriamente parejas con TRES HIJOS, es decir, \(f(x=3)\) ó \(P(x=3)\) 10%
filter(tabla, x == 3 ) %>%
select(x, f.prob.x, F.acum.x)
## x f.prob.x F.acum.x
## 1 3 0.1 0.88
¿Cuál es la probabilidad de encontrar aleatoriamente parejas con MENOS DE TRES HIJOS, es decir, \(f(x<3)\) ó \(\sum f(x={0,1,2})\) ó \(\sum P(x=0) + P(x=1) + P(x=2)\) ó \(F \text{ acumulada }(x)\)
78%
filter(tabla, x < 3 ) %>%
select(x, f.prob.x, F.acum.x)
## x f.prob.x F.acum.x
## 1 0 0.15 0.15
## 2 1 0.40 0.55
## 3 2 0.23 0.78
¿Cuál es la probabilidad de encontrar aleatoriamente parejas con MAS DE TRES HIJOS, es decir, \(f(x>3)\) ó \(\sum f(x={4,5,6})\) ó \(\sum P(x=4) + P(x=5) + P(x=6)\) ó \(1 - F(x = 3)\); 12%
filter(tabla, x > 3 ) %>%
select(x, f.prob.x, F.acum.x)
## x f.prob.x F.acum.x
## 1 4 0.07 0.95
## 2 5 0.04 0.99
## 3 6 0.01 1.00
Se determina el valor esperado de acuerdo a la fórmula: \[\mu = \sum x \cdot P(x)\]
VE <- sum(tabla$x * tabla$f.prob.x)
VE
## [1] 1.7
\[\alpha^2 = \sum(x-\mu)^2 \cdot P(x)\]
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
| x | casos | f.prob.x | F.acum.x | x.f.prob.x | VE | x-VE.cuad.f.prob.x |
|---|---|---|---|---|---|---|
| 0 | 15 | 0.15 | 0.15 | 0.00 | 1.7 | 0.4335 |
| 1 | 40 | 0.40 | 0.55 | 0.40 | 1.7 | 0.1960 |
| 2 | 23 | 0.23 | 0.78 | 0.46 | 1.7 | 0.0207 |
| 3 | 10 | 0.10 | 0.88 | 0.30 | 1.7 | 0.1690 |
| 4 | 7 | 0.07 | 0.95 | 0.28 | 1.7 | 0.3703 |
| 5 | 4 | 0.04 | 0.99 | 0.20 | 1.7 | 0.4356 |
| 6 | 1 | 0.01 | 1.00 | 0.06 | 1.7 | 0.1849 |
Calculando la varianza
varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 1.81
\[\alpha = \sqrt{ \alpha^2 }\]
Con la raiz cuadrada de la varianza se determina la desviación estándard de la distribución de variables aleatorias.
desv.std <- sqrt(varianza)
desv.std
## [1] 1.345362
tabla.sumatorias <- rbind(tabla, apply(tabla, 2, sum))
tabla.sumatorias[nrow(tabla.sumatorias), c(1,4,6)] <- '****'
kable(tabla.sumatorias, caption = "Tabla de probabilidad con sumatorias")
| x | casos | f.prob.x | F.acum.x | x.f.prob.x | VE | x-VE.cuad.f.prob.x |
|---|---|---|---|---|---|---|
| 0 | 15 | 0.15 | 0.15 | 0.00 | 1.7 | 0.4335 |
| 1 | 40 | 0.40 | 0.55 | 0.40 | 1.7 | 0.1960 |
| 2 | 23 | 0.23 | 0.78 | 0.46 | 1.7 | 0.0207 |
| 3 | 10 | 0.10 | 0.88 | 0.30 | 1.7 | 0.1690 |
| 4 | 7 | 0.07 | 0.95 | 0.28 | 1.7 | 0.3703 |
| 5 | 4 | 0.04 | 0.99 | 0.20 | 1.7 | 0.4356 |
| 6 | 1 | 0.01 | 1 | 0.06 | 1.7 | 0.1849 |
| **** | 100 | 1.00 | **** | 1.70 | **** | 1.8100 |
ggplot(data = tabla, aes(x = x, y=f.prob.x, fill=x)) +
geom_bar(stat="identity")
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point(colour="blue") +
geom_line(colour="red")
Se lanza un dado perfecto 240 veces, se anota el resultado obtenido en la cara superior obteniendo los siguientes resultados:
| Cara su p erior | 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|---|
| N úmero de veces | 40 | 39 | 42 | 38 | 42 | 39 |
Para este caso del lanzamiento de un dado al igual que del caso siguiente de la cantidad de vasos que toman los estudiantes del ITD, se utiliza una función f.discretas.ve.v.sd(casos = …) que fue previamente codificada y preparada para dar solución específica de estos casos en relación al tema de variables aleatorias discretas.
La función se encuentra en la dirección UR siguiente: https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/Agosto-Diciembre%202022/funciones/variables%20discretas.R
La función se carga usando la función source() que carga el programa que contiene la función.
Al cargar el script, se puede disponer de la función y mandarla ejecutar con los argumentos y parámetros adecuados.
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/Agosto-Diciembre%202022/funciones/variables%20discretas.R", encoding = "UTF-8")
discretas <- c(0, 1, 2, 3, 4, 5)
casos <- c(40, 39, 42, 38, 42, 39 )
n <- sum(casos)
probabilidades <- casos / n
Al ejecutar la función se obtiene una estructura de datos tipo lista (list[[]]) de 6 elementos:
El primero elemento la es un data.frame que contiene la tabla de distribución.
El segundo elemento son los valores de la variable aleatoria discreta denominada x.
El tercer elemento es el valor del total de casos.
El cuarto elemento es el valor esperado o esperanza matemática.
El quinto elemento es la varianza.
El sexto elemento de la lista es el valor de la desviación estándar de la tabla de distribución de la variable discreta.
resultado <- f.discretas.ve.v.sd(casos = casos)
resultado[[1]] %>%
kbl(caption = "Tabla de distribución de probabilidad del lanzamiento del dado", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>%
kable_paper("hover")
| \(x\) | \(casos\) | \(f(x)\) | \(F(x)\) | \(x\cdot f(x)\) | \(VE\) | \((VE-x)\) | \((VE-x)^{2}\) | \((VE-x)^{2} \cdot f(x)\) |
|---|---|---|---|---|---|---|---|---|
| 0 | 40 | 0.1666667 | 0.1666667 | 0.0000 | 2.5 | -2.5 | 6.25 | 1.0416667 |
| 1 | 39 | 0.1625000 | 0.3291667 | 0.1625 | 2.5 | -1.5 | 2.25 | 0.3656250 |
| 2 | 42 | 0.1750000 | 0.5041667 | 0.3500 | 2.5 | -0.5 | 0.25 | 0.0437500 |
| 3 | 38 | 0.1583333 | 0.6625000 | 0.4750 | 2.5 | 0.5 | 0.25 | 0.0395833 |
| 4 | 42 | 0.1750000 | 0.8375000 | 0.7000 | 2.5 | 1.5 | 2.25 | 0.3937500 |
| 5 | 39 | 0.1625000 | 1.0000000 | 0.8125 | 2.5 | 2.5 | 6.25 | 1.0156250 |
¿Cuál es la probabilidad de que el dado caiga un DOS, es decir \(f(x=2)\)?
resultado[[1]] %>%
kbl(caption = "Tabla de distribución de probabilidad del lanzamiento del dado", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>%
column_spec(column = 3, color = "white", background = "blue") %>%
row_spec(3, bold = T, color = "white", background = "blue")
| \(x\) | \(casos\) | \(f(x)\) | \(F(x)\) | \(x\cdot f(x)\) | \(VE\) | \((VE-x)\) | \((VE-x)^{2}\) | \((VE-x)^{2} \cdot f(x)\) |
|---|---|---|---|---|---|---|---|---|
| 0 | 40 | 0.1666667 | 0.1666667 | 0.0000 | 2.5 | -2.5 | 6.25 | 1.0416667 |
| 1 | 39 | 0.1625000 | 0.3291667 | 0.1625 | 2.5 | -1.5 | 2.25 | 0.3656250 |
| 2 | 42 | 0.1750000 | 0.5041667 | 0.3500 | 2.5 | -0.5 | 0.25 | 0.0437500 |
| 3 | 38 | 0.1583333 | 0.6625000 | 0.4750 | 2.5 | 0.5 | 0.25 | 0.0395833 |
| 4 | 42 | 0.1750000 | 0.8375000 | 0.7000 | 2.5 | 1.5 | 2.25 | 0.3937500 |
| 5 | 39 | 0.1625000 | 1.0000000 | 0.8125 | 2.5 | 2.5 | 6.25 | 1.0156250 |
¿Cuál es la probabilidad de que el dado caiga en CUATRO, es decir \(f(x=4)\)?
resultado[[1]] %>%
kbl(caption = "Tabla de distribución de probabilidad del lanzamiento del dado", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>%
column_spec(column = 3, color = "white", background = "blue") %>%
row_spec(5, bold = T, color = "white", background = "blue")
| \(x\) | \(casos\) | \(f(x)\) | \(F(x)\) | \(x\cdot f(x)\) | \(VE\) | \((VE-x)\) | \((VE-x)^{2}\) | \((VE-x)^{2} \cdot f(x)\) |
|---|---|---|---|---|---|---|---|---|
| 0 | 40 | 0.1666667 | 0.1666667 | 0.0000 | 2.5 | -2.5 | 6.25 | 1.0416667 |
| 1 | 39 | 0.1625000 | 0.3291667 | 0.1625 | 2.5 | -1.5 | 2.25 | 0.3656250 |
| 2 | 42 | 0.1750000 | 0.5041667 | 0.3500 | 2.5 | -0.5 | 0.25 | 0.0437500 |
| 3 | 38 | 0.1583333 | 0.6625000 | 0.4750 | 2.5 | 0.5 | 0.25 | 0.0395833 |
| 4 | 42 | 0.1750000 | 0.8375000 | 0.7000 | 2.5 | 1.5 | 2.25 | 0.3937500 |
| 5 | 39 | 0.1625000 | 1.0000000 | 0.8125 | 2.5 | 2.5 | 6.25 | 1.0156250 |
¿Cuál es la probabilidad de que el dado caiga MENOR QUE CUATRO, es decir \(F(x < 4)\)?
resultado[[1]] %>%
kbl(caption = "Tabla de distribución de probabilidad del lanzamiento del dado", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>%
column_spec(column = 4, color = "white", background = "blue") %>%
row_spec(4, bold = T, color = "white", background = "blue")
| \(x\) | \(casos\) | \(f(x)\) | \(F(x)\) | \(x\cdot f(x)\) | \(VE\) | \((VE-x)\) | \((VE-x)^{2}\) | \((VE-x)^{2} \cdot f(x)\) |
|---|---|---|---|---|---|---|---|---|
| 0 | 40 | 0.1666667 | 0.1666667 | 0.0000 | 2.5 | -2.5 | 6.25 | 1.0416667 |
| 1 | 39 | 0.1625000 | 0.3291667 | 0.1625 | 2.5 | -1.5 | 2.25 | 0.3656250 |
| 2 | 42 | 0.1750000 | 0.5041667 | 0.3500 | 2.5 | -0.5 | 0.25 | 0.0437500 |
| 3 | 38 | 0.1583333 | 0.6625000 | 0.4750 | 2.5 | 0.5 | 0.25 | 0.0395833 |
| 4 | 42 | 0.1750000 | 0.8375000 | 0.7000 | 2.5 | 1.5 | 2.25 | 0.3937500 |
| 5 | 39 | 0.1625000 | 1.0000000 | 0.8125 | 2.5 | 2.5 | 6.25 | 1.0156250 |
¿Cuál es la probabilidad de que el dado caiga MAYOR QUE CUATRO, es decir \(F(x > 4) = 1 - F(x>4) = 1 - F(x=5)\)
resultado[[1]] %>%
kbl(caption = "Tabla de distribución de probabilidad del lanzamiento del dado", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>%
column_spec(column = 3, color = "white", background = "blue") %>%
row_spec(6, bold = T, color = "white", background = "blue")
| \(x\) | \(casos\) | \(f(x)\) | \(F(x)\) | \(x\cdot f(x)\) | \(VE\) | \((VE-x)\) | \((VE-x)^{2}\) | \((VE-x)^{2} \cdot f(x)\) |
|---|---|---|---|---|---|---|---|---|
| 0 | 40 | 0.1666667 | 0.1666667 | 0.0000 | 2.5 | -2.5 | 6.25 | 1.0416667 |
| 1 | 39 | 0.1625000 | 0.3291667 | 0.1625 | 2.5 | -1.5 | 2.25 | 0.3656250 |
| 2 | 42 | 0.1750000 | 0.5041667 | 0.3500 | 2.5 | -0.5 | 0.25 | 0.0437500 |
| 3 | 38 | 0.1583333 | 0.6625000 | 0.4750 | 2.5 | 0.5 | 0.25 | 0.0395833 |
| 4 | 42 | 0.1750000 | 0.8375000 | 0.7000 | 2.5 | 1.5 | 2.25 | 0.3937500 |
| 5 | 39 | 0.1625000 | 1.0000000 | 0.8125 | 2.5 | 2.5 | 6.25 | 1.0156250 |
paste("El valor esperado es: ", round(resultado[[4]], 4))
## [1] "El valor esperado es: 2.5"
paste("La varianza es: ", round(resultado[[5]], 4))
## [1] "La varianza es: 2.9"
paste("La desviación estándar es: ", round(resultado[[6]], 4))
## [1] "La desviación estándar es: 1.7029"
kable(resultado, caption = "Tabla de probabilidad con sumatorias")
|
|
|
|
|
|
Se tiene un estudio de que en época de calor los estudiantes del Tecnológico consumen cierta cantidad de vasos de agua durante el dia.
Se estima que se toman al alrededor de 1 a 8 vasos diarios durante el día para aliviar la sed y hidratar el cuerpo.
La siguiente tabla establece la cantidad de vasos que toman los alumnos durante el día siendo x la variable aleatoria discreta los vasos que se toman.
De un estudio de 150 alumnos esas fueron las respuestas.
X <- c(0, 1, 2, 3, 4, 5, 6, 7, 8)
casos <- c(8, 12, 16, 19, 24, 28, 25, 14, 4 )
n <- sum(casos)
probabilidades <- casos / n
Para determinar el valor esperado, la varianza y la desviación estándar de esta distribución de los casos de agua, se utiliza una función previamente creada y codificada para dicho propósito.
Al ejecutar la función se obtiene una estructura de datos tipo lista (list[[]]) de 6 elementos:
El primero elemento la es un data.frame que contiene la tabla de distribución
El segundo elemento son los valores de la variable aleatoria discreta denominada x
El tercer elemento es el valor del total de casos
El cuarto elemento es el valor esperado o esperanza matemátic
El quinto elemento es la varianza y
El sexto elemento de la lista es el valor de la desviación estándar de la tabla de distribución de la variable discreta.
resultado <- f.discretas.ve.v.sd(casos = casos)
resultado[[1]] %>%
kbl(caption = "Tabla de distribución de probabilidad del lanzamiento del dado", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>%
kable_paper("hover")
| \(x\) | \(casos\) | \(f(x)\) | \(F(x)\) | \(x\cdot f(x)\) | \(VE\) | \((VE-x)\) | \((VE-x)^{2}\) | \((VE-x)^{2} \cdot f(x)\) |
|---|---|---|---|---|---|---|---|---|
| 0 | 8 | 0.0533333 | 0.0533333 | 0.0000000 | 4.113333 | -4.1133333 | 16.9195111 | 0.9023739 |
| 1 | 12 | 0.0800000 | 0.1333333 | 0.0800000 | 4.113333 | -3.1133333 | 9.6928444 | 0.7754276 |
| 2 | 16 | 0.1066667 | 0.2400000 | 0.2133333 | 4.113333 | -2.1133333 | 4.4661778 | 0.4763923 |
| 3 | 19 | 0.1266667 | 0.3666667 | 0.3800000 | 4.113333 | -1.1133333 | 1.2395111 | 0.1570047 |
| 4 | 24 | 0.1600000 | 0.5266667 | 0.6400000 | 4.113333 | -0.1133333 | 0.0128444 | 0.0020551 |
| 5 | 28 | 0.1866667 | 0.7133333 | 0.9333333 | 4.113333 | 0.8866667 | 0.7861778 | 0.1467532 |
| 6 | 25 | 0.1666667 | 0.8800000 | 1.0000000 | 4.113333 | 1.8866667 | 3.5595111 | 0.5932519 |
| 7 | 14 | 0.0933333 | 0.9733333 | 0.6533333 | 4.113333 | 2.8866667 | 8.3328444 | 0.7777321 |
| 8 | 4 | 0.0266667 | 1.0000000 | 0.2133333 | 4.113333 | 3.8866667 | 15.1061778 | 0.4028314 |
resultado[[1]] %>%
kbl(caption = "Tabla de distribución de probabilidad de toma de vasos de agua alumnos", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
kable_paper("hover") %>%
kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>%
column_spec(column = 3, color = "white", background = "blue") %>%
row_spec(5, bold = T, color = "white", background = "blue")
| \(x\) | \(casos\) | \(f(x)\) | \(F(x)\) | \(x\cdot f(x)\) | \(VE\) | \((VE-x)\) | \((VE-x)^{2}\) | \((VE-x)^{2} \cdot f(x)\) |
|---|---|---|---|---|---|---|---|---|
| 0 | 8 | 0.0533333 | 0.0533333 | 0.0000000 | 4.113333 | -4.1133333 | 16.9195111 | 0.9023739 |
| 1 | 12 | 0.0800000 | 0.1333333 | 0.0800000 | 4.113333 | -3.1133333 | 9.6928444 | 0.7754276 |
| 2 | 16 | 0.1066667 | 0.2400000 | 0.2133333 | 4.113333 | -2.1133333 | 4.4661778 | 0.4763923 |
| 3 | 19 | 0.1266667 | 0.3666667 | 0.3800000 | 4.113333 | -1.1133333 | 1.2395111 | 0.1570047 |
| 4 | 24 | 0.1600000 | 0.5266667 | 0.6400000 | 4.113333 | -0.1133333 | 0.0128444 | 0.0020551 |
| 5 | 28 | 0.1866667 | 0.7133333 | 0.9333333 | 4.113333 | 0.8866667 | 0.7861778 | 0.1467532 |
| 6 | 25 | 0.1666667 | 0.8800000 | 1.0000000 | 4.113333 | 1.8866667 | 3.5595111 | 0.5932519 |
| 7 | 14 | 0.0933333 | 0.9733333 | 0.6533333 | 4.113333 | 2.8866667 | 8.3328444 | 0.7777321 |
| 8 | 4 | 0.0266667 | 1.0000000 | 0.2133333 | 4.113333 | 3.8866667 | 15.1061778 | 0.4028314 |
resultado[[1]] %>%
kbl(caption = "Tabla de distribución de probabilidad de toma de vasos de agua alumnos", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
kable_paper("hover") %>%
kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>%
column_spec(column = 4, color = "white", background = "blue") %>%
row_spec(4, bold = T, color = "white", background = "blue")
| \(x\) | \(casos\) | \(f(x)\) | \(F(x)\) | \(x\cdot f(x)\) | \(VE\) | \((VE-x)\) | \((VE-x)^{2}\) | \((VE-x)^{2} \cdot f(x)\) |
|---|---|---|---|---|---|---|---|---|
| 0 | 8 | 0.0533333 | 0.0533333 | 0.0000000 | 4.113333 | -4.1133333 | 16.9195111 | 0.9023739 |
| 1 | 12 | 0.0800000 | 0.1333333 | 0.0800000 | 4.113333 | -3.1133333 | 9.6928444 | 0.7754276 |
| 2 | 16 | 0.1066667 | 0.2400000 | 0.2133333 | 4.113333 | -2.1133333 | 4.4661778 | 0.4763923 |
| 3 | 19 | 0.1266667 | 0.3666667 | 0.3800000 | 4.113333 | -1.1133333 | 1.2395111 | 0.1570047 |
| 4 | 24 | 0.1600000 | 0.5266667 | 0.6400000 | 4.113333 | -0.1133333 | 0.0128444 | 0.0020551 |
| 5 | 28 | 0.1866667 | 0.7133333 | 0.9333333 | 4.113333 | 0.8866667 | 0.7861778 | 0.1467532 |
| 6 | 25 | 0.1666667 | 0.8800000 | 1.0000000 | 4.113333 | 1.8866667 | 3.5595111 | 0.5932519 |
| 7 | 14 | 0.0933333 | 0.9733333 | 0.6533333 | 4.113333 | 2.8866667 | 8.3328444 | 0.7777321 |
| 8 | 4 | 0.0266667 | 1.0000000 | 0.2133333 | 4.113333 | 3.8866667 | 15.1061778 | 0.4028314 |
resultado[[1]] %>%
kbl(caption = "Tabla de distribución de probabilidad de toma de vasos de agua alumnos", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
kable_paper("hover") %>%
kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>%
column_spec(column = 4, color = "white", background = "blue") %>%
row_spec(6, bold = T, color = "white", background = "blue")
| \(x\) | \(casos\) | \(f(x)\) | \(F(x)\) | \(x\cdot f(x)\) | \(VE\) | \((VE-x)\) | \((VE-x)^{2}\) | \((VE-x)^{2} \cdot f(x)\) |
|---|---|---|---|---|---|---|---|---|
| 0 | 8 | 0.0533333 | 0.0533333 | 0.0000000 | 4.113333 | -4.1133333 | 16.9195111 | 0.9023739 |
| 1 | 12 | 0.0800000 | 0.1333333 | 0.0800000 | 4.113333 | -3.1133333 | 9.6928444 | 0.7754276 |
| 2 | 16 | 0.1066667 | 0.2400000 | 0.2133333 | 4.113333 | -2.1133333 | 4.4661778 | 0.4763923 |
| 3 | 19 | 0.1266667 | 0.3666667 | 0.3800000 | 4.113333 | -1.1133333 | 1.2395111 | 0.1570047 |
| 4 | 24 | 0.1600000 | 0.5266667 | 0.6400000 | 4.113333 | -0.1133333 | 0.0128444 | 0.0020551 |
| 5 | 28 | 0.1866667 | 0.7133333 | 0.9333333 | 4.113333 | 0.8866667 | 0.7861778 | 0.1467532 |
| 6 | 25 | 0.1666667 | 0.8800000 | 1.0000000 | 4.113333 | 1.8866667 | 3.5595111 | 0.5932519 |
| 7 | 14 | 0.0933333 | 0.9733333 | 0.6533333 | 4.113333 | 2.8866667 | 8.3328444 | 0.7777321 |
| 8 | 4 | 0.0266667 | 1.0000000 | 0.2133333 | 4.113333 | 3.8866667 | 15.1061778 | 0.4028314 |
paste("El valor esperado es: ", round(resultado[[4]], 4))
## [1] "El valor esperado es: 4.1133"
o puede acceder al valor mediante el nombre del elemento de la lista $VE:
paste("El valor esperado es: ", round(resultado$VE, 4))
## [1] "El valor esperado es: 4.1133"
paste("La varianza es: ", round(resultado[[5]], 4))
## [1] "La varianza es: 4.2338"
o puede acceder al valor mediante el nombre del elemento de la lista $varianza:
paste("La varianza es: ", round(resultado$varianza, 4))
## [1] "La varianza es: 4.2338"
paste("La desviacion estándar es: ", round(resultado[[6]], 4))
## [1] "La desviacion estándar es: 2.0576"
o puede acceder al valor mediante el nombre del elemento de la lista $desv,std:
paste("La varianza es: ", round(resultado$desv.std, 4))
## [1] "La varianza es: 2.0576"
kable(resultado[1], caption = "Tabla de probabilidad con sumatorias")
|
Pendiente
Pendiente
Llegado al final de está práctica, se logra concluir que, se presentaron varios ejercicios de variables aleatorias discretas en donde se determinaron las funciones de probabilidad y la función acumulada, la media o valor esperado, la varianza y su desviación estándar. Se generaron gráficas de barras de los valores de las variables y la gráfica lineal de las tendencias.
Durante El Ejercicio 1, el valor esperado del sorteo con valor de 1%, significa que es muy …. remoto la probabilidad de ganar en el sorteo de 5000 boletos.
En el ejercicio de vena de automóviles de John, ejercicio 2, se trata de una distribución de probabilidad discreta de la variable aleatoria “número de automóviles vendidos”. El valor esperado es del 2.1 que significa que puede vender 2 autos como esperanza.
El valor esperado se utiliza para predecir la media aritmética de la cantidad de automóviles vendidos a largo plazo. Por ejemplo, si John trabaja \(50\) sábados en un año, puede esperar vender \((50)(2.1)\) o \(105\) automóviles solo durante los sábados. Por consiguiente, a veces la media recibe el nombre de valor esperado
El valor de la varianza es de 1.29 que significa lo que puede variar con respecto al valor esperado. La desviación estándar es de \(1.135782\).
¿Cómo se interpreta la variación?
Por ejemplo, Si la vendedora Rita Kirsch también vendió un promedio de 2.1 automóviles los sábados pero tiene tal vez una desviación de 1.9 en comparación del 1.135782 de John, entonces de puede decir que hay mayor variabilidad en la vendedora Rita dado que \((1.91 \geq 1.35)\)
En el caso de las vacantes de puestos para hombres y mujeres el resultado del valor esperado es de \(0.8\) que significa la probabilidad de contratar mujeres en promedio, su desviación estándar es de \(0.6\) que significa nivel de dispersión (alejamiento) de la probabilidad de cada variable aleatoria con respecto al valor esperado.
Del ejercicio de parejas contestar las preguntas:
filter(tabla, x < 2 ) %>%
select(x, f.prob.x, F.acum.x)
## x f.prob.x F.acum.x
## 1 0 0.15 0.15
## 2 1 0.40 0.55
paste("La Probabilidad de una pareja elegida al azar tenga menos de dos hijos es")
## [1] "La Probabilidad de una pareja elegida al azar tenga menos de dos hijos es"
filter(tabla, x > 3 ) %>%
select(x, f.prob.x, F.acum.x)
## x f.prob.x F.acum.x
## 1 4 0.07 0.95
## 2 5 0.04 0.99
## 3 6 0.01 1.00
paste("La Probabilidad de que tenga más de tres hijos es")
## [1] "La Probabilidad de que tenga más de tres hijos es"
filter(tabla, x == 0 ) %>%
select(x, f.prob.x, F.acum.x)
## x f.prob.x F.acum.x
## 1 0 0.15 0.15
paste("La Probabilidad de que no tenga hermanos es")
## [1] "La Probabilidad de que no tenga hermanos es"
La varianza del experimento es igual a:
\[α^2=1.81\]
\[α=1.\]
Esto refleja que tan dispersos están los datos uno del otro, ya que son medidas de dispersión.
Llegado al final de esta actividad, se logra concluir que, el estudio probabilístico del lanzamiento de un dado, el cual fue lanzado 240 veces y donde sus datos obtenidos fueron registrados. A partir de estos datos, se calculó el valor esperado, la varianza y la desviación estándar, así como sus funciones de probabilidad y probabilidad acumulada.
El valor esperado al lanzar un dado resultó ser de 2.5 para cada cara, según los cálculos realizados. También se obtuvieron la varianza y la desviación estándar de la distribución, que fueron de 2.9 y 1.7029, respectivamente.
Al analizar las gráficas correspondientes, se puede observar que los resultados más frecuentes, aunque por una mínima diferencia, fueron los valores 2 y 4 en las caras del dado, ya que empataron en el número de veces que aparecieron en los lanzamientos.
Finalmente, la actividad de lanzar el dado y la aplicación de la teoría de la probabilidad, nos permiten entender , comprender y predecir los patrones de comportamiento de eventos aleatorios. por lo tanto, se sabe que todas las caras tienen la misma probabilidad de salir en cada lanzamiento, lo que se traduce en una distribución uniforme.
La varianza y la desviación estándar, los cálculos arrojaron resultados de 4.2328 y 2.0576, respectivamente. Como se mencionó anteriormente, estos valores reflejan la dispersión de los datos en relación con el valor esperado o media.
Al analizar las gráficas correspondientes, se observa que el número de vasos que menos consumen los estudiantes del ITD es 8, ya que la encuesta registró una cantidad pequeña en comparación con los demás casos.
Este tipo de análisis es importante para entender los patrones de consumo de agua de los estudiantes y puede ser útil para la planificación y la toma de decisiones en áreas como la salud y la nutrición.
Levine, D. M. (2010) Estadística para administración y economía. (7ª. ed.) México : Pearson Educación.
Mendenhall, W. (2010). Introducción a la Probabilidad y Estadística. (13ª. ed.) México: Cengage Learning.
Montgomery, D. C. (2011). Probabilidad y estadística aplicadas a la ingeniería. (2ª. ed.) México : Limusa: Wiley.
Quezada, L. (2010). Estadística para ingenieros. México : Empresa Editora Macro.