Objetivo

Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad,funciones acumuladas, media, varianza y desviación estándar de distribuciones de variables discretas; visualización gráfica relacionada con variables discretas.

Descripción

Desarrollar ejercicios relacionados con variables discretas para identificar variables discretas, las funciones de probabilidad de cada variable, la función acumulada, su visualización gráfica para su correcta implementación.

Se incluye en el caso, media, varianza y desviación estándar de distribuciones de variables discretas.

Los casos son identificados de la literatura relacionada con variables aleatorias discretas. Se deben elaborar tres ejercicios en este caso 13 encontrados en la literatura que se encuentran en el caso 14.

Marco de referencia

Una variable aleatoria es una descripción numérica del resultado de un experimento [@anderson2008c].

Las variables aleatorias deben tomar valores numéricos. En efecto, una variable aleatoria asocia un valor numérico a cada uno de los resultados experimentales.

El valor numérico de la variable aleatoria depende del resultado del experimento. Una variable aleatoria puede ser discreta o continua, depende del tipo de valores numéricos que asuma.[@anderson_estadistica_2008].

Para este documento se tratan únicamente variables del tipo discreta.

En cualquier experimento aleatorio, los resultados se presentan al azar; así, a este se le denomina variable aleatoria. Por ejemplo, lanzar un dado constituye un experimento: puede ocurrir cualquiera de los seis resultados posibles. Cada valor de la variable aleatoria se relaciona con una probabilidad que indica la posibilidad de un resultado determinado [@lind_estadistica_2015].

En su libro [@walpole_probabilidad_2012] define que una variable aleatoria es una función que asocia un número real con cada elemento del espacio muestral.

Una función de probabilidad, una función de masa de probabilidad o una distribución de probabilidad de la variable aleatoria discreta X si, para cada resultado x posible.

Toda función de probabilidad debe ser mayor o igual que $0$. \[f(x) \geq 0\]
La suma de las probabilidad de todas las variables $x$ debe ser igual a $1$ o la suma de los valores de cada función de probabilidad con respecto a $x$ debe ser $1$ \[\sum _xf(x) = 1\]
La probabilidad de cada variable $x$ es igual a la función de probabilidad con respeto a $x$ \[P(X=x) = f(x)\] [@walpole_probabilidad_2012].

Por otra parte, la función de la distribución acumulativa F(x) ó probabilidad acumulada de una variable aleatoria discreta $X$ con distribución de probabilidad $f(x)$ está dada por la suma de sus probabilidades de $t$ siendo $t$ menor o igual a $x$. Es decir, la probabilidad acumulada suma los valores de las funciones de probabilidad a partir del valor inicial de $x$. El valor final con respecto a valor final de $x$ debe ser igual a 1. \[F(x)=P(X \le x) = \sum_{t \le x}f(t)\] [@walpole_probabilidad_2012].

La media de una distribución discreta es también recibe el nombre de valor esperado. Se trata de un promedio ponderado de los posibles valores de una variable aleatoria se ponderan con sus correspondientes probabilidades de ocurrencia [@lind_estadistica_2015]

La fórmula para el valor esperado es: \[\mu = \sum x \cdot P(x)\]

La varianza de una distribución discreta constituye un valor típico para resumir una distribución de probabilidad discreta, describe el grado de dispersión (variación) en una distribución [@lind_estadistica_2015].

Su fórmula es: \[\alpha^2 = \sum(x-\mu)^2\cdot P(x)\]

La fórmula anterior significa:

La media se resta de cada valor de la variable aleatoria y la diferencia se eleva al cuadrado.

Cada diferencia al cuadrado se multiplica por su probabilidad.

Se suman los productos resultantes para obtener la varianza.

La desviación estándar, $\alpha$, se determina al extraer la raíz cuadrada positiva de $\alpha^2$; es decir, $\alpha = \sqrt{\alpha^2}$ [@lind_estadistica_2015].

Desarrollo

Cargar librerías

Posiblemente se utilicen algunas de ellas

```{r warning=FALSE, message=FALSE} library(ggplot2) library(stringr) # String library(stringi) # String library(gtools) library(dplyr) library(knitr)

library(kableExtra) # Para tablas amigables options(scipen = 999) # Notación normal


## Ejercicios

-   Para cada ejercicio algunos vistos en el caso anterior y otros nuevos para este caso, se describe y define su contexto.
-   Se construye su tabla de probabilidad que contenga los valores de la variable aleatoria, la función de probabilidad y su función acumulada, la gráfica de barra de los valores de las variables aleatoria y la gráfica lineal de la función acumulada.
-   Con la tabla de probabilidades en algunos ejercicios se determinan y calculan probabilidades.
-   Se determina el **valor esperado** de cada ejercicio
-   Se determina la **varianza** y la **desviación estándar** de la distribución de las **variables discretas**.

### Billetes para rifa

Se venden 5000 billetes para una rifa a 1 euro cada uno. Existe un único premio de cierta cantidad, calcular los valores de las variables aleatorias y sus probabilidades para 0 para no gana y 1 para si gana cuando un comprador adquiere cincuenta billetes. [@course_hero_variables_nodate].

#### Tabla de probabilidad

```{r}
discretas <- c(0,1)   # 0 Que no gane, 1 que gane
n <- 5000 # sum(casos)
casos <- c(4950,50)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades)   # Acumulada
tabla <- data.frame(x=discretas, 
              casos = casos,
              f.prob.x = probabilidades,
              F.acum.x = acumulada,
              x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")

Valor esperado

Se determina el valor esperado de acuerdo a la fórmula: \[\mu = \sum xP(x)\]

VE es el valor esperado

# VE <- sum(tabla$x * tabla$f.prob.x)
VE <- sum(tabla$x.f.prob.x)
VE

El valor esperado significa la media ponderada de las probabilidades o lo que es lo mismo es lo que se puede esperar.

Significa muy muy muy …. remoto la probabilidad de ganar en el sorteo de 5000 boletos r VE

Varianza

Agregando columna para obtención de la varianza a partir de los datos de la tabla previamente generada.

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
#tabla 
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")

\[\alpha^2 = \sum(x-\mu)^2P(x)\]

varianza = varianza de la distribución

varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza

Desviación estándard de una distribución discreta

La raiz cuadrada de la varianza \[\alpha = \sqrt{ \alpha^2 }\]
desv.std = desviación estándard

desv.std <- sqrt(varianza)
desv.std

La tabla con las sumatorias

tabla.sumatorias <- rbind(tabla, apply(tabla, 2, sum))
tabla.sumatorias[nrow(tabla.sumatorias), c(1,4,6)] <- '****'
kable(tabla.sumatorias, caption = "Tabla de probabilidad con sumatorias")

Gráfica de barra

ggplot(data = tabla, aes(x = x, y=f.prob.x, fill=x)) +
  geom_bar(stat="identity")

Gráfica lineal acumulada

ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
  geom_point(colour="blue") + 
  geom_line(colour="red")

Automóviles de Pelican Ford

Un vendedor llamado John Rasgdale vende la mayor cantidad de automóviles el sábado, así que desarrolló la siguiente distribución de probabilidades, en la cual se muestra la cantidad de automóviles que espera vender un sábado determinado.

La variable discreta venta de automóviles: $0,1,2,3,4$ el sábado. Los valores de la probabilidad son : $0.1, 0.2, 0.3, 0.3, 0.1$, previamente definidos.
Ya se dan las probabilidades de tal forma que la cantidad de casos no se dispone en este ejercicio.
¿De qué tipo de distribución se trata?, variables discretas
¿Cuántos automóviles espera vender John un sábado normal?
¿Cuál es la varianza de la distribución? [@lind_estadistica_2015].

Tabla de probabilidad

discretas <- 0:4   
casos <- rep(0, 5)
probabilidades <- c(0.1, 0.2, 0.3, 0.3, 0.1)
acumulada <- cumsum(probabilidades)   # Acumulada
tabla <- data.frame(x=discretas, 
              casos = casos,
              f.prob.x = probabilidades,
              F.acum.x = acumulada,
              x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado (sin número de casos)")

Cálculo de probabilidades

¿Cuál es la probabilidad de que se vendan DOS automóviles, es decir $f(x=2)$ ó $P(x=2)$?, 30%

filter(tabla, x == 2 ) %>%
  select(x, f.prob.x)

¿Cuál es la probabilidad de que se vendan MENOS DE DOS automóviles, es decir $f(x< 2)$ ó $P(x<2)$ ? 30%

\[ \sum P(x=0) + P(x=1) \]

filter(tabla, x < 2 ) %>%
  select(x, f.prob.x, F.acum.x)

¿Cuál es la probabilidad de que se vendan MAS DE DOS automóviles, es decir $f(x> 2)$ ó $P(x>2)$ ? 40%

\[ \sum P(x=3) + P(x=4) \text{ ó } \]

\[ 1 - \sum P(x=0) + P(x=1) + P(x=2) \]

filter(tabla, x > 2 ) %>%
  select(x, f.prob.x, F.acum.x)

Valor esperado

Se determina el valor esperado de acuerdo a la fórmula: \[\mu = \sum x \cdot P(x)\]

VE es el valor esperado

VE <- sum(tabla$x * tabla$f.prob.x)
VE

El valor esperado significa la media ponderada de las probabilidades o lo que es lo mismo es lo que se puede esperar.

Varianza

Agregando columna para obtención de la varianza a partir de los datos de la tabla previamente generada.

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza  (sin número de casos)")

\[\alpha^2 = \sum(x-\mu)^2\cdot P(x)\]

varianza = varianza de la distribución

varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza

Desviación estándar de una distribución discreta

La raiz cuadrada de la varianza \[\alpha = \sqrt{ \alpha^2 }\]
desv.std = desviación estándard

desv.std <- sqrt(varianza)
desv.std

La tabla con las sumatorias

tabla.sumatorias <- rbind(tabla, apply(tabla, 2, sum))
tabla.sumatorias[nrow(tabla.sumatorias), c(1,2,4,6)] <- '****'
kable(tabla.sumatorias, caption = "Tabla de probabilidad con sumatorias,(sin número de casos)")

Gráfica de barra

ggplot(data = tabla, aes(x = x, y=f.prob.x, fill=x)) +
  geom_bar(stat="identity")

Gráfica lineal acumulada

ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
  geom_point(colour="blue") + 
  geom_line(colour="red")

Solicitudes de puestos de hombres y mujeres

Una compañía tiene cinco solicitantes para dos puestos de trabajo: dos mujeres y tres hombres. Suponga que los cinco solicitantes son igualmente calificados y que no hay preferencia para elegir su género al igual que no importa el orden de género de hombres y mujeres (combinaciones).

Sea $x$ la variable aleatoria discreta al número de mujeres elegidas para ocupar los dos puestos de trabajo. Encuentre las probabilidades para elegir 0 mujeres, 1 mujer o 2 mujeres. [@mendenhall_introduccion_2010].

Haciendo las combinaciones en donde $M = Mujer \text{ y }H = Hombre$

personas <- c("H1", "H2", "H3", "M1", "M2")
S.espacio.muestral <- combinations(n = 5, r = 2, v=personas)
S.espacio.muestral

De acuerdo al espacio muestral $n$ con diez elementos, ¿en cúantas ocasiones hay cero mujeres?, ¿en cuántas ocasiones hay una mujer? y en cuántas ocasiones hay dos mujeres?

discretas <- c(0, 1, 2)
casos <- c(3, 6, 1 )
n <- sum(casos)
probabilidades <- casos / n

Tabla de probabilidades

acumulada <- cumsum(probabilidades)   # Acumulada
tabla <- data.frame(x=discretas, 
              casos = casos,
              f.prob.x = probabilidades,
              F.acum.x = acumulada,
              x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")

Cálculo de probabilidades

¿Cuál es la probabilidad de que haya UNA MUJER?, es decir $P(X=1)$ ó $f(x=1)$ ? 60%

filter(tabla, x == 1 ) %>%
  select(x, f.prob.x)

¿Cuál es la probabilidad de que haya MENOS DE DOS MUJERES?, es decir $P(x=0) + P(x=1)$ ó $f(x<2)$ ? 90%

filter(tabla, x < 2 ) %>%
  select(x, f.prob.x, F.acum.x)

¿Cuál es la probabilidad de que haya MAS DE 1 MUJER O SEA DOS?, es decir $P(x=2)$ ó $f(x>1)$ ? 10%

filter(tabla, x > 1 ) %>%
  select(x, f.prob.x, F.acum.x)

Valor esperado

Se determina el valor esperado de acuerdo a la fórmula: \[\mu = \sum x \cdot P(x)\]

VE es el valor esperado

VE <- sum(tabla$x * tabla$f.prob.x)
VE

Varianza

\[\alpha^2 = \sum(x-\mu)^2 \cdot P(x)\]

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")

Calculando la varianza

varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza

Desviación estándar

\[\alpha = \sqrt{ \alpha^2 }\]

Con la raiz cuadrada de la varianza se determina la desviación estándard de la distribución de variables aleatorias.

desv.std <- sqrt(varianza)
desv.std

Tabla con sumatorias

tabla.sumatorias <- rbind(tabla, apply(tabla, 2, sum))
tabla.sumatorias[nrow(tabla.sumatorias), c(1,4,6)] <- '****'
kable(tabla.sumatorias, caption = "Tabla de probabilidad con sumatorias")

Gráfica de barra

ggplot(data = tabla, aes(x = x, y=f.prob.x, fill=x)) +
  geom_bar(stat="identity")

Gráfica lineal acumulada

ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
  geom_point(colour="blue") + 
  geom_line(colour="red")

Número de hijos de parejas

En la siguiente tabla se presenta la distribución del número de hijos de un grupo de 100 parejas (humanos): Ejercicio extraído de: [@web_descartes_estadistica_2018].

variable aleatoria x No hijos	cantidad de parejas
0	15
1	40
2	23
3	10
4	7
5	4
6	1
Total parejas encuestadas	100

discretas <- c(0, 1, 2, 3, 4, 5, 6)
casos <- c(15, 40, 23, 10, 7, 4, 1 )
n <- sum(casos)
probabilidades <- casos / n

Tabla de probabilidades

acumulada <- cumsum(probabilidades)   # Acumulada
tabla <- data.frame(x=discretas, 
              casos = casos,
              f.prob.x = probabilidades,
              F.acum.x = acumulada,
              x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")

Cálculo de probabilidades

¿Cuál es la probabilidad de encontrar aletoriamente parejas con TRES HIJOS, es decir, $f(x=3)$ ó $P(x=3)$ 10%

filter(tabla, x == 3 ) %>%
  select(x, f.prob.x, F.acum.x)

¿Cuál es la probabilidad de encontrar aleatoriamente parejas con MENOS DE TRES HIJOS, es decir, $f(x<3)$ ó $\sum f(x={0,1,2})$ ó $\sum P(x=0) + P(x=1) + P(x=2)$ ó $F \text{ acumulada }(x)$

78%

filter(tabla, x < 3 ) %>%
  select(x, f.prob.x, F.acum.x)

¿Cuál es la probabilidad de encontrar aleatoriamente parejas con MAS DE TRES HIJOS, es decir, $f(x>3)$ ó $\sum f(x={4,5,6})$ ó $\sum P(x=4) + P(x=5) + P(x=6)$ ó $1 - F(x = 3)$; 12%

filter(tabla, x > 3 ) %>%
  select(x, f.prob.x, F.acum.x)

Valor esperado

Se determina el valor esperado de acuerdo a la fórmula: \[\mu = \sum x \cdot P(x)\]

VE es el valor esperado

VE <- sum(tabla$x * tabla$f.prob.x)
VE

Varianza

\[\alpha^2 = \sum(x-\mu)^2 \cdot P(x)\]

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")

Calculando la varianza

varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza

Desviación estándar

\[\alpha = \sqrt{ \alpha^2 }\]

Con la raiz cuadrada de la varianza se determina la desviación estándard de la distribución de variables aleatorias.

desv.std <- sqrt(varianza)
desv.std

Tabla con sumatorias

tabla.sumatorias <- rbind(tabla, apply(tabla, 2, sum))
tabla.sumatorias[nrow(tabla.sumatorias), c(1,4,6)] <- '****'
kable(tabla.sumatorias, caption = "Tabla de probabilidad con sumatorias")

Gráfica de barra

ggplot(data = tabla, aes(x = x, y=f.prob.x, fill=x)) +
  geom_bar(stat="identity")

Gráfica lineal acumulada

ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
  geom_point(colour="blue") + 
  geom_line(colour="red")

Lanzamiento de un dado

Se lanza un dado perfecto 240 veces, se anota el resultado obtenido en la cara superior obteniendo los siguientes resultados:

Cara superior	1	2	3	4	5	6
Número de veces	40	39	42	38	42	39

Para este caso del lanzamiento de un dado al igual que del caso siguiente de la cantidad de vasos que toman los estudiantes del ITD, se utiliza una función f.discretas.ve.v.sd(casos = …) que fue previamente codificada y preparada para dar solución específica de estos casos en relación al tema de variables aleatorias discretas.

La función se encuentra en la dirección UR siguiente: https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/Agosto-Diciembre%202022/funciones/variables%20discretas.R

La función se carga usando la función source() que carga el programa que contiene la función.

Cargando la función

Al cargar el script, se puede disponer de la función y mandarla ejecutar con los argumentos y parámetros adecuados.

source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/Agosto-Diciembre%202022/funciones/variables%20discretas.R", encoding = "UTF-8")

Inicializando variables

discretas <- c(0, 1, 2, 3, 4, 5)
casos <- c(40, 39,  42, 38, 42, 39 )
n <- sum(casos)
probabilidades <- casos / n

Al ejecutar la función se obtiene una estructura de datos tipo lista (list[[]]) de 6 elementos:

El primero elemento la es un data.frame que contiene la tabla de distribución.
El segundo elemento son los valores de la variable aleatoria discreta denominada x.
El tercer elemento es el valor del total de casos.
El cuarto elemento es el valor esperado o esperanza matemática.
El quinto elemento es la varianza.
El sexto elemento de la lista es el valor de la desviación estándar de la tabla de distribución de la variable discreta.

resultado <- f.discretas.ve.v.sd(casos = casos)

Tabla de probabilidad

resultado[[1]] %>%
  kbl(caption = "Tabla de distribución de probabilidad del lanzamiento del dado", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
  kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>% 
 kable_paper("hover")

Cálculo de probabilidades

¿Cuál es la probabilidad de que el dado caiga un DOS, es decir $f(x=2)$?

resultado[[1]] %>%
  kbl(caption = "Tabla de distribución de probabilidad del lanzamiento del dado", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
  kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>%
  column_spec(column = 3, color = "white", background = "blue") %>%
  row_spec(3, bold = T, color = "white", background = "blue")

¿Cuál es la probabilidad de que el dado caiga en CUATRO, es decir $f(x=4)$?

resultado[[1]] %>%
  kbl(caption = "Tabla de distribución de probabilidad del lanzamiento del dado", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
  kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>%
  column_spec(column = 3, color = "white", background = "blue") %>%
  row_spec(5, bold = T, color = "white", background = "blue")

¿Cuál es la probabilidad de que el dado caiga MENOR QUE CUATRO, es decir $F(x < 4)$?

resultado[[1]] %>%
  kbl(caption = "Tabla de distribución de probabilidad del lanzamiento del dado", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
  kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>%
  column_spec(column = 4, color = "white", background = "blue") %>%
  row_spec(4, bold = T, color = "white", background = "blue")

¿Cuál es la probabilidad de que el dado caiga MAYOR QUE CUATRO, es decir $F(x > 4) = 1 - F(x>4) = 1 - F(x=5)$

resultado[[1]] %>%
  kbl(caption = "Tabla de distribución de probabilidad del lanzamiento del dado", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
  kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>%
  column_spec(column = 3, color = "white", background = "blue") %>%
  row_spec(6, bold = T, color = "white", background = "blue")

Valor esperado

paste("El valor esperado es: ", round(resultado[[4]], 4))

Varianza

paste("La varianza es: ", round(resultado[[5]], 4))

Desviación estándar

paste("La desviación estándar es: ", round(resultado[[6]], 4))

Tabla de sumatorias

Pendiente

Gráfica de barra

Pendiente

Gráfica acumulada

Pendiente

Tomar vasos de agua ITD

Se tiene un estudio de que en época de calor los estudiantes del Tecnológico consumen cierta cantidad de vasos de agua durante el dia.

Se estima que se toman al alrededor de 1 a 8 vasos diarios durante el día para aliviar la sed y hidratar el cuerpo.

La siguiente tabla establece la cantidad de vasos que toman los alumnos durante el día siendo x la variable aleatoria discreta los vasos que se toman.

De un estudio de 150 alumnos esas fueron las respuestas.

x = vasos de agua	casos
0	8
1	12
2	16
3	19
4	24
5	28
6	25
7	14
8	4

Inicializando variables

X <- c(0, 1, 2, 3, 4, 5, 6, 7, 8)
casos <- c(8, 12,  16, 19, 24, 28, 25, 14, 4 )
n <- sum(casos)
probabilidades <- casos / n

Para determinar el valor esperado, la varianza y la desviación estándar de esta distribución de los casos de agua, se utiliza una función previamente creada y codificada para dicho propósito.

Ejecutar la función

Al ejecutar la función se obtiene una estructura de datos tipo lista (list[[]]) de 6 elementos:

El primero elemento la es un data.frame que contiene la tabla de distribución
El segundo elemento son los valores de la variable aleatoria discreta denominada x
El tercer elemento es el valor del total de casos
El cuarto elemento es el valor esperado o esperanza matemátic
El quinto elemento es la varianza y
El sexto elemento de la lista es el valor de la desviación estándar de la tabla de distribución de la variable discreta.

resultado <- f.discretas.ve.v.sd(casos = casos)

Tabla de probabilidad

resultado[[1]] %>%
  kbl(caption = "Tabla de distribución de probabilidad del lanzamiento del dado", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
  kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>% 
 kable_paper("hover")

Cálculo de probabilidades

¿Cuál es la probabilidad de que se elija aleatoriamente un alumno y mencione que se toman CUATRO VASOS DE AGUA? $f(x=4)$

resultado[[1]] %>%
  kbl(caption = "Tabla de distribución de probabilidad de toma de vasos de agua alumnos", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
   kable_paper("hover") %>%
  kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>%
  column_spec(column = 3, color = "white", background = "blue") %>%
  row_spec(5, bold = T, color = "white", background = "blue")

¿Cuál es la probabilidad de que se elija aleatoriamente un alumno y mencione que se toma MENOS DE CUATRO VASOS DE AGUA $F(x=3)$?

resultado[[1]] %>%
  kbl(caption = "Tabla de distribución de probabilidad de toma de vasos de agua alumnos", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
   kable_paper("hover") %>%
  kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>%
  column_spec(column = 4, color = "white", background = "blue") %>%
  row_spec(4, bold = T, color = "white", background = "blue")

¿Cuál es la probabilidad de que se elija aleatoriamente un alumno y mencione que se toma MAS DE CUATRO VASOS DE AGUA $F(x>4) = 1 - F(x>4) = 1 - F(x=5)$?

resultado[[1]] %>%
  kbl(caption = "Tabla de distribución de probabilidad de toma de vasos de agua alumnos", col.names = c("$x$", "$casos$", "$f(x)$", "$F(x)$", "$x\\cdot f(x)$", "$VE$", "$(VE-x)$", "$(VE-x)^{2}$", "$(VE-x)^{2} \\cdot f(x)$")) %>%
   kable_paper("hover") %>%
  kable_styling(full_width = F, bootstrap_options = c("striped", "bordered", "condensed")) %>%
  column_spec(column = 4, color = "white", background = "blue") %>%
  row_spec(6, bold = T, color = "white", background = "blue")

Valor esperado

paste("El valor esperado es: ", round(resultado[[4]], 4))

o puede acceder al valor mediante el nombre del elemento de la lista $VE:

paste("El valor esperado es: ", round(resultado$VE, 4))

Varianza

paste("La varianza es: ", round(resultado[[5]], 4))

o puede acceder al valor mediante el nombre del elemento de la lista $varianza:

paste("La varianza es: ", round(resultado$varianza, 4))

Desviación estándar

paste("La desviacion estándar es: ", round(resultado[[6]], 4))

o puede acceder al valor mediante el nombre del elemento de la lista $desv,std:

paste("La varianza es: ", round(resultado$desv.std, 4))

Tabla de sumatorias

Pendiente

Gráfica de barra

Pendiente

Gráfica acumulada

Pendiente

Interpretación de los ejercicios del caso

Se presentaron varios ejercicios de variables aleatorias discretas en donde se determiniaron las funciones de probabilidad y la función acumulada, la media o valor esperado, la varianza y su desviación estándard.

Se generaron gráficas de barras de los valores de las variables y la gráfica lineal de las tendencias.

El valor esperado en el ejercicio 1 del sorteo con valor de 1%, significa que es es muy muy muy …. remoto la probabilidad de ganar en el sorteo de 5000 boletos.

En el ejercicio de vena de automóviles de John, se trata de una distribución de probabilidad discreta de la variable aleatoria “número de automóviles vendidos”.

El valor esperado es del 2.1 que significa que puede vender 2 autos como esperanza.

El valor esperado se utiliza para predecir la media aritmética de la cantidad de automóviles vendidos a largo plazo. Por ejemplo, si John trabaja $50$ sábados en un año, puede esperar vender $(50)(2.1)$ o $105$ automóviles solo durante los sábados. Por consiguiente, a veces la media recibe el nombre de valor esperado[@lind2015].

El valor de la varianza es de 1.29 que significa lo que puede variar con respecto al valor esperado. La desviación estándard es de $1.135782$.

¿Cómo se interpreta la variación?

Por ejemplo, Si la vendedora Rita Kirsch también vendió un promedio de 2.1 automóviles los sábados pero tien tal vez una desviacón de 1.9 en comparación del 1.135782 de John, entonces de puede decir que hay mayor variabilidad en la vendedora Rita dado que $(1.91 \geq 1.35)$ [@lind2015].

En el caso de las vacantes de puestos para hombres y mujeres el resultado del valor esperado es de $0.8$ que significa la probabilidad de contratar mujeres en promedio, su desviación estándar es de $0.6$ que significa nivel de dispersión (alejamiento) de la probabilidad de cada variable aleatoria con respecto al valor esperado.

Del ejercicio de parejas contestar las preguntas:

¿Cuál es la probabilidad de una pareja elegida al azar tenga menos de dos hijos? $P(x<2)$
¿Cuál es la probabilidad de que tenga más de tres hijos? $P(x>3)$
Si se elige un hijo al azar, ¿cuál es la probabilidad de que no tenga hermanos? $P(x=0)$
Determina el número de hijos esperado al seleccionar una familia al azar. ¿Cuál es el valor esperado y qué significa?

valor esperado: 1.7 El valor esperado significa o se puede sacar sumando los valores aleatorios y el resultado multiplicarlo por el valor del suceso aleatorio a esto tambien se le puede conocer como la media o promedio de las probabilidades.

Calcula la varianza y la desviación de la distribución e interpretar su significado.

varianza: 1.81 desviación: 1.345362 Una variable aleatoria es una medida de su dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media. La desviación estándar, la raíz cuadrada de la varianza, es una medida de dispersión alternativa expresada en las mismas unidades.

Interpretar el ejercicio del dado

En general las probabilidades de que aparezca cierto número en la cara del dado es la misma, del 1-6 claro esta. Al calcular el valor esperado es de 3.5, lo que quiere decir que se espera que el dado caiga con un valor de 3-4

Interpretar el ejercicio de los vasos de agua

Se espera que las personas consuman alrededor de 4.1 vasos de agua al día según el valor esperado, pero en la gráfica de barras podemos observar que la mayoria de individuos consume hasta 5 vasos de agua diarios.

Referencias bibliográficas

@book{anderson_estadistica_2008, location = {Australia • Brasil • Corea • España • Estados Unidos • Japón • México • Reino Unido • Singapur}, edition = {10}, title = {Estadística para administración y economía}, isbn = {13: 978-607-481-319-7}, publisher = {Cengage Learning,}, author = {Anderson, David R. and Sweeney, Dennis J. and Williams, Thomas A.}, date = {2008}, }

@book{cevallos_enfoque_2018, location = {Guayaquil, Guayas, Ecuador}, title = {Enfoque didáctico de la teoría de conjuntos y probabilidades}, isbn = {978-1-59973-593-1}, publisher = {Asociación Latinoamericana de Ciencias Neutrosóficas Facultad de Ciencias Matemáticas y Físicas Universidad de Guayaquil}, author = {Cevallos, Lorenzo and Zambrano, Jorge and Leyva, Maikel and {Yudelnabis} and Smarandache, Florentin}, date = {2018}, }

@online{benitez_morales_probabilidad_nodate, title = {Probabilidad y estadística, apuntes digitales.}, url = {http://cidecame.uaeh.edu.mx/lcc/mapa/PROYECTO/libro19/index.html}, author = {Benítez Morales, Alejandro}, }

@online{matemovil_probabilidad_nodate, title = {Probabilidad condicional, ejercicios resueltos}, url = {https://matemovil.com/probabilidad-condicional-ejercicios-resueltos/}, author = {{matemovil}}, }

@book{walpole_probabilidad_2007, location = {México}, edition = {Octava Edición}, title = {Probabilidad y estadística para ingeniería y ciencias}, isbn = {978-970-26-0936-0}, publisher = {Pearson Education}, author = {Walpole, Ronald E. and Myers, Raymond H. and Myers, Sharon L. and Ye, Keying}, date = {2007}, }

@book{walpole_probabilidad_2012, location = {México}, edition = {Novena Edición}, title = {Probabilidad y estadística para ingeniería y ciencias}, isbn = {978-607-32-1417-9}, abstract = {Novena Edición}, publisher = {Pearson}, author = {Walpole, Ronald E. and Myers, Raymond H. and Myers, Sharon L.}, date = {2012}, }

@online{hotmath_hotmath_nodate, title = {{HotMath}}, url = {https://www.varsitytutors.com/hotmath/hotmath_help/spanish/topics/conditional-probability}, author = {{HotMath}}, }

@article{urrutia_mosquera_evaluacion_2011, title = {Evaluación de la robustez de un modelo de regresión múltiple para predecir las ventas diarias de un hipermercado en Pereira, Risaralda}, issn = {0122-1701}, url = {https://www.researchgate.net/publication/237041228_EVALUACION_DE_LA_ROBUSTEZ_DE_UN_MODELO_DE_REGRESION_MULTIPLE_PARA_PREDECIR_LAS_VENTAS_DIARIAS_DE_UN_HIPERMERCADO_EN_PEREIRA_RISARALDA}, abstract = {En este trabajo se evalúa la robustez de un modelo de regresión lineal múltiple, usado para predecir las ventas diarias en un departamento de un almacén hipermercado en la ciudad de Pereira. Se evalúa el nivel de adecuación de esta técnica para el caso de estudio a partir de la verificación de supuestos, el nivel de explicación del R2, y validación de la hipótesis: βk ≠ 0.}, author = {Urrutia Mosquera, Jorge Andrés}, date = {2011}, }

@online{contentnrocorg_probabilidad_nodate, title = {Probabilidad de Eventos Independientes}, url = {https://content.nroc.org/Algebra.HTML5/U12L2T2/TopicText/es/text.html}, author = {{content.nroc.org}}, }

@online{hero_variables_nodate, title = {Variables aleatorias - Variables aleatorias problemas…}, url = {https://www.coursehero.com/file/14618142/Variables-aleatorias/}, author = {Hero, Course}, }

@book{lind_estadistica_2015, location = {México, D.F.}, edition = {Decimo Sexta}, title = {Estadística aplicada a los negocios y la economía}, isbn = {978-607-15-1303-8}, publisher = {{McGraw}-Hill}, author = {Lind, Douglas and Marchal, William and Wathen, Samuel}, date = {2015}, }

@book{mendenhall_introduccion_2006, edition = {13a Edición}, title = {Introducción a la probabilidad y estadística}, isbn = {978-0-495-38953-8}, author = {Mendenhall, William and Beaver, Robert J. and Beaver, Barbara M.}, date = {2006}, }

@book{hernandez_modelos_2020, title = {Modelos predictivos}, url = {https://fhernanb.github.io/libro_mod_pred/}, author = {Hernández, Freddy}, date = {2020}, }

@online{pizarro_arboles_2020, title = {Arboles de regresion para predecir el precio de casas en Melbourne}, url = {https://rpubs.com/rpizarro/581253}, author = {Pizarro, Rubén}, date = {2020}, }

@online{aqueronte_r_2009, title = {R: Distribución Uniforme}, url = {http://unbarquero.blogspot.com/2009/05/r-distribucion-uniforme.html}, author = {{Aqueronte}}, date = {2009}, }

@video{flores_rujel_distribucion_nodate, title = {Distribución Uniforme}, url = {https://www.youtube.com/watch?v=p_uyYHvADno}, author = {Flores Rujel, Carlos}, }

@online{noauthor_distribucion_nodate, title = {La distribución binomial o de Bernoulli}, url = {https://www.profesor10demates.com/2014/04/la-distribucion-binomial-o-de-bernoulli_3.html}, }

@online{camacho_avila_probabilidad_2019, title = {Probabilidad y Estadística. Modelos probabilísticos.}, url = {http://148.215.1.182/bitstream/handle/20.500.11799/108238/secme-34236_1.pdf?sequence=1}, author = {Camacho Avila, Marcela}, date = {2019}, }

@misc{matemovil_matemovil_nodate, title = {Matemovil. Distribución normal, ejercicios resueltos}, url = {https://matemovil.com/distribucion-normal-ejercicios-resueltos/}, author = {{matemovil}}, }

@book{hernandez_sampieri_metodologiinvestigacion_2014, edition = {Sexta}, title = {Metodología de la Investigación}, isbn = {978-1-4562-2396-0}, author = {Hernández Sampieri, Roberto and Fernández Collado, Carlos and Baptista Lucio, María del Pilar}, date = {2014}, }

@online{amat_rodrigo_correlacion_2016, title = {Correlación lineal y Regresión lineal simple}, url = {https://www.cienciadedatos.net/documentos/24_correlacion_y_regresion_lineal}, author = {Amat Rodrigo, Joaquín}, date = {2016}, }

@article{soto_espinosa_statistics_2020, title = {Statistics and health at work Descriptive statistics (I): Variables and frequencies}, url = {https://rist.zaragoza.unam.mx/index.php/rist/article/view/232/173}, journaltitle = {{RIST}. Revista de Investigación}, author = {Soto Espinosa, Juan Luis}, date = {2020-07-12}, }

@book{boccardo_bosoni_rstudio_2019, title = {{RStudio} para Estadística Descriptiva en Ciencias Sociales.}, url = {https://bookdown.org/gboccardo/manual-ED-UCH/}, abstract = {Manual de apoyo docente para la asignatura Estadística Descriptiva. Carrera de Sociología, Universidad de Chile (segunda edición)}, publisher = {Editado y publicado con bookdown}, author = {Boccardo Bosoni, Gorgio and Ruiz Bruzzone, Felipe}, date = {2019}, }

@book{ismay_statistical_2021, title = {Statistical Inference via Data Science A {ModernDive} into R and the Tidyverse}, url = {https://moderndive.netlify.app/index.html}, publisher = {Creative Commons Attribution-{NonCommercial}-{ShareAlike} 4.0 International License.}, author = {Ismay, Chester and Kim, Albert}, date = {2021}, }

@book{devore_fundamentos_2016, edition = {Primera Edición}, title = {Fundamentos de Probabilidad y Estadística}, isbn = {978-607-526-663-3}, publisher = {{CENGAGE}}, author = {Devore, Jay L.}, date = {2016}, }

@book{pizarro_ciencia_2020, location = {Durango, Dgo. México}, title = {Ciencia de los Datos. Propuestas y casos de uso}, abstract = {El libro que lleva por nombre “Ciencia de los Datos. Propuestas y casos de uso”, se plantean temas, casos y propuestas de implementación de aspectos relacionados con Ciencia de los Datos, incluye títulos tales como: Bases de datos {SQL} y {NoSQL}. Comparativo {SQL} server & {MongoDB}; Comparación de herramientas para visualización de datos (Tableau - Power {BI}); Big Data y su impacto en la sociedad; R como herramienta de Ciencia de los Datos aplicada a la productividad; Big Data: Análisis de estrategias de marketing digital; Comparativo de herramientas para análisis y visualización de datos: Tableau y R; Análisis de datos masivos en el campo de la salud; Herramientas de Big Data; Ciencia de los Datos aplicado en las Pymes; Análisis de Datos Geoespaciales en Protección Civil utilizando R y Python; Machine Learning aplicado a la salud; Análisis comparativo y uso de R y Python enfocado al análisis descriptivo de datos de una entidad financiera.}, publisher = {Universidad Pedagógica de Durango}, author = {Pizarro, Rubén and Rodríguez, José G. and Rodríguez, Marco A. and Calzada, Jeorgina}, date = {2020}, }

@misc{foundation_r_2021, title = {The R Project for Statistical Computing}, url = {https://www.r-project.org/}, author = {Foundation, The R.}, date = {2021}, }

@misc{fundation_comprehensive_2021, title = {The Comprehensive R Archive Network. Download and Install R}, url = {https://cran.itam.mx/}, author = {Fundation, R.}, date = {2021}, }

@misc{jsonorg_introducing_nodate, title = {Introducing {JSON}}, url = {https://www.json.org/json-en.html}, author = {{json.org}}, }

@article{fuchs_doing_2018, title = {Doing your first sentiment analysis in R with Sentimentr}, url = {https://towardsdatascience.com/doing-your-first-sentiment-analysis-in-r-with-sentimentr-167855445132}, author = {Fuchs, Matti}, date = {2018}, }

@misc{mendoza_r_nodate, title = {R para principantes}, url = {https://bookdown.org/jboscomendoza/r-principiantes4/}, author = {Mendoza, Juan}, }

@misc{zang_prediccion_2020, title = {Predicción De Las Rentas De Un Censo Mediante Regresión Logística Y Regresión Logística Robusta}, url = {http://diposit.ub.edu/dspace/bitstream/2445/172133/1/TFG_ZangJinduo.pdf}, abstract = {En la regresión logística simple, las observaciones que son consideradas atípicas influyen en gran medida los resultados que arroja el modelo por los fundamentos en los cuales se rige, haciendo que éstos sean imprecisos, poco fiables y, en consecuencia, las conclusiones que se puede extraer también sean poco fiables. Con el presente trabajo, se pretende aplicar una extensión robusta llamada regresión logística robusta para tratar de corregir dicho problema.}, publisher = {Universitad de Barcelona. Departamento de Econometría, Estadística y Economía Aplicada}, author = {Zang, Jindu}, date = {2020}, }

@misc{uniform_distribucion_nodate, title = {Distribución uniforme continua en R}, url = {https://r-coder.com/distribucion-uniforme-r/#:~:text=Distribuci%C3%B3n%20uniforme%20continua%20en%20R&text=La%20distribuci%C3%B3n%20uniforme%20es%20una,distribuci%C3%B3n%20acumulan%20la%20misma%20probabilidad.}, author = {Uniform, R. {CODER}}, }

@misc{lifeder_distribucion_nodate, title = {Distribución uniforme continua: características, ejemplos, aplicaciones}, url = {https://www.lifeder.com/distribucion-uniforme-continua/}, author = {{lifeder}}, }

@misc{binom_funcion_nodate, title = {La función dbinom}, url = {https://r-coder.com/distribucion-binomial-r/}, author = {Binom, R. {CODER}}, }

@misc{hernandez_manual_2021, title = {Manual de R. Distribuciones discretas}, url = {https://fhernanb.github.io/Manual-de-R/}, author = {Hernández, Freddy}, date = {2021}, }

@misc{gestiopolis_que_nodate, title = {¿Qué es la distribución de Poisson?}, url = {https://www.gestiopolis.com/que-es-la-distribucion-de-poisson/}, author = {{gestiopolis}}, }

@book{quintela_estadistica_2019, title = {Estadística Básica Edulcorada}, url = {https://bookdown.org/aquintela/EBE/}, abstract = {En este libro se usa R y {RStudio} (entorno gráfico para utilizar R)}, author = {Quintela, Alejandro}, date = {2019}, }

@misc{canas_distribucion_nodate, title = {Distribución hipergeométrica}, url = {https://proyectodescartes.org/iCartesiLibri/materiales_didacticos/EstadisticaProbabilidadInferencia/VAdiscreta/4_1DistribucionHipergeometrica/index.html}, author = {Cañas, Juan Jesús}, }

@misc{uc3m_introduccion_nodate, title = {Introducción a la estadística y probabilidad}, url = {http://halweb.uc3m.es/esp/Personal/personas/mwiper/docencia/Spanish/Introduction_to_Statistics/intro_continuous2.pdf}, abstract = {Universidad Carlos {III} de Madrid}, author = {{UC3M}}, }

@book{bagnato_aprende_2020, edition = {Kindle}, title = {Aprende Machine Learning en Español}, url = {https://leanpub.com/aprendeml}, abstract = {El Machine Learning -traducido al Español como Aprendizaje Automático- es un subcampo de la Inteligencia Artificial que busca resolver el “cómo construir programas de computadora que mejoran automáticamente adquiriendo experiencia”. El libro es un conjunto de prácticas en Pyhton desarolladas por capítulos en lal que se muestra la construcción, anpalisi e intrepretación de modelos de machine y deep learning}, publisher = {{LeanPub}}, author = {Bagnato, Juan Ignacio}, date = {2020}, }

@misc{hernandez_modelos_2021, title = {Modelos Predictivos}, url = {https://fhernanb.github.io/libro_mod_pred/}, abstract = {En este libro se presentan explicaciones sencillas de algunos modelos de predección y la forma de aplicarlos por medio del lenguaje de programación R.}, author = {Hernández, Freddy}, date = {2021}, }

@misc{garavito_pruebas_2018, title = {Pruebas para verificar la distribución de una variable aleatoria}, url = {http://rstudio-pubs-static.s3.amazonaws.com/433558_30d5068dd9fe45d58243c018c7582fc0.html#:~:text=Los%20an%C3%A1lisis%20de%20normalidad%2C%20tambi%C3%A9n,misma%20media%20y%20desviaci%C3%B3n%20t%C3%ADpica.}, author = {Garavito, Daniel}, date = {2018}, }

@misc{orellana_alvear_arboles_2018, title = {Arboles de decision y Random Forest}, url = {https://bookdown.org/content/2031/}, author = {Orellana Alvear, Johanna}, date = {2018}, }

@misc{irizarry_alisis_2021, title = {Análisis de datos y algoritmos de predicción con R}, url = {https://rafalab.github.io/dslibro/}, publisher = {Creative Commons Attribution-{NonCommercial}-{ShareAlike} 4.0 Internacional {CC} {BY}-{NC}-{SA} 4.0.}, author = {Irizarry, Rafael}, date = {2021}, }

@misc{artola_tamano_2020, title = {Tamaño de la muestra}, url = {https://rpubs.com/osmartola/658826}, abstract = {Tamaño de la muestra}, author = {Artola, J. Osmar}, date = {2020}, }

@misc{surveymonkey_calcula_nodate, title = {Calcula el tamaño de la muestra}, url = {https://es.surveymonkey.com/mp/sample-size-calculator/}, abstract = {Calcula el tamaño de la muestra}, author = {{SurveyMonkey}}, }

@book{lantz_machine_2013, edition = {Kindle}, title = {Machine Learning with R}, author = {Lantz, Brett}, date = {2013}, }

@book{jones_analitica_2019, edition = {Kindle}, title = {Analítica de datos. Una guía esencial para principiantes en minería de datos, recolección de datos, análisis de big data para negocios.}, abstract = {Este libro contiene mucha información clave sobre la analítica de datos, que le ayudará a comprender el concepto de minería de datos, recopilación de datos, análisis de big data para negocios y conceptos de inteligencia empresarial.}, author = {Jones, Herbert}, date = {2019}, }

@misc{data_science_data_2019, title = {{DATA} {SCIENCE}. Evento mutuamente excluyente}, url = {https://datascience.eu/es/matematica-y-estadistica/evento-mutuamente-excluyente-definicion-ejemplos-sindicatos/}, author = {Data Science, Team}, date = {2019}, }

@misc{noauthor_probabilidad_nodate, title = {Probabilidad de Eventos Independientes}, url = {https://content.nroc.org/Algebra.HTML5/U12L2T2/TopicText/es/text.html}, }

@misc{descartes_estadistica_2018, title = {Estadística. Distribuciones aleatorias}, url = {https://ieszaframagon.com/matematicas/estadistica/var_aleatoria/tema5_2.html}, author = {Descartes, Web}, date = {2018}, }

@misc{estadistica_distribucion_2016, title = {Distribución “T” de Student}, url = {https://estadisticaeninvestigacion.wordpress.com/distribucion-t-de-student/}, abstract = {Estadística en Investigación. Aplicación de la Estadística en la Elaboración de Escritos Científicos}, author = {Estadística, Investigación}, date = {2016}, }

@misc{botella-rocamora_inferencia_nodate, title = {Inferencia estadística (intervalos de confianza y p-valor)}, url = {https://www.uv.es/~mamtnez/IECRC.pdf}, abstract = {Comparación de dos poblaciones (test t de comparación de medias, comparación de dos proporciones, comparación de dos varianzas)}, author = {Botella-Rocamora, P and Alacreu-García, M and Martínez-Beneito, M.A}, }

@misc{distribution_t_nodate, title = {The t Distribution and t Tests}, url = {https://rstudio-pubs-static.s3.amazonaws.com/592214_9fa26a362abe49cca103e5f13ae0c60f.html}, author = {Distribution, T.}, }

@misc{editor_entendiendo_2019, title = {Entendiendo las Pruebas t: Valores t y Distribuciones t}, url = {https://blog.minitab.com/es/entendiendo-las-pruebas-t-valores-t-y-distribuciones-t}, author = {Editor, Minitab Blog}, date = {2019}, }

@misc{catania_prueba_2018, title = {Prueba de hipótesis}, url = {https://rpubs.com/acatania/399401}, abstract = {En el campo de la investigación, por lo general los procesos de toma de decisiones comienzan con la identificación de un problema de interés, siguen con el planteo de dos hipótesis que postulan puntos de vista opuestos y, con base a información empírica se concluye con el rechazo de una de ellas y el sostenimiento de la otra En Estadística las dos hipótesis mutuamente excluyentes reciben el nombre de hipótesis nula e hipótesis alternativa, y se expresan en forma simbólica. Un ejemplo de esto último puede ser, respectivamente:}, author = {Catania, Anibal}, date = {2018}, }

@misc{medwave_distribucion_2011, title = {Distribución normal}, url = {https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/5033}, author = {{MedWave}}, date = {2011}, }

@misc{economipedia_intervalo_nodate, title = {Intervalo de confianza}, url = {https://economipedia.com/definiciones/intervalo-de-confianza.html}, author = {{Economipedia}}, }

@misc{noauthor_ejercicios_nodate, title = {Ejercicios y problemas resueltos de probabilidad condicionada}, url = {https://www.matematicasonline.es/BachilleratoCCNN/Primero/ejercicios/Ejercicios%20y%20problemas%20de%20probabilidad%20condicionada.pdf}, }

@misc{fhybear_teorema_nodate, title = {Teorema de Bayes}, url = {https://www.fhybea.com/teorema-bayes.html}, author = {{FHYBEAR}}, }

@article{fhybear_teorema_nodate-1, title = {Teorema de Bayes}, url = {https://www.fhybea.com/teorema-bayes.html}, author = {{FHYBEAR}}, }

@book{lind_estadistica_2015-1, location = {México, D.F.}, edition = {Decimo Sexta}, title = {Estadística aplicada a los negocios y la economía}, publisher = {{McGraw}-Hill}, author = {Lind, Douglas and Marchal, William and Wathen, Samuel}, date = {2015}, }

@book{lind_estadistica_2015-2, location = {México, D.F.}, edition = {Decimo Sexta}, title = {Estadística aplicada a los negocios y la economía}, publisher = {{McGraw}-Hill}, author = {Lind, Douglas and Marchal, William and Wathen, Samuel}, date = {2015}, }

@book{lind_estadistica_2015-3, location = {México, D.F.}, edition = {Decimo Sexta}, title = {Estadística aplicada a los negocios y la economía}, publisher = {{McGraw}-Hill}, author = {Lind, Douglas and Marchal, William and Wathen, Samuel}, date = {2015}, }

@book{quintela_estadistica_2019-1, title = {Estadística Básica Edulcorada}, url = {https://bookdown.org/aquintela/EBE/}, author = {Quintela, Alejandro}, date = {2019}, }

@article{r_coder_binomial_nodate, title = {Binomial distribution in R}, url = {https://r-coder.com/binomial-distribution-r/}, author = {R {CODER}}, }

@article{statology_guide_2019, title = {A Guide to dbinom, pbinom, qbinom, and rbinom in R}, url = {https://www.statology.org/dbinom-pbinom-qbinom-rbinom-in-r/}, author = {{STATOLOGY}}, date = {2019}, }

@book{mendenhall_introduccion_2010, edition = {13}, title = {Introducción a la probabilidad y estadística}, publisher = {Cengage Learning Editores, S.A. de C.V.,}, author = {Mendenhall, William and Beaver, Robert J. and Beaver, Barbara M.}, date = {2010}, }

@misc{matemovil_probabilidad_nodate-1, title = {Probabilidad condicional, ejercicios resueltos}, url = {https://matemovil.com/probabilidad-condicional-ejercicios-resueltos/}, author = {matemovil}, }

@book{devore_fundamentos_2016-1, edition = {Primera Edición}, title = {Fundamentos de Probabilidad y Estadística}, publisher = {{CENGAGE}}, author = {Devore, Jay L.}, date = {2016}, }

@book{anderson_estadistica_2008-1, location = {Australia • Brasil • Corea • España • Estados Unidos • Japón • México • Reino Unido • Singapur}, edition = {10}, title = {Estadística para administración y economía}, publisher = {Cengage Learning,}, author = {Anderson, David R. and Sweeney, Dennis J. and Williams, Thomas A.}, date = {2008}, }

@book{walpole_probabilidad_2012-1, location = {México}, edition = {Novena Edición}, title = {Probabilidad y estadística para ingeniería y ciencias}, publisher = {Pearson}, author = {Walpole, Ronald E. and Myers, Raymond H. and Myers, Sharon L.}, date = {2012}, }

@book{hernandez_modelos_2021-1, title = {Modelos predictivos}, url = {https://fhernanb.github.io/libro_mod_pred/;}, author = {Hernández, Freddy}, date = {2021}, }

@online{pizarro_arboles_2020-1, title = {Arboles de regresion para predecir el precio de casas en Melbourne}, url = {https://rpubs.com/rpizarro/581253}, author = {Pizarro, Rubén}, date = {2020}, }

@book{boccardo_bosoni_rstudio_2019-1, title = {{RStudio} para Estadística Descriptiva en Ciencias Sociales.}, url = {https://bookdown.org/gboccardo/manual-ED-UCH/}, abstract = {Manual de apoyo docente para la asignatura Estadística Descriptiva. Carrera de Sociología, Universidad de Chile (segunda edición)}, publisher = {Editado y publicado con bookdown}, author = {Boccardo Bosoni, Gorgio and Ruiz Bruzzone, Felipe}, date = {2019}, }

@book{ismay_statistical_2021-1, title = {Statistical Inference via Data Science A {ModernDive} into R and the Tidyverse}, url = {https://moderndive.netlify.app/index.html}, publisher = {Creative Commons Attribution-{NonCommercial}-{ShareAlike} 4.0 International License.}, author = {Ismay, Chester and Kim, Albert}, date = {2021}, }

@book{pizarro_ciencia_2020-1, location = {Durango, Dgo. México}, title = {Ciencia de los Datos. Propuestas y casos de uso}, abstract = {El libro que lleva por nombre “Ciencia de los Datos. Propuestas y casos de uso”, se plantean temas, casos y propuestas de implementación de aspectos relacionados con Ciencia de los Datos, incluye títulos tales como: Bases de datos {SQL} y {NoSQL}. Comparativo {SQL} server & {MongoDB}; Comparación de herramientas para visualización de datos (Tableau - Power {BI}); Big Data y su impacto en la sociedad; R como herramienta de Ciencia de los Datos aplicada a la productividad; Big Data: Análisis de estrategias de marketing digital; Comparativo de herramientas para análisis y visualización de datos: Tableau y R; Análisis de datos masivos en el campo de la salud; Herramientas de Big Data; Ciencia de los Datos aplicado en las Pymes; Análisis de Datos Geoespaciales en Protección Civil utilizando R y Python; Machine Learning aplicado a la salud; Análisis comparativo y uso de R y Python enfocado al análisis descriptivo de datos de una entidad financiera.}, publisher = {Universidad Pedagógica de Durango}, author = {Pizarro, Rubén and Rodríguez, José G. and Rodríguez, Marco A. and Calzada, Jeorgina}, date = {2020}, }

@book{bagnato_aprende_2020-1, edition = {Kindle}, title = {Aprende Machine Learning en Español}, url = {https://leanpub.com/aprendeml}, abstract = {El Machine Learning -traducido al Español como Aprendizaje Automático- es un subcampo de la Inteligencia Artificial que busca resolver el “cómo construir programas de computadora que mejoran automáticamente adquiriendo experiencia”. El libro es un conjunto de prácticas en Pyhton desarolladas por capítulos en lal que se muestra la construcción, anpalisi e intrepretación de modelos de machine y deep learning}, publisher = {{LeanPub}}, author = {Bagnato, Juan Ignacio}, date = {2020}, }

@misc{orellana_alvear_arboles_2018-1, title = {Arboles de decision y Random Forest}, url = {https://bookdown.org/content/2031/}, author = {Orellana Alvear, Johanna}, date = {2018}, }

@book{lantz_machine_2013-1, edition = {Kindle}, title = {Machine Learning with R}, author = {Lantz, Brett}, date = {2013}, }

@book{jones_analitica_2019-1, edition = {Kindle}, title = {Analítica de datos. Una guía esencial para principiantes en minería de datos, recolección de datos, análisis de big data para negocios.}, abstract = {Este libro contiene mucha información clave sobre la analítica de datos, que le ayudará a comprender el concepto de minería de datos, recopilación de datos, análisis de big data para negocios y conceptos de inteligencia empresarial.}, author = {Jones, Herbert}, date = {2019}, }

@misc{perez_distancia_nodate, title = {Distancia euclidiana: concepto, fórmula, cálculo, ejemplo}, url = {https://www.lifeder.com/distancia-euclidiana/}, author = {Pérez, Ricardo}, }

@misc{noauthor_pasos_nodate, title = {Pasos para realizar una regresión lineal múltiple con Python}, url = {https://yuasaavedraco.github.io/Docs/Regresi%C3%B3n_Lineal_M%C3%BAltiple_con_Python.html}, }

@book{gonzalez_introduccion_nodate, edition = {1ra}, title = {Introducción Machine Learning}, author = {González, Ligdi}, }

@misc{khaarwal_180_2021, title = {180 Data Science and Machine Learning Projects with Python}, url = {https://medium.com/coders-camp/180-data-science-and-machine-learning-projects-with-python-6191bc7b9db9}, author = {Khaarwal, Aman}, date = {2021}, }

@misc{kharwal_httpsthecleverprogrammercom20220222online-payments-fraud-detection–machine-learning_2022, title = {https://thecleverprogrammer.com/2022/02/22/online-payments-fraud-detection-with-machine-learning/}, url = {https://thecleverprogrammer.com/2022/02/22/online-payments-fraud-detection-with-machine-learning/}, author = {Kharwal, Aman}, date = {2022}, }

@misc{addinsoft_arboles_nodate, title = {Árboles de clasificación y regresión}, url = {https://www.xlstat.com/es/soluciones/funciones/arboles-de-clasificacion-y-de-regresion}, author = {Addinsoft, {XLSTAT} by}, }

@book{lantz_aprendizaje_2013, edition = {Publicación de paquetes. Edición de Kindle}, title = {Aprendizaje automático con R}, publisher = {Publicación de paquetes. Edición de Kindle}, author = {Lantz, Brett}, date = {2013}, }

@misc{sotaquira_regresion_2021, title = {Regresión con Árboles de Decisión: el algoritmo {CART}}, url = {https://www.codificandobits.com/blog/regresion-arboles-decision-algoritmo-cart/}, author = {Sotaquirá, Miguel}, date = {2021}, }

@misc{runebookdev_rpartcontrol_2012, title = {rpart.control Control rpart.control para Rpart Fits}, url = {https://runebook.dev/es/docs/r/library/rpart/html/rpart.control}, author = {{Runebook.dev}}, date = {2012}, }

@misc{delgado_introduccion_2018, title = {Introducción a la Validación Cruzada (k-fold Cross Validation) en R}, url = {https://rpubs.com/rdelgado/405322}, author = {Delgado, Ronald}, date = {2018}, }

@misc{pizarro_support_2020, title = {Support Vector Machine ({SVM}). Análisis de Regresión Caso Bebidas}, url = {https://rpubs.com/rpizarro/605730}, author = {Pizarro, Rubén}, date = {2020}, }

@article{quevedo_inteligencia_2022, title = {Inteligencia Artificial como alternativa en la detección de noticias falsas}, volume = {10}, issn = {2344-8288}, pages = {20–37}, journaltitle = {Tecnología, Investigación y Academia -Red Avanzada – {RITA}}, author = {Quevedo, Angélica and Cerón, Dario}, date = {2022}, }

@misc{unam_variables_nodate, title = {Variables aleatorias continuas}, url = {http://www.economia.unam.mx/profesores/blopez/estadistica-continua.pdf}, publisher = {{UNAM}. Facultad de Economía}, author = {{UNAM}}, }

@misc{pizarro_variables_nodate, title = {Variables aleatorias continuas. Función de densidad automovil}, url = {https://rpubs.com/rpizarro/1018924}, author = {Pizarro, Rubén}, }

@misc{pizarro_variable_nodate, title = {Variable aleatorias continuas. 1-x/2}, url = {https://rpubs.com/rpizarro/1018819}, author = {Pizarro, Rubén}, }

@misc{pizarro_variables_nodate-1, title = {Variables aleatorias continuas 1/360}, author = {Pizarro, Rubén}, }

@misc{openstax_estadisitica_nodate, title = {Estadísitica Empresarial Distribución Exponencial}, url = {https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica-empresarial/pages/5-3-la-distribucion-exponencial}, author = {{OpenStax}}, }

@misc{rubio_alisis_nodate, title = {Análisis Estadístico: Visualización de Datos con R}, url = {https://rstudio-pubs-static.s3.amazonaws.com/793067_3283046ce0f646e68a2f055977d756a4.html}, author = {Rubio, Linky}, }

@misc{probafacil_ejercicios_nodate, title = {Ejercicios de Distribución Exponencial}, url = {https://probafacil.com/distribucion-exponencial-ejercicios-resueltos/}, author = {{ProbaFácil}}, }

@article{probafácil, title = {Ejercicios de Distribución Exponencial}, author = {{ProbaFácil}, }, url = {https://probafacil.com/distribucion-exponencial-ejercicios-resueltos/} }

@book{devore2016, title = {Fundamentos de Probabilidad y Estadística}, author = {Devore, Jay L.}, year = {2016}, date = {2016}, publisher = {CENGAGE}, edition = {Primera Edición} }

@article{openstax, title = {Estadísitica Empresarial Distribución Exponencial}, author = {OpenStax, }, url = {https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica-empresarial/pages/5-3-la-distribucion-exponencial} }

@article{rubio, title = {Análisis Estadístico: Visualización de Datos con R}, author = {Rubio, Linky}, url = {https://rstudio-pubs-static.s3.amazonaws.com/793067_3283046ce0f646e68a2f055977d756a4.html}

Caso 13. Variables aleatorias discretas

Alejandro Zaldivar Ortiz

2023-05-19

Objetivo

Descripción

Marco de referencia

Desarrollo

Cargar librerías

Valor esperado

Varianza

Desviación estándard de una distribución discreta

La tabla con las sumatorias

Gráfica de barra

Gráfica lineal acumulada

Automóviles de Pelican Ford

Tabla de probabilidad

Cálculo de probabilidades

Valor esperado

Varianza

Desviación estándar de una distribución discreta

La tabla con las sumatorias

Gráfica de barra

Gráfica lineal acumulada

Solicitudes de puestos de hombres y mujeres

Tabla de probabilidades

Cálculo de probabilidades

Valor esperado

Varianza

Desviación estándar

Tabla con sumatorias

Gráfica de barra

Gráfica lineal acumulada

Número de hijos de parejas

Tabla de probabilidades

Cálculo de probabilidades

Valor esperado

Varianza

Desviación estándar

Tabla con sumatorias

Gráfica de barra

Gráfica lineal acumulada

Lanzamiento de un dado

Cargando la función

Inicializando variables

Tabla de probabilidad

Cálculo de probabilidades

Valor esperado

Varianza

Desviación estándar

Tabla de sumatorias

Gráfica de barra

Gráfica acumulada

Tomar vasos de agua ITD

Inicializando variables

Ejecutar la función

Tabla de probabilidad

Cálculo de probabilidades

Valor esperado

Varianza

Desviación estándar

Tabla de sumatorias

Gráfica de barra

Gráfica acumulada

Interpretación de los ejercicios del caso

Referencias bibliográficas