library(ggplot2)
library(stringr)
## Warning: package 'stringr' was built under R version 4.0.3
library(stringi)
## Warning: package 'stringi' was built under R version 4.0.3
library(gtools)
## Warning: package 'gtools' was built under R version 4.0.3
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(knitr)
Para cada ejercicio realizar lo siguiente:
Describir y definir el contexo del ejercicio, poner la referencia (enlace) del mismo.
Elaborar su tabla de probabilidad que contenga los valores de la variable aleatoria, la función de probabilidad y su función acumulada, la gráfica de barra de los valores de las variables aleatoria y la gráfica lineal de la función acumulada.
En algunos ejercicios trae consigo el espacio muestral de preferencia incorporarlo en el documento
Identificar a diferencia del caso 14 o ¿Cuál es el valor de la media de la distribución? o ¿Cuál es el valor de la varianza de la distribución? o ¿Cuál es el valor de desviación de la distribución?
Se venden 5000 billetes para una rifa a 1 euro cada uno. Existe un único premio de cierta cantidad, calcular los valores de las variables aleatorias y sus probabilidades para 0 para no gana y 1 para si gana cuando un comprador adquiere tres billetes. (Hero, n.d.)
Tabla de probabilidad
discretas <- c(0,1) # 0 Que no gane, 1 que gane
n <- 5000
casos <- c(4997,50)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades) # Acumulada
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada,
x.f.prob.x= (discretas*probabilidades))
kable(tabla)
x | casos | f.prob.x | F.acum.x | x.f.prob.x |
---|---|---|---|---|
0 | 4997 | 0.9994 | 0.9994 | 0.00 |
1 | 50 | 0.0100 | 1.0094 | 0.01 |
Se determina el valor esperado de acuerdo a la fórmula: μ=∑xP(x)
VE es el valor esperado
VE <- sum(tabla$x * tabla$f.prob.x)
VE
## [1] 0.01
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
x | casos | f.prob.x | F.acum.x | x.f.prob.x | VE | x-VE.cuad.f.prob.x |
---|---|---|---|---|---|---|
0 | 4997 | 0.9994 | 0.9994 | 0.00 | 0.01 | 0.0000999 |
1 | 50 | 0.0100 | 1.0094 | 0.01 | 0.01 | 0.0098010 |
α2=∑(x−μ)2P(x)
var = varianza de la distribución
varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 0.00990094
desv.std <- sqrt(varianza)
desv.std
## [1] 0.09950347
Las ventas de automóviles de una empresa
Durante los últimos 300 días de operación, los datos de ventas muestran que hubo
54 días en los que no se vendió ningún automóvil,
117 días en los que se vendió 1 automóvil,
72 días en los que se vendieron 2 automóviles,
42 días en los que se vendieron 3 automóviles,
12 días en los que se vendieron 4 automóviles y
3 días en los que se vendieron 5 automóviles.
¿Cuál es la probabilida de que se venda exactamente un automoviles?
¿Cuál es la la probabilidad de que se venda al menos 2 automóviles?
Tabla de probabilidad o Contingencia
discretas <- 0:5 # c(0,1,2,3,4,5)
n <- 300
casos <- c(54, 117, 72, 42, 12, 3)
probabilidades <- casos /n
acumulada <- cumsum(probabilidades) # Acumulada
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada,
x.f.prob.x= (discretas*probabilidades))
kable(tabla)
x | casos | f.prob.x | F.acum.x | x.f.prob.x |
---|---|---|---|---|
0 | 54 | 0.18 | 0.18 | 0.00 |
1 | 117 | 0.39 | 0.57 | 0.39 |
2 | 72 | 0.24 | 0.81 | 0.48 |
3 | 42 | 0.14 | 0.95 | 0.42 |
4 | 12 | 0.04 | 0.99 | 0.16 |
5 | 3 | 0.01 | 1.00 | 0.05 |
Se determina el valor esperado de acuerdo a la fórmula: μ=∑xP(x)
VE es el valor esperado
VE <- sum(tabla$x * tabla$f.prob.x)
VE
## [1] 1.5
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
x | casos | f.prob.x | F.acum.x | x.f.prob.x | VE | x-VE.cuad.f.prob.x |
---|---|---|---|---|---|---|
0 | 54 | 0.18 | 0.18 | 0.00 | 1.5 | 0.4050 |
1 | 117 | 0.39 | 0.57 | 0.39 | 1.5 | 0.0975 |
2 | 72 | 0.24 | 0.81 | 0.48 | 1.5 | 0.0600 |
3 | 42 | 0.14 | 0.95 | 0.42 | 1.5 | 0.3150 |
4 | 12 | 0.04 | 0.99 | 0.16 | 1.5 | 0.2500 |
5 | 3 | 0.01 | 1.00 | 0.05 | 1.5 | 0.1225 |
α2=∑(x−μ)2P(x)
var = varianza de la distribución
varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 1.25
α=α2−−√
desv.std <- sqrt(varianza)
desv.std
## [1] 1.118034
En Estados Unidos un porcentaje de los niños de cuarto grado no pueden leer un libro adecuado a su edad. La tabla siguiente muestra, de acuerdo con las edades de entre 6 y 14 años, el número de niños que tienen problemas de lectura. La mayoría de estos niños tienen problemas de lectura que debieron ser detectados y corregidos antes del tercer grado.(Anderson et al., 2008)
discretas <- 6:14
#n <- '?'
casos <- c(37369, 87436, 160840,239719,286719,306533,310787,302604,289168)
n <- sum(casos)
probabilidades <- casos /n
acumulada <- cumsum(probabilidades) # Acumulada
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada,
x.f.prob.x= (discretas*probabilidades))
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
x | casos | f.prob.x | F.acum.x | x.f.prob.x |
---|---|---|---|---|
6 | 37369 | 0.0184888 | 0.0184888 | 0.1109325 |
7 | 87436 | 0.0432600 | 0.0617487 | 0.3028199 |
8 | 160840 | 0.0795775 | 0.1413262 | 0.6366198 |
9 | 239719 | 0.1186038 | 0.2599300 | 1.0674340 |
10 | 286719 | 0.1418576 | 0.4017876 | 1.4185758 |
11 | 306533 | 0.1516608 | 0.5534484 | 1.6682687 |
12 | 310787 | 0.1537655 | 0.7072139 | 1.8451861 |
13 | 302604 | 0.1497169 | 0.8569307 | 1.9463193 |
14 | 289168 | 0.1430693 | 1.0000000 | 2.0029696 |
Se determina el valor esperado de acuerdo a la fórmula: μ=∑xP(x)
VE es el valor esperado
VE <- sum(tabla$x * tabla$f.prob.x)
VE
## [1] 10.99913
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
x | casos | f.prob.x | F.acum.x | x.f.prob.x | VE | x-VE.cuad.f.prob.x |
---|---|---|---|---|---|---|
6 | 37369 | 0.0184888 | 0.0184888 | 0.1109325 | 10.99913 | 0.4620571 |
7 | 87436 | 0.0432600 | 0.0617487 | 0.3028199 | 10.99913 | 0.6918572 |
8 | 160840 | 0.0795775 | 0.1413262 | 0.6366198 | 10.99913 | 0.7157799 |
9 | 239719 | 0.1186038 | 0.2599300 | 1.0674340 | 10.99913 | 0.4740005 |
10 | 286719 | 0.1418576 | 0.4017876 | 1.4185758 | 10.99913 | 0.1416097 |
11 | 306533 | 0.1516608 | 0.5534484 | 1.6682687 | 10.99913 | 0.0000001 |
12 | 310787 | 0.1537655 | 0.7072139 | 1.8451861 | 10.99913 | 0.1540345 |
13 | 302604 | 0.1497169 | 0.8569307 | 1.9463193 | 10.99913 | 0.5993912 |
14 | 289168 | 0.1430693 | 1.0000000 | 2.0029696 | 10.99913 | 1.2883739 |
α2=∑(x−μ)2P(x)
var = varianza de la distribución
varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 4.527104
α=α2−−√
desv.std <- sqrt(varianza)
desv.std
## [1] 2.127699
En el caso 15 hablaremos sobre la media, varianza y desviación de distribución de variables discretas al igual que en el caso anterior utilizaremos los mismos ejercicios para encontrar el valor esperado, y la varianza.
Ejercicio 1: nos referimos a los 5000 billetes que se venden para una rifa de 1 euro cada uno y una persona compra tres billetes. En este ejercicio vemos que la variable aleatoria encontramos que es la variable con el nombre de casos ya que son las posibles probabilidades que son 4997 y 50, la dicha variable aleatoria toma esos dos resultados, el espacio muestral lo tomamos como casos ya que casos son todos los elementos posibles que son 4997 y 50, solo hay 2 elementos en el espacio muestral, el numero de casos es pequeño ya que hay 2 casos para este ejercicio y las probabilidades mas altas de cada variable aleatoria es para el 4997 es: 99.94% y para el 50 es del 1%, ya después encontramos el valor esperado fue del 0.01 ya que se multiplica los x casos con las probabilidades, la varianza salió 0.0000999 y en el otro caso salió 0.0098010 y finalmente la varianza de la distribución que fue 0.00990094 y la desviación estándar que fue del 0.09959347.
Ejercicio 2: trata de la empresa de ventas que toman los datos de venta de los últimos 300 días y en 54 días no se vendió ningún auto, en 117 días nomas 1 auto, 72 días 2 autos, 42 días 3 autos, 12 días 4 autos y en 3 días 5 automóviles. La variable aleatoria es la de casos que tiene los datos siguientes: 54,117,72,12,3, la variable aleatoria tiene 6 casos, el espacio muestral son todos los elementos y la que tiene todos los elementos es la de casos, hay 6 elementos en el espacio muestral, las probabilidades mas altas fueron: 54 son: 18%, en el 117 es: 39%, en el 72 es: 24%, en el 42 es: 14%, en el 12 es: .04% y en el 3 es del .01%, encontramos el valor esperado que es del 1.5, la varianza de cada caso es de: 1 es: 0.4050, 2 es: 0.0975, 3 es: 0.0600, 4 es: 0.3150, 5 es: 0.2500 y en el 6 es: 0.1225, la varianza de distribución es el 1.25, y la desviación estándar es del 1.118.
Ejercicio 3: es de porcentaje de los niños de cuarto grado que no pueden leer en estados unidos, adecuados a su edad con las edades de entre 6 y 14 años. La variable aleatoria tiene las probabilidades finitas o posibles que es la de casos, dicha variable aleatoria tiene 9 casos, el espacio muestral es en donde se encuentran todos los elementos y al igual que la variable aleatoria tiene los mismos, se encuentran los 9 elementos del espacio muestral, las probabilidades mas altas para cada elemento es del: 1 son: .018%, en el 2 es: .043%, en el 3 es: .079%, en el 4 es: 11%, en el 5 es: 14% y en el caso 6 es del 15%, en el 7 es del: 15%, en el 8 es del 14% y en el 9 es del 14%. El valor esperado es de 10.99, la varianza de cada caso es de: 1 es: 0.4620, 2 es: 0.6918, 3 es: 0.7157, 4 es: 0.4740, 5 es: 0.1416, 6 es: 0.0000001, 7 es: 0.1540, 8 es: 0.5993, 9 es: 1.2883, la varianza de distribución es 4.5271 y la desviación estándar es de: 2.1276. **