tabla de datos
df = data.frame(
Glucosa_mg_dL = c(98, 115, 102, 130, 92, 108, 120, 89, 99, 110,
85, 122, 105, 94, 101, 117, 109, 87, 96, 112),
Edad_anos = c(34, 56, 45, 60, 29, 50, 53, 27, 38, 49,
25, 58, 42, 30, 41, 54, 47, 26, 33, 51),
IMC_kg_m2 = c(22.1, 29.4, 24.8, 31.0, 21.5, 26.2, 28.1, 20.0, 23.5, 26.9,
19.5, 30.0, 25.3, 22.0, 24.5, 28.9, 26.1, 20.3, 22.7, 27.5),
Ejercicio_min_dia = c(45, 20, 35, 15, 60, 30, 25, 70, 40, 30,
80, 20, 35, 55, 40, 25, 30, 75, 50, 28)
)
# Mostrar el data frame
print(df)
## Glucosa_mg_dL Edad_anos IMC_kg_m2 Ejercicio_min_dia
## 1 98 34 22.1 45
## 2 115 56 29.4 20
## 3 102 45 24.8 35
## 4 130 60 31.0 15
## 5 92 29 21.5 60
## 6 108 50 26.2 30
## 7 120 53 28.1 25
## 8 89 27 20.0 70
## 9 99 38 23.5 40
## 10 110 49 26.9 30
## 11 85 25 19.5 80
## 12 122 58 30.0 20
## 13 105 42 25.3 35
## 14 94 30 22.0 55
## 15 101 41 24.5 40
## 16 117 54 28.9 25
## 17 109 47 26.1 30
## 18 87 26 20.3 75
## 19 96 33 22.7 50
## 20 112 51 27.5 28
pairs(df,
pch = 19, # Pch symbol
col = 4, # Color
main = "Diagrama de dispercion", # Title
gap = 0, # Subplots distance
row1attop = FALSE, # Diagonal direction
labels = colnames(df), # Labels
cex.labels = 0.8, # Size of diagonal texts
font.labels = 1) # color de los puntos
c) vector de medias
mean_vector=c(mean(df$Glucosa_mg_dL),mean(df$Edad_anos),mean(df$IMC_kg_m2),mean(df$Ejercicio_min_dia))
mean_vector
## [1] 104.550 42.400 25.015 40.400
d)matriz de covarianza
cov(df)
## Glucosa_mg_dL Edad_anos IMC_kg_m2 Ejercicio_min_dia
## Glucosa_mg_dL 154.68158 139.03158 42.79658 -221.86316
## Edad_anos 139.03158 132.14737 39.80421 -209.53684
## IMC_kg_m2 42.79658 39.80421 12.24239 -63.29579
## Ejercicio_min_dia -221.86316 -209.53684 -63.29579 360.04211
cor(df)
## Glucosa_mg_dL Edad_anos IMC_kg_m2 Ejercicio_min_dia
## Glucosa_mg_dL 1.0000000 0.9724447 0.9834597 -0.9401329
## Edad_anos 0.9724447 1.0000000 0.9896157 -0.9606263
## IMC_kg_m2 0.9834597 0.9896157 1.0000000 -0.9533777
## Ejercicio_min_dia -0.9401329 -0.9606263 -0.9533777 1.0000000
#conclusion la glucosa con respeto a las variables edad, imc la covarianza es positiva lo cual es una relacion directa directa entre ellas, por ejemplo entre mas edad un sujeto tendra mayor glucosa, entre mayor indice corporal mayor sera su glucosa, la ultima represaenta una relacion inversa a mayor ejercios de minutos al dia menor sera su glucosa en ml, y esto tiene esta correlacion es muy fuerte con de acuerdo al coeficiente pearson # punto 2 a) por el principio princilap del conteo tenemos lo siguiente:
vector_conteo=c(3,3,3,3)
prod(vector_conteo)
## [1] 81
library("gtools")
## Warning: package 'gtools' was built under R version 4.5.1
permutaciones<-function(n,r){
factorial(n)/factorial(n-r)
}
total_per =permutaciones(5,5)
resultado_orde_drop = factorial(3)*choose(5, 2)
cat("el primer resultado nos indica la cantidad formas posibles:",total_per,"\n")
## el primer resultado nos indica la cantidad formas posibles: 120
cat("el segundo resultado nos indica la cantidad formas posibles sin que etste contugos los dos hiperparametros las varibles:",resultado_orde_drop)
## el segundo resultado nos indica la cantidad formas posibles sin que etste contugos los dos hiperparametros las varibles: 60
punto_3 = factorial(10)/(factorial(3)*factorial(2)*factorial(4)*factorial(1))
cat("¿De cuántas maneras diferentes podrían distribuirse estas 10 imágenes entre las 4 clases, respetando esa cantidad exacta por clase? es: ", punto_3)
## ¿De cuántas maneras diferentes podrían distribuirse estas 10 imágenes entre las 4 clases, respetando esa cantidad exacta por clase? es: 12600
primero calculamos nuestro espacio muestral lo cual lo hacemos de la siguiente manera sacamos la combinacion ya que de las 52 cartas cuantas maneras hay se puede barajar nuestro evento es que des estas posibles barajas cuantas posibilidades tenemos de que sea 3 reyes o 4 ases
S= choose(52,5)
S
## [1] 2598960
ahora calculamos de los 4 reyes la manera de escojer 3 y el resto de cartas que no son posibles con para formar la mano de 5
reyes = choose(4,3)
cartas_no_reyes = choose(52-4,2)
mano_con_tres_reyes = reyes*cartas_no_reyes
probabilidad_evento_reyes = mano_con_tres_reyes/S
cat("probabilidad de que sean una mano con 3 reyes: ",probabilidad_evento_reyes)
## probabilidad de que sean una mano con 3 reyes: 0.001736079
ahora calculamos la posibilidad de la mano de 5 con 4 ases
ases = choose(4,4)
cartas_no_ases = choose(52-4,1)
mano_con_cuatro_ases = ases*cartas_no_ases
probabilidad_evento_ases = mano_con_cuatro_ases/S
cat("probabilidad de que sean una mano con 4 ases: ",probabilidad_evento_ases)
## probabilidad de que sean una mano con 4 ases: 1.846893e-05
probanilidad total del evento
probabilidad_evento_ases +probabilidad_evento_reyes
## [1] 0.001754548
ases_2 = choose(4,2)
cartas_no_ases = choose(52-4,3)
mano_con_dos_ases = ases_2*cartas_no_ases
probabilidad_evento_ases_2 = mano_con_dos_ases/S
cat("probabilidad de que sean una mano con 4 ases: ",probabilidad_evento_ases_2)
## probabilidad de que sean una mano con 4 ases: 0.03992982
probabilidad total del evento
probabilidad_evento_ases_2+probabilidad_evento_reyes
## [1] 0.0416659
probabilidad_evento_ases_2*probabilidad_evento_reyes
## [1] 6.932132e-05
hipergeometrica = function(N,n,r,x){
choose(r,x)*choose(N-r,n-x)/choose(N,n)
}
N=52
n=5
r=4
x =1
hipergeometrica(N,n,r,x)
## [1] 0.2994736
lo cual nos dice que la probabildad de que en una mano halla un as aproximadamente 29 % d) sabemos que 1=p(S) = p({1})+p({2})+p({3})+2p({4})+2p({5})+3p({6}) = 10a por lo tanto a=1/10 si queremos calcular la probravilidad de los pares tenemos lo siguiente P(A) = p({2})+p({4})+p({6}) entonces remplazando tenemos que p(A) = 1/10+2/10+3/10 #punto 4 sabemos en la nevera N1 tenemos que 4/7 son saludables (S) y que 4/7 estan contaminados(C) 3/7 por lo tanto tenemos que dos esenarios P(con|S)=5/9 ya que le estariamos danto un frasco que esta bueno o tendiramos el caso que estiramos dondo un fraco que esta contaminado p(con|C)=6/9 por lo tanto tendiraimos que p(con)= p(s)p(con|S)+p(C)*p(con|C) entonces remplazando tendiramos P(con)=4/7(5/9)+ 3/7(6/9) =0.6031746
4/7*(5/9) + 3/7*(6/9)
## [1] 0.6031746
tratemos de calcular la probabilidad de la con la primera palabra que es ganar entonces por el teorema de bayes tenemos lo siguiente P(S|G)= P(G|S)P(S)/P(G) y sabemos que la probabildad de P(G)=(0.7)*(0.2)+(0.8)(0.1) por lo tanto tenemos que P(S|G)=(0.7)(0.2)/(0.22)=0.63, denotemos S-G si el correo es spam y tiene la palabra ganar entonces tenemos por lo anterior P(S-G)= 0.63 aplicando nuevamente el teorema de bayes tenemos lo siguiente P(O|S-G)= P(S-G|O)P(S-G)/P(O) tambien sabemos que P(0)= (0.6)(0.63)+(0.2)(0.37) = 0.457, por lo tanto tenemos que P(O|S-G)=(0.63)(0.6)/0.452=0.83