Primer punto

tabla de datos

df = data.frame(
  Glucosa_mg_dL = c(98, 115, 102, 130, 92, 108, 120, 89, 99, 110,
                    85, 122, 105, 94, 101, 117, 109, 87, 96, 112),
  Edad_anos = c(34, 56, 45, 60, 29, 50, 53, 27, 38, 49,
                25, 58, 42, 30, 41, 54, 47, 26, 33, 51),
  IMC_kg_m2 = c(22.1, 29.4, 24.8, 31.0, 21.5, 26.2, 28.1, 20.0, 23.5, 26.9,
                19.5, 30.0, 25.3, 22.0, 24.5, 28.9, 26.1, 20.3, 22.7, 27.5),
  Ejercicio_min_dia = c(45, 20, 35, 15, 60, 30, 25, 70, 40, 30,
                        80, 20, 35, 55, 40, 25, 30, 75, 50, 28)
)
# Mostrar el data frame
print(df)
##    Glucosa_mg_dL Edad_anos IMC_kg_m2 Ejercicio_min_dia
## 1             98        34      22.1                45
## 2            115        56      29.4                20
## 3            102        45      24.8                35
## 4            130        60      31.0                15
## 5             92        29      21.5                60
## 6            108        50      26.2                30
## 7            120        53      28.1                25
## 8             89        27      20.0                70
## 9             99        38      23.5                40
## 10           110        49      26.9                30
## 11            85        25      19.5                80
## 12           122        58      30.0                20
## 13           105        42      25.3                35
## 14            94        30      22.0                55
## 15           101        41      24.5                40
## 16           117        54      28.9                25
## 17           109        47      26.1                30
## 18            87        26      20.3                75
## 19            96        33      22.7                50
## 20           112        51      27.5                28
  1. grafico de dispersion
pairs(df,
      pch = 19, # Pch symbol
      col = 4,  # Color
      main = "Diagrama de dispercion",    # Title
      gap = 0,           # Subplots distance
      row1attop = FALSE, # Diagonal direction
      labels = colnames(df), # Labels
      cex.labels = 0.8,  # Size of diagonal texts
      font.labels = 1)  # color de los puntos

c) vector de medias

mean_vector=c(mean(df$Glucosa_mg_dL),mean(df$Edad_anos),mean(df$IMC_kg_m2),mean(df$Ejercicio_min_dia))
mean_vector
## [1] 104.550  42.400  25.015  40.400

d)matriz de covarianza

cov(df)
##                   Glucosa_mg_dL  Edad_anos IMC_kg_m2 Ejercicio_min_dia
## Glucosa_mg_dL         154.68158  139.03158  42.79658        -221.86316
## Edad_anos             139.03158  132.14737  39.80421        -209.53684
## IMC_kg_m2              42.79658   39.80421  12.24239         -63.29579
## Ejercicio_min_dia    -221.86316 -209.53684 -63.29579         360.04211
  1. correlacion de pearson
cor(df)
##                   Glucosa_mg_dL  Edad_anos  IMC_kg_m2 Ejercicio_min_dia
## Glucosa_mg_dL         1.0000000  0.9724447  0.9834597        -0.9401329
## Edad_anos             0.9724447  1.0000000  0.9896157        -0.9606263
## IMC_kg_m2             0.9834597  0.9896157  1.0000000        -0.9533777
## Ejercicio_min_dia    -0.9401329 -0.9606263 -0.9533777         1.0000000

#conclusion la glucosa con respeto a las variables edad, imc la covarianza es positiva lo cual es una relacion directa directa entre ellas, por ejemplo entre mas edad un sujeto tendra mayor glucosa, entre mayor indice corporal mayor sera su glucosa, la ultima represaenta una relacion inversa a mayor ejercios de minutos al dia menor sera su glucosa en ml, y esto tiene esta correlacion es muy fuerte con de acuerdo al coeficiente pearson # punto 2 a) por el principio princilap del conteo tenemos lo siguiente:

vector_conteo=c(3,3,3,3)
prod(vector_conteo) 
## [1] 81
library("gtools")
## Warning: package 'gtools' was built under R version 4.5.1
permutaciones<-function(n,r){
  
factorial(n)/factorial(n-r)  
  
}

total_per =permutaciones(5,5)
resultado_orde_drop = factorial(3)*choose(5, 2)
cat("el primer resultado nos indica la cantidad formas posibles:",total_per,"\n")
## el primer resultado nos indica la cantidad formas posibles: 120
cat("el segundo resultado nos indica la cantidad formas posibles sin que etste contugos los dos hiperparametros las varibles:",resultado_orde_drop)
## el segundo resultado nos indica la cantidad formas posibles sin que etste contugos los dos hiperparametros las varibles: 60
  1. la respuesta para las 5 variables es 32 pero la formula general es 2^n
  2. por el coeficiente multinumial podemos resolverlo
punto_3 = factorial(10)/(factorial(3)*factorial(2)*factorial(4)*factorial(1))
cat("¿De cuántas maneras diferentes podrían distribuirse estas 10 imágenes entre las 4 clases, respetando esa cantidad exacta por clase? es: ", punto_3)
## ¿De cuántas maneras diferentes podrían distribuirse estas 10 imágenes entre las 4 clases, respetando esa cantidad exacta por clase? es:  12600

punto 3

primero calculamos nuestro espacio muestral lo cual lo hacemos de la siguiente manera sacamos la combinacion ya que de las 52 cartas cuantas maneras hay se puede barajar nuestro evento es que des estas posibles barajas cuantas posibilidades tenemos de que sea 3 reyes o 4 ases

S= choose(52,5)
S
## [1] 2598960

ahora calculamos de los 4 reyes la manera de escojer 3 y el resto de cartas que no son posibles con para formar la mano de 5

reyes = choose(4,3)
cartas_no_reyes = choose(52-4,2)
mano_con_tres_reyes = reyes*cartas_no_reyes
probabilidad_evento_reyes = mano_con_tres_reyes/S
cat("probabilidad de que sean una mano con 3 reyes: ",probabilidad_evento_reyes)
## probabilidad de que sean una mano con 3 reyes:  0.001736079

ahora calculamos la posibilidad de la mano de 5 con 4 ases

ases = choose(4,4)
cartas_no_ases = choose(52-4,1)
mano_con_cuatro_ases = ases*cartas_no_ases
probabilidad_evento_ases = mano_con_cuatro_ases/S
cat("probabilidad de que sean una mano con 4 ases: ",probabilidad_evento_ases)
## probabilidad de que sean una mano con 4 ases:  1.846893e-05

probanilidad total del evento

probabilidad_evento_ases +probabilidad_evento_reyes
## [1] 0.001754548
  1. se hace igual que el punto anterio pero solo se cambia la probabildad de los ases
ases_2 = choose(4,2)
cartas_no_ases = choose(52-4,3)
mano_con_dos_ases = ases_2*cartas_no_ases
probabilidad_evento_ases_2 = mano_con_dos_ases/S
cat("probabilidad de que sean una mano con 4 ases: ",probabilidad_evento_ases_2)
## probabilidad de que sean una mano con 4 ases:  0.03992982

probabilidad total del evento

probabilidad_evento_ases_2+probabilidad_evento_reyes
## [1] 0.0416659
probabilidad_evento_ases_2*probabilidad_evento_reyes
## [1] 6.932132e-05
  1. en general este esto se puede resolver con la distribucion hipergeometrica

hipergeometrica = function(N,n,r,x){
  choose(r,x)*choose(N-r,n-x)/choose(N,n)
}
N=52
n=5
r=4
x =1
hipergeometrica(N,n,r,x)
## [1] 0.2994736

lo cual nos dice que la probabildad de que en una mano halla un as aproximadamente 29 % d) sabemos que 1=p(S) = p({1})+p({2})+p({3})+2p({4})+2p({5})+3p({6}) = 10a por lo tanto a=1/10 si queremos calcular la probravilidad de los pares tenemos lo siguiente P(A) = p({2})+p({4})+p({6}) entonces remplazando tenemos que p(A) = 1/10+2/10+3/10 #punto 4 sabemos en la nevera N1 tenemos que 4/7 son saludables (S) y que 4/7 estan contaminados(C) 3/7 por lo tanto tenemos que dos esenarios P(con|S)=5/9 ya que le estariamos danto un frasco que esta bueno o tendiramos el caso que estiramos dondo un fraco que esta contaminado p(con|C)=6/9 por lo tanto tendiraimos que p(con)= p(s)p(con|S)+p(C)*p(con|C) entonces remplazando tendiramos P(con)=4/7(5/9)+ 3/7(6/9) =0.6031746

4/7*(5/9) + 3/7*(6/9)
## [1] 0.6031746

punto 5

tratemos de calcular la probabilidad de la con la primera palabra que es ganar entonces por el teorema de bayes tenemos lo siguiente P(S|G)= P(G|S)P(S)/P(G) y sabemos que la probabildad de P(G)=(0.7)*(0.2)+(0.8)(0.1) por lo tanto tenemos que P(S|G)=(0.7)(0.2)/(0.22)=0.63, denotemos S-G si el correo es spam y tiene la palabra ganar entonces tenemos por lo anterior P(S-G)= 0.63 aplicando nuevamente el teorema de bayes tenemos lo siguiente P(O|S-G)= P(S-G|O)P(S-G)/P(O) tambien sabemos que P(0)= (0.6)(0.63)+(0.2)(0.37) = 0.457, por lo tanto tenemos que P(O|S-G)=(0.63)(0.6)/0.452=0.83