REPASO GEBERAL DE PROBABILIDAD Y ESTADISTICA

Para este prmier ejercicio en R usaremos datos de la busqueda de los juegos olimpicos 2021 en México, estos datos pueden ser encontrados en este enlace:

https://trends.google.es/trends/explore?q=olimpiadas%202021&geo=MX

olimpiadas2021Mexico <- c(100, 79, 76, 75, 73, 70, 69, 66, 64, 63, 63, 62, 61, 60, 57, 54, 53, 51, 51, 50)

Manejo de daos

Ordenando datos de mayor a menor usando algebra booleana

sort(olimpiadas2021Mexico, decreasing = TRUE)
##  [1] 100  79  76  75  73  70  69  66  64  63  63  62  61  60  57  54  53  51  51
## [20]  50

Ordenando datos de menor a mayor

sort(olimpiadas2021Mexico, decreasing = FALSE)
##  [1]  50  51  51  53  54  57  60  61  62  63  63  64  66  69  70  73  75  76  79
## [20] 100

Tablas de distribuciones de frecuencia

library(fdth)
## Warning: package 'fdth' was built under R version 3.6.3
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
tabla <- fdt(olimpiadas2021Mexico)
tabla
##  Class limits f   rf rf(%) cf cf(%)
##   [49.5,58.1) 6 0.30    30  6    30
##   [58.1,66.7) 7 0.35    35 13    65
##   [66.7,75.2) 4 0.20    20 17    85
##   [75.2,83.8) 2 0.10    10 19    95
##   [83.8,92.4) 0 0.00     0 19    95
##    [92.4,101) 1 0.05     5 20   100

Al utilizar los datos de busqueda de cada uno de los primeros 20 estados para las olimpiadas del 2021 podemos ver que unos de los estados tiene una frecuencia relativa mas alta de 35% asi que el rango de busqueda de interes ronda por el rango de entre 58.1 a 66.7% según los datos analizados.

Histograma y Polígonos de distribuciones de frecuencia

Histograma y polígono de frecuencia absoluta según Sturge

  • Histograma
plot(tabla, type = "fh")

  • Polígono
plot(tabla, type = "fp")

### Histograma y poligono de frecuencia relativa según Sturges

plot(tabla, type = "rfh")

plot(tabla, type = "rfp")

Gracias a los histogramas y el polígonos de frecuencia según Sturge concluimos que los datos no son para nada normales ya que su distribución esta muy variadas y muestran que algunos estados en México no muestran un interés real ante los deportes del año 2021, ya sea por diferentes factores como lo serian la pandemia y sus consecuencias dejando preocupaciones mas importantes.

Histograma y poligono de frecuencia acumulada según Sturge

plot(tabla, type = "cfh")

plot(tabla, type = "cfp")

Al analizar la acumulación de las busquedas realizadas vemos un interés entre los diferentes estados llegando a un tope en las busquedas según su frecuencia anteriormente analizada

MEDIDAS DE TENDENCIA CENTRAL

Media

mean(olimpiadas2021Mexico)
## [1] 64.85

Aqui podemos observar como el interés promedio de los estados ante las olimpiadas del 2021 en Japón fue de 64.85.

Mediana

median(olimpiadas2021Mexico)
## [1] 63

La media resulta en un valor de 63.

Moda

#install.packages("modeest")
library(modeest)
## Warning: package 'modeest' was built under R version 3.6.3
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
mlv(olimpiadas2021Mexico, method = "mfv")
## [1] 51 63

Los valores que mas se repitieron en ó de busqueas fueron 51 y 63 con una igualdad de 2 estados cada uno.

Cuartiles

summary(olimpiadas2021Mexico)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   50.00   56.25   63.00   64.85   70.75  100.00

En la frecuencia de busquedas observamos que el primer cuartil esta entre las 56 su mediana como se menciono anteriormente es el 63 el tercer cuartil esta en el 70 y hubo un estado con un maximo de 100 busquedas por las olimpiadas del 2021

Grafico de caja y bigotes

boxplot(olimpiadas2021Mexico)

En el diagrama de caja y bigotes podemos ver la cantidad de busquedas que se describió en los cuartiles, siendo el estado que tuvo 100 busquedas un dato atipico ya que el maximo o el que mas se acerca radica en un rango de 88 para abajo, ademas podemos ver la mediana y los valores minimos y maximos.