Para este prmier ejercicio en R usaremos datos de la busqueda de los juegos olimpicos 2021 en México, estos datos pueden ser encontrados en este enlace:
https://trends.google.es/trends/explore?q=olimpiadas%202021&geo=MX
olimpiadas2021Mexico <- c(100, 79, 76, 75, 73, 70, 69, 66, 64, 63, 63, 62, 61, 60, 57, 54, 53, 51, 51, 50)
sort(olimpiadas2021Mexico, decreasing = TRUE)
## [1] 100 79 76 75 73 70 69 66 64 63 63 62 61 60 57 54 53 51 51
## [20] 50
sort(olimpiadas2021Mexico, decreasing = FALSE)
## [1] 50 51 51 53 54 57 60 61 62 63 63 64 66 69 70 73 75 76 79
## [20] 100
library(fdth)
## Warning: package 'fdth' was built under R version 3.6.3
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
tabla <- fdt(olimpiadas2021Mexico)
tabla
## Class limits f rf rf(%) cf cf(%)
## [49.5,58.1) 6 0.30 30 6 30
## [58.1,66.7) 7 0.35 35 13 65
## [66.7,75.2) 4 0.20 20 17 85
## [75.2,83.8) 2 0.10 10 19 95
## [83.8,92.4) 0 0.00 0 19 95
## [92.4,101) 1 0.05 5 20 100
Al utilizar los datos de busqueda de cada uno de los primeros 20 estados para las olimpiadas del 2021 podemos ver que unos de los estados tiene una frecuencia relativa mas alta de 35% asi que el rango de busqueda de interes ronda por el rango de entre 58.1 a 66.7% según los datos analizados.
plot(tabla, type = "fh")
plot(tabla, type = "fp")
### Histograma y poligono de frecuencia relativa según Sturges
plot(tabla, type = "rfh")
plot(tabla, type = "rfp")
Gracias a los histogramas y el polígonos de frecuencia según Sturge concluimos que los datos no son para nada normales ya que su distribución esta muy variadas y muestran que algunos estados en México no muestran un interés real ante los deportes del año 2021, ya sea por diferentes factores como lo serian la pandemia y sus consecuencias dejando preocupaciones mas importantes.
plot(tabla, type = "cfh")
plot(tabla, type = "cfp")
Al analizar la acumulación de las busquedas realizadas vemos un interés entre los diferentes estados llegando a un tope en las busquedas según su frecuencia anteriormente analizada
mean(olimpiadas2021Mexico)
## [1] 64.85
Aqui podemos observar como el interés promedio de los estados ante las olimpiadas del 2021 en Japón fue de 64.85.
median(olimpiadas2021Mexico)
## [1] 63
La media resulta en un valor de 63.
#install.packages("modeest")
library(modeest)
## Warning: package 'modeest' was built under R version 3.6.3
##
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
##
## mfv
mlv(olimpiadas2021Mexico, method = "mfv")
## [1] 51 63
Los valores que mas se repitieron en ó de busqueas fueron 51 y 63 con una igualdad de 2 estados cada uno.
summary(olimpiadas2021Mexico)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 50.00 56.25 63.00 64.85 70.75 100.00
En la frecuencia de busquedas observamos que el primer cuartil esta entre las 56 su mediana como se menciono anteriormente es el 63 el tercer cuartil esta en el 70 y hubo un estado con un maximo de 100 busquedas por las olimpiadas del 2021
boxplot(olimpiadas2021Mexico)
En el diagrama de caja y bigotes podemos ver la cantidad de busquedas que se describió en los cuartiles, siendo el estado que tuvo 100 busquedas un dato atipico ya que el maximo o el que mas se acerca radica en un rango de 88 para abajo, ademas podemos ver la mediana y los valores minimos y maximos.