!Hola¡ Esta es una pequeña prueba para determinar el nivel de conocimiento en el lenguaje R en tu nuevo grupo de Supervivencia y Series de Tiempo. Siéntete tranquilo, pues esta evaluación no tendrá repercusiones en tus calificaciones, por lo que puedes ser sincero en cuanto a tu conocimiento excluyendo algunos ejercicios si lo crees necesario aunque siempre es agradable ver el esfuerzo y la creatividad otorgada.
Puedes hacer uso de cualquier función de base::, así como también de las funciones que se encuentren en el tidyverse y de otras librerías si lo crees necesario o aportan a la presentación, siempre y cuando estas sólo sean parte de tu solución o tu resultado final, por lo que no se admite el uso de funciones que provengan de paquetes externos no propios que den una solución final a los ejercicios.
En cuanto a la entrega, esta puede ser desde un simple script, un archivo html o un enlace a alguna publicación en Rpubs, Github o hasta una aplicación publicada en shinyapps donde se presenten tus resultados explicando cada uno de ellos. Entre más creativo, presentable e impresionante mejor.
Seguramente haz escuchado de la “paradoja” del cumpleaños donde se desea determinar la probabilidad de que dos personas en un salón cumplan el mismo día. Para fines de este ejercicio considera que se tienen \(n\) personas, los años bisiestos no son contados ni se admiten las personas gemelas; además de que los posibles 365 cumpleaños tienen la misma probabilidad de ocurrir.
En resumen, se tienen las siguientes expresiones para determinar la probabilidad, bajo las condiciones anteriores, de que dos personas cumplan el mismo día y de que otra persona cumpla el mismo día que tú. \[ \begin{array}{ccc} \mathbb{P}= \left\{\begin{array}{ll}1-\frac{365!}{365^n(365-n)!} & 1\leq n \leq365\\ 1 & n>365 \end{array}\right. &; &\mathbb{P} = 1-\left(\frac{364}{365}\right)^n \end{array} \]
Existen aplicaciones muy interesantes donde se utilizan los conocidos eigen vectores/valores de una matriz. Una de ellas es la relación que tienen estos con los conocidos números de Fibonacci. Recuerda que los números de Fibonacci quedan representados por la ecuación recursiva \(F_{n} = F_{n-1} + F_{n-2}\) y de una manera muy sencilla se puede ver que \[ \begin{pmatrix} F_n \\F_{n-1} \end{pmatrix} = \begin{pmatrix} 1 & 1 \\ 1 & 0 \end{pmatrix} \begin{pmatrix} F_{n-1}\\ F_{n_2} \end{pmatrix} \]
En la mayoría de cursos que haz visto se ha tenido una gran cantidad de teoría sin ver algoritmos que te permitan comprobar dichas cosas. Vamos a arreglar un poco esto y crea alguna función o método iterativo para aproximar lo siguiente. En cada uno de los casos da un ejemplo para comprobar el funcionamiento de tu solución.
La idea será sencilla aunque la implementación no lo se 🙈, por lo que podrías obtener más resultados de los que coloco aquí. De acuerdo a un archivo .txt que se te será proporcionado determinar lo siguiente:
No importa si consideras a los caracteres especiales como letras o no, tampoco si haces distinción entre mayúsculas y minúsculas, ni tampoco las veces que tengas que cargar el archivo.
Es bien conocido el teorema que abordamos en este ejercicio y sólo para recordar, si \(X_1, X_2, \dots\) es una sucesión de variables aleatorias independientes e idénticamente distribuidas, con media \(\mu\) y varianza finita \(\sigma^2\), la función de distribución de la variable aleatoria \(Z\) descrita por: \[ Z = \frac{(X_1+\cdots+X_n)-n\mu}{\sqrt{n\sigma^2}} \] tiende a la función de distribución normal estándar cuando \(n \rightarrow \infty\). Entonces, tu objetivo será crear una función que, de acuerdo a una distribución (pueden ser tantas como conozcas) que sean adaptables a las condiciones del teorema, incluyendo como parámetros de la función la media y la varianza de dicha distribución y una \(n\), se creen simulaciones de dicha distribución, al igual que la v.a. \(Z\). Finalmente se tiene que dar las gráficas de probabilidad acumulada y de densidad correspondiente (puedes guardar todo en una lista). Al final, con un \(n\) grande dado en la función, se debería poder ver una “comprobación visual de dicho teorema”.
Suerte! Ojala que no la necesites 🤭
Un trabajo de Carlos Vásquez
carlosfvasquez@ciencias.unam.mx