Presentación para seminario de grado

Lineas de investigación

Andrés Cruz Ph.D(c)

17 noviembre, 2023

Estimación de parámetros sensibles

¿Cómo podemos obtener respuestas veraces a preguntas sensibles y medir su evolución a lo largo del tiempo?

Determinar el aumento o disminución en la evasión de impuestos.
Estudios mensuales en los que se mide el uso de sustancias alucinógenas en una población de adolescentes.
Estudios de opinión política conducidos en intervalos regulares para medir la prevalencia del racismo.
Prevalencia del fraude académico en exámenes de la universidad.

Desafío de medir actitudes y comportamientos sensibles

Sesgo por deseabilidad social.
Sesgo por no respuesta.
Proteger la privacidad a través de preguntas indirectas.

Métodos

Durante mucho tiempo, el método de respuesta aleatorizada introducido por Warner (1965) ha sido una técnica dominante para hacer frente a este problema, un método alternativo es la técnica de conteo de ítem, este método fue propuesto originalmente por Miller (1984) y una propuesta muy interesante y fácil de aplicar es propuesta por Hussain (2012).

(Warner 1965) Método de respuesta aleatorizada.

Idea básica: Anonimato a través de la asignación al azar
Dependiendo del resultado de un dispositivo de asignación al azar (por ejemplo, lanzar una moneda), el encuestado tiene que responder a la pregunta sensible o dar una automático “sí” o “no” como respuesta.
Dado que sólo el encuestado conoce el resultado de la asignación al azar del dispositivo, una respuesta “sí” no puede ser interpretado como una admisión de culpa.

Ejemplo:

Lanza una moneda al aire y, si obtienes cara, responda la pregunta sensible, de lo contrario responder “sí”

TRA

\[\hat{Predominio}=\frac{\text{observaciones "SI"}-0.5N}{0.5N}\]

(Hussain 2012) Técnica de conteo de ítem.

No requiere de dos submuestras de tamaños \(n_1\) y \(n_2\).
Cuestionario que contiene \(J\) items, con \(J\geq2\).
Dos preguntas para el \(j\)-ésimo ítem:
- Pregunta no sensible (\(T_j\))
- Pregunta con característica sensible (\(S\))
Al encuestado se le solicita contar 1 si posee alguna de las características \(T_j\) o \(S\) y \(0\) en otro caso e informar el conteo.

Algunas aplicaciones

Encuesta nacional de raza y política (Sniderman 1992).
Prevalencia de VIH (Droitcour 1991).
Mentiras en créditos de libre inversión (Karlan 2012).
Compra de artículos robados (Kuha 2014).

Trabajo Futuro

Proponer un método para evitar estimaciones negativas.
Reducir la varianza.
Proponer expresiones analíticas para estimar la varianza en diseños muestrales complejos.

Análilis de datos funcionales (FDA)

¿Qué son los datos funcionales?

Los datos funcionales representan observaciones a lo largo de un dominio continuo, donde cada observación es una función. Por ejemplo, mediciones repetidas a lo largo del tiempo.

Ejemplos de Datos Funcionales

Series temporales: Temperaturas diarias, tasas de crecimiento.
Curvas de crecimiento: Altura de niños en función de la edad.
Señales biomédicas: Actividad cerebral registrada durante el sueño.
Internet de las cosas

Comparación con datos tradicionales:

Mientras que los datos tradicionales pueden ser un solo valor por observación, los datos funcionales capturan la variación a lo largo de una dimensión continua. Esto permite modelar y entender patrones a lo largo del tiempo o de otro dominio continuo.

Formas de representar:

Curvas suavizadas: Representación visual de la función.
Funciones de base: Descomposición de la función en combinación de funciones base.
Series de Fourier: Descomposición en términos de funciones seno y coseno.

Herramientas clave:

Funciones de base: Conjunto de funciones que forman una base para representar otras funciones.
Descomposición en valores singulares: Método para reducir la dimensionalidad.
Suavizado funcional: Técnica para reducir el ruido en datos funcionales.

Aplicaciones en la vida real:

Medicina: Análisis de señales biomédicas para diagnóstico.
Finanzas: Modelado de series temporales para previsión.
Ingeniería: Estudio de curvas de crecimiento en diseño de productos.

Desafíos en el análisis de datos funcionales:

Ruido: Manejo de variaciones no deseadas.
Alineación: Alinear funciones en un marco común.
Selección de funciones de base: Elección adecuada para la representación.

Ejemplo en R

install.packages("fda.usc")
install.packages("ggplot2")

library(fda.usc)
library(ggplot2)

# Generar datos simulados
set.seed(123)
n_points <- 100
x <- seq(0, 2*pi, length.out = n_points)
y <- sin(x) + rnorm(n_points, mean = 0, sd = 0.1)

# Convertir datos a objeto funcional
fd_data <- Data2fd(y, argvals = x)

# Visualizar los datos funcionales
plot(fd_data, main = "Datos Funcionales Simulados", col = "blue", lwd = 2)

# Ajustar funciones de base (usando B-splines)
basis <- create.bspline.basis(rangeval = range(x), nbasis = 10, norder = 4)
fdParobj <- fdPar(basis, 2)
smoothed_data <- smooth.basis(x, y, fdParobj)

# Visualizar datos originales y ajuste
lines(x, smoothed_data$y, col = "red", lwd = 2)
legend("topright", legend = c("Datos Originales", "Ajuste"), col = c("blue", "red"), lwd = 2)