Presentación para seminario de grado

Lineas de investigación

Andrés Cruz Ph.D(c)

17 noviembre, 2023

Estimación de parámetros sensibles

¿Cómo podemos obtener respuestas veraces a preguntas sensibles y medir su evolución a lo largo del tiempo?

  • Determinar el aumento o disminución en la evasión de impuestos.

  • Estudios mensuales en los que se mide el uso de sustancias alucinógenas en una población de adolescentes.

  • Estudios de opinión política conducidos en intervalos regulares para medir la prevalencia del racismo.

  • Prevalencia del fraude académico en exámenes de la universidad.

Desafío de medir actitudes y comportamientos sensibles

  • Sesgo por deseabilidad social.

  • Sesgo por no respuesta.

  • Proteger la privacidad a través de preguntas indirectas.

Métodos

Durante mucho tiempo, el método de respuesta aleatorizada introducido por Warner (1965) ha sido una técnica dominante para hacer frente a este problema, un método alternativo es la técnica de conteo de ítem, este método fue propuesto originalmente por Miller (1984) y una propuesta muy interesante y fácil de aplicar es propuesta por Hussain (2012).

(Warner 1965) Método de respuesta aleatorizada.

  • Idea básica: Anonimato a través de la asignación al azar

  • Dependiendo del resultado de un dispositivo de asignación al azar (por ejemplo, lanzar una moneda), el encuestado tiene que responder a la pregunta sensible o dar una automático “sí” o “no” como respuesta.

  • Dado que sólo el encuestado conoce el resultado de la asignación al azar del dispositivo, una respuesta “sí” no puede ser interpretado como una admisión de culpa.

Ejemplo:

Lanza una moneda al aire y, si obtienes cara, responda la pregunta sensible, de lo contrario responder “sí”

TRA

\[\hat{Predominio}=\frac{\text{observaciones "SI"}-0.5N}{0.5N}\]

(Hussain 2012) Técnica de conteo de ítem.

  • No requiere de dos submuestras de tamaños \(n_1\) y \(n_2\).

  • Cuestionario que contiene \(J\) items, con \(J\geq2\).

  • Dos preguntas para el \(j\)-ésimo ítem:

    • Pregunta no sensible (\(T_j\))
    • Pregunta con característica sensible (\(S\))
  • Al encuestado se le solicita contar 1 si posee alguna de las características \(T_j\) o \(S\) y \(0\) en otro caso e informar el conteo.

Algunas aplicaciones

  • Encuesta nacional de raza y política (Sniderman 1992).

  • Prevalencia de VIH (Droitcour 1991).

  • Mentiras en créditos de libre inversión (Karlan 2012).

  • Compra de artículos robados (Kuha 2014).

Trabajo Futuro

  • Proponer un método para evitar estimaciones negativas.

  • Reducir la varianza.

  • Proponer expresiones analíticas para estimar la varianza en diseños muestrales complejos.

Análilis de datos funcionales (FDA)

¿Qué son los datos funcionales?

Los datos funcionales representan observaciones a lo largo de un dominio continuo, donde cada observación es una función. Por ejemplo, mediciones repetidas a lo largo del tiempo.

Ejemplos de Datos Funcionales

  • Series temporales: Temperaturas diarias, tasas de crecimiento.

  • Curvas de crecimiento: Altura de niños en función de la edad.

  • Señales biomédicas: Actividad cerebral registrada durante el sueño.

  • Internet de las cosas

Comparación con datos tradicionales:

Mientras que los datos tradicionales pueden ser un solo valor por observación, los datos funcionales capturan la variación a lo largo de una dimensión continua. Esto permite modelar y entender patrones a lo largo del tiempo o de otro dominio continuo.

Formas de representar:

  • Curvas suavizadas: Representación visual de la función.

  • Funciones de base: Descomposición de la función en combinación de funciones base.

  • Series de Fourier: Descomposición en términos de funciones seno y coseno.

Herramientas clave:

  • Funciones de base: Conjunto de funciones que forman una base para representar otras funciones.

  • Descomposición en valores singulares: Método para reducir la dimensionalidad.

  • Suavizado funcional: Técnica para reducir el ruido en datos funcionales.

Aplicaciones en la vida real:

  • Medicina: Análisis de señales biomédicas para diagnóstico.

  • Finanzas: Modelado de series temporales para previsión.

  • Ingeniería: Estudio de curvas de crecimiento en diseño de productos.

Desafíos en el análisis de datos funcionales:

  • Ruido: Manejo de variaciones no deseadas.

  • Alineación: Alinear funciones en un marco común.

  • Selección de funciones de base: Elección adecuada para la representación.

Ejemplo en R

install.packages("fda.usc")
install.packages("ggplot2")

library(fda.usc)
library(ggplot2)

# Generar datos simulados
set.seed(123)
n_points <- 100
x <- seq(0, 2*pi, length.out = n_points)
y <- sin(x) + rnorm(n_points, mean = 0, sd = 0.1)

# Convertir datos a objeto funcional
fd_data <- Data2fd(y, argvals = x)

# Visualizar los datos funcionales
plot(fd_data, main = "Datos Funcionales Simulados", col = "blue", lwd = 2)

# Ajustar funciones de base (usando B-splines)
basis <- create.bspline.basis(rangeval = range(x), nbasis = 10, norder = 4)
fdParobj <- fdPar(basis, 2)
smoothed_data <- smooth.basis(x, y, fdParobj)

# Visualizar datos originales y ajuste
lines(x, smoothed_data$y, col = "red", lwd = 2)
legend("topright", legend = c("Datos Originales", "Ajuste"), col = c("blue", "red"), lwd = 2)