Determinar el aumento o disminución en la evasión de impuestos.
Estudios mensuales en los que se mide el uso de sustancias alucinógenas en una población de adolescentes.
Estudios de opinión política conducidos en intervalos regulares para medir la prevalencia del racismo.
Prevalencia del fraude académico en exámenes de la universidad.
Sesgo por deseabilidad social.
Sesgo por no respuesta.
Proteger la privacidad a través de preguntas indirectas.
Durante mucho tiempo, el método de respuesta aleatorizada introducido por Warner (1965) ha sido una técnica dominante para hacer frente a este problema, un método alternativo es la técnica de conteo de ítem, este método fue propuesto originalmente por Miller (1984) y una propuesta muy interesante y fácil de aplicar es propuesta por Hussain (2012).
Idea básica: Anonimato a través de la asignación al azar
Dependiendo del resultado de un dispositivo de asignación al azar (por ejemplo, lanzar una moneda), el encuestado tiene que responder a la pregunta sensible o dar una automático “sí” o “no” como respuesta.
Dado que sólo el encuestado conoce el resultado de la asignación al azar del dispositivo, una respuesta “sí” no puede ser interpretado como una admisión de culpa.
Lanza una moneda al aire y, si obtienes cara, responda la pregunta sensible, de lo contrario responder “sí”
\[\hat{Predominio}=\frac{\text{observaciones "SI"}-0.5N}{0.5N}\]
No requiere de dos submuestras de tamaños \(n_1\) y \(n_2\).
Cuestionario que contiene \(J\) items, con \(J\geq2\).
Dos preguntas para el \(j\)-ésimo ítem:
Al encuestado se le solicita contar 1 si posee alguna de las características \(T_j\) o \(S\) y \(0\) en otro caso e informar el conteo.
Encuesta nacional de raza y política (Sniderman 1992).
Prevalencia de VIH (Droitcour 1991).
Mentiras en créditos de libre inversión (Karlan 2012).
Compra de artículos robados (Kuha 2014).
Proponer un método para evitar estimaciones negativas.
Reducir la varianza.
Proponer expresiones analíticas para estimar la varianza en diseños muestrales complejos.
Los datos funcionales representan observaciones a lo largo de un dominio continuo, donde cada observación es una función. Por ejemplo, mediciones repetidas a lo largo del tiempo.
Series temporales: Temperaturas diarias, tasas de crecimiento.
Curvas de crecimiento: Altura de niños en función de la edad.
Señales biomédicas: Actividad cerebral registrada durante el sueño.
Internet de las cosas
Mientras que los datos tradicionales pueden ser un solo valor por observación, los datos funcionales capturan la variación a lo largo de una dimensión continua. Esto permite modelar y entender patrones a lo largo del tiempo o de otro dominio continuo.
Curvas suavizadas: Representación visual de la función.
Funciones de base: Descomposición de la función en combinación de funciones base.
Series de Fourier: Descomposición en términos de funciones seno y coseno.
Funciones de base: Conjunto de funciones que forman una base para representar otras funciones.
Descomposición en valores singulares: Método para reducir la dimensionalidad.
Suavizado funcional: Técnica para reducir el ruido en datos funcionales.
Medicina: Análisis de señales biomédicas para diagnóstico.
Finanzas: Modelado de series temporales para previsión.
Ingeniería: Estudio de curvas de crecimiento en diseño de productos.
Ruido: Manejo de variaciones no deseadas.
Alineación: Alinear funciones en un marco común.
Selección de funciones de base: Elección adecuada para la representación.
install.packages("fda.usc")
install.packages("ggplot2")
library(fda.usc)
library(ggplot2)
# Generar datos simulados
set.seed(123)
n_points <- 100
x <- seq(0, 2*pi, length.out = n_points)
y <- sin(x) + rnorm(n_points, mean = 0, sd = 0.1)
# Convertir datos a objeto funcional
fd_data <- Data2fd(y, argvals = x)
# Visualizar los datos funcionales
plot(fd_data, main = "Datos Funcionales Simulados", col = "blue", lwd = 2)
# Ajustar funciones de base (usando B-splines)
basis <- create.bspline.basis(rangeval = range(x), nbasis = 10, norder = 4)
fdParobj <- fdPar(basis, 2)
smoothed_data <- smooth.basis(x, y, fdParobj)
# Visualizar datos originales y ajuste
lines(x, smoothed_data$y, col = "red", lwd = 2)
legend("topright", legend = c("Datos Originales", "Ajuste"), col = c("blue", "red"), lwd = 2)