R para Estadística Judicial: Reproducibilidad y Automatización

Lic. Sebastián Castillo
19-10-2021

Presentación

  • Primera Parte: Introducción R-Estadística_Judicial
  • Segunda Parte: Trabajo en RMarkdown
  • Objetivos:
    1. Dar a conocer la implementación en el STJER de R: JUSTAT
    2. Completar la elaboración de un informe automatizado y reproducible de estadística judicial.
  • materiales_disponibles: https://github.com/castillosebastian/Taller_R_EstadisticaJudicial.git

Desafío para Estadística: Eficacia, Capacidad y Confiabilidad

Estructura Judicial (oct-2021)
instancia materia cantidad_organos
primera_instancia civil_com 39
primera_instancia ejecuciones_conc-qui 8
primera_instancia familia 31
primera_instancia laboral 15
primera_instancia paz 58
primera_instancia penal 26
segunda_instancia civil_com 7
segunda_instancia contencioso_adm 2
segunda_instancia laboral 5
segunda_instancia penal 2
superior_instancia civil_com 1
superior_instancia constitucional(apelacion) 1
superior_instancia contencioso_adm 1
superior_instancia laboral 1
superior_instancia penal 1
Total - 198

Estadística Descriptiva

  • datos_primarios_xmes = 198 * 4 ≈ 792 (ci,carch,resol,audic,mov)
  • procesos = relevamiento, procesesamiento, análisis(-) y producción

Análisis de Datos

  • datos_primarios: x
  • procesos = necesidad, [diseño-construccion relevamiento], procesamiento, análisis(+) e informe
  • Ej:
    • 1 ¿cómo ha evolucionado la actividad judicial durante la pandemia? (resumen!)
    • 2 ¿mejora la carga de trabajo reasignar Ejecutivos >$50mil desde juzgados de paz hacia los civiles?
    • 3 ¿cómo se adminitra el juicio abreviado?
    • [Narcomenudeo, Violencia, etc.]

Problema: [dato=>conocimiento] vs (...datos=>conocimiento=>acción!=>datos...)

“Los muertos que vos matáis gozan de buena salud” (a propósito del trabajo manual con datos -1982/2016?)

Una idea simple

Donde hay dato debe haber algoritmo.

Reproducibilidad: la capacidad de un cálculo para ser replicado por terceros operando de forma independiente. Vinculado a nociones de Ciencia Abierta. Concepto de gran alcance en metodología.

Automatización: introducción de agentes (ie. algoritmos) autónomos para realizar tareas recurrentes. Concepto muy amplio y gran alcance en materia de sistemas y proceso.

Productos/Servicios

Tecnologías del Sistema de Estadística Pública Judicial del STJER

plot of chunk unnamed-chunk-2

Modelos:

  • INDEC.
  • EUROSTAT, 2016: Aplicación Modelo Genérico Proc. Estadísticos
  • R, Official Statistics, 2013 +: Publicaciones y Herramientas
  • GREP-JUFEJUS Argentina, 2010 +: Código de Buenas Prácticas de las Estadísticas Judiciales. Contra la descalificación del “monos con escopetas”: el profesionalismo permanente.

JUSTAT: arquitectura

Aplicaciones:

Librerías (públicas):

Segunda Parte: informes RMarkdown

¿Qué es RMarkdown?

  • Un subconjunto de tecnologías del ecosistema R orientado a la producción de documentos.

  • Documentos que integran información textual y códigos embebido a fin de facilitar la producción de análisis estadísticos.

  • fuente: https://rmarkdown.rstudio.com/

Modelo típico de un 'análisis de datos'

“R for Data Science”, Wickham-Grolemund.

Informe Automatizado

  • Informe0 = ejemplo RMarkdown
    • Informe1-1 = 2+2, edición texto
    • Informe1-2 = 2+2, parametro RM: “echo = F”
    • Informe1-3 = variable: “resulado” = 2+2
  • Informe2 = df: “actos procesales no penales” (Datos Abiertos-MINJUS)
  • Informe3 = Idem(Informe2) + parámetros
  • nInformes (gratis): https://bitbucket.org/apgye/apgyeinformes/

Análisis Automatizado: en proceso

Análisis de documentos legales: sentencias (colab)

Bibliografía

Gracias!

  • Emilce Leones (operador)
  • Marcos Londero (técnico)
  • Sebastián Castillo (director)

Área de Planificación Gestión y Estadística
Superior Tribunal de Justicia de Entre Ríos
0343-4209405/410 – ints. 396 y 305
apge@jusentrerios.gov.ar
estadistica@jusentrerios.gov.ar