Controles de calidad realizados a las bases de datos publicadas

Se efectúan controles de calidad de datos recibidos para su publicación en cuatro momentos:

1) Recepción: en el momento de recepción de los datos se realizan controles automatizados. Si se detecta que los datos no alcanzan los estándares de calidad previamente acordados se devuelve el lote de datos al remitente para su corrección y reenvío. En relación a los datos recibidos de las instituciones de justicia de todo el país, en el marco del Convenio Interjurisdiccional de Datos Judiciales Abiertos, los estándares están contenidos en el Protocolo Técnico de Datos y Procesos (actualmente en su versión III). En cuanto a las organizaciones del Ministerio de Justicia y Derechos Humanos los acuerdos previos a la publicación son informales, y los controles se efectúan en base a estos acuerdos. En ambos casos se controla integridad, coherencia, actualización y continuidad de la información remitida. 

Entre los controles efectuados podemos mencionar:

- A nivel archivo: tipo de archivo, estructura, denominación, fin de línea y codificación.

- A nivel de registro: unicidad

- A nivel campo: tipo de dato, formato del dato, se controlan que los códigos o categorías hayan sido informados previamente (caso contrario se solicita la actualización de tablas auxiliares), control de datos nulos o vacíos

2) Publicación: una vez controlados y procesados los archivos se publican en el portal. A su vez, se actualizan las visualizaciones que nos permiten no sólo ofrecer una aproximación visual y estadística a los datos, sino que tambien son útiles para monitorear los datos y exponer posibles inconsistencias, detectar cambios bruscos de tendencias, posibles cambios en el uso de las categorías, etc.

3) Procesos diarios: diariamente se corren procesos que controlan que la estructura de los archivos comprimidos no esté corrupta y que los recursos hayan completado su subida al datastore de ckan, lo que habilita su correcta visualización.

4) Revisiones periódicas: con el fin de verificar que la información publicada sea de calidad - accesible, clara, integra, confiable y completa-, las bases de datos son analizadas en forma recursiva. En caso de que sea pertinente, son cruzadas, se consulta con el proveedor del dato si surgen dudas, y se replantea de ser necesario el esquema de control.