Você está na página 1de 33

Cristina Villaverde GBIF Espaa

Katia Cezn - GBIF Espaa

Colecciones Biolgicas 3,0


Villa de Leyva, Colombia 2012

CHAPMAN, A.D. 2005. Principles of Data Quality, version 1.0.

Report for the GBIF, Copenhagen.

o
o
o

o
o
o

o
o

Estudios taxonmicos, ecolgicos,


biogeogrficos, filogenticos.
Estudios de poblacin y
distribucin de especies.
Estudios sobre especies
amenazadas.
Sobre migracin de especies.
Planificacin sobre la conservacin
de espacios protegidos.
Gestin de recursos naturales.
Modelado de datos de especies.
Impacto del cambio climtico.

o
o
o
o
o
o
o
o

Agricultura, Montes y Pesca


Perspectivas basadas en productos
biolgicos.
Salud y seguridad pblicas.
Medicina forense.
Ecoturismo.
Arte e Historia, Ciencias y poltica
Planificacin de infraestructuras
humanas.
Etc.

Una caracterstica esencial y necesaria para que los datos sean


adecuados para el uso.

El propsito general al describir la calidad de los datos de un


registro concreto es describir la adecuacin del registro para un
uso particular que el usuario tenga en mente para dichos datos.
Chrisman, 1991

Este dato es de buena calidad?:

- La especie A se encuentra en Tasmania?


- La especie A se encuentra en el rea de conservacin del
patrimonio de Tasmania?

COSTE DE LA CORRECCIN DE ERRORES

PLANIFICACIN

- No Planificacin

RECOLECCIN DOCUMENTACIN

- Informacin incompleta

DIGITALIZA
CIN

CONTROL DE
CALIDAD

PUESTA EN
INTERNET

- Poca experiencia
del personal

- Mala exportacin

- Mala interpretacin

- Uso incorrecto de
los datos

- Base de datos
- Copias

- Conversiones

VISIN INSTITUCIONAL
o

Reconocimiento de la informacin como fundamental en los


procesos institucionales

Se busca maximizar interoperabilidad

Orientacin de la calidad de datos a largo plazo

POLTICA DE CALIDAD
o

Definir qu se va a hacer respecto a la calidad

ESTRATEGIA
o

Definicin de normas y procedimientos para obtener la


calidad que se busca

Prevenir es mejor que curar, y es mucho ms barato

La prevencin de errores nada tiene que hacer con los datos que ya
existen en la base de datos. En estos casos, la validacin y la
correccin sern muy importantes en el proceso hacia la calidad.

Detectar las causas del error nos ayudar a prevenirlas

Corregir los datos y no hacer nada para prevenir los errores significa
que los errores seguirn apareciendo sistemticamente y no los
reduciremos nunca.

EXACTITUD Debemos tender a que el dato est lo ms prximo


posible al valor real.
CONSISTENCIA
Datos presentados siempre de la misma manera y se mantienen en el
tiempo de forma clara, consistente y sin ambigedad:
o Consistencia semntica: la informacin que se almacena
o

Consistencia estructural: la forma en que se almacena

DEPURACIN Deteccin y exclusin de los datos que no sean


correctos ni consistentes.
EFECTIVIDAD La probabilidad de que una tarea alcance los objetivos
deseados.
Ej: el porcentaje de registros para los cuales la latitud y la
longitud pueden ser determinados exactamente.
EFICIENCIA Producir los mximos resultados con los mnimos
recursos.
Ej: optimizar los procesos de georreferenciacin ordenando por
localidad y georreferencindolos utilizando los mismos mapas
para este conjunto de registros.

ACCESIBILIDAD cmo de accesibles son los resultados para los


usuarios/el pblico.
Ej: la facilidad con la que los usuarios acceden a la
georreferenciacin de una localidad particular que acaba de
ser georreferenciada.
TRANSPARENCIA hacer pblicos los procedimientos y la
documentacin para el manejo de la coleccin, los anlisis
realizados, los informes y las actualizaciones.
Ej.: conocer los mtodos con que han sido
georreferenciados un grupo de registros y disponer de la
documentacin asociada a esta tarea.

ACTUALIDAD DE LOS DATOS Se refiere a la frecuencia de


actualizacin del conjunto de los datos de la coleccin.
Cundo fueron los datos actualizados por ltima vez?
Con qu frecuencia se actualizan y son puestos a disposicin
de los usuarios?
La frecuencia de actualizacin deben ser concretada y
documentada.

Otras caractersticas que deben ser observadas son:


Documentacin: es un principio clave. Permite a los usuarios
verificar si los datos se ajustan al uso que necesitan en ese
momento.
Feedback: mecanismo de retroalimentacin a travs del cual
los usuarios informan a cerca de errores, y hacen que esta
informacin se refleje en la calidad de los datos.

Formacin y entrenamiento del personal: debe incluir


desde los colectores, hasta los operadores de digitalizacin
de los datos y los gestores de las bases de datos.
Crear protocolos de actuacin que sirvan de base para la
formacin del personal, y para las tareas del da-a-da.

En general, un buen entendimiento de los errores y su propagacin


conduce a un control activo de la calidad.
Burrough and McDonnell, 1998

Ya que el error es algo ineludible, debera ser reconocido como una


dimensin fundamental del dato. Y necesita ser detectado, registrado
y documentado.
Chrisman, 1991

Formacin

Herramienta de validacin

Repositorio

Formacin
Desde 2007

Talleres presenciales y online

III Taller GBIF sobre calidad en bases de datos sobre biodiversidad


(2009)
http://www.gbif.es/formaciondetalles.php?IDForm=60

Entorno Virtual de Formacin GBIF.ES: III Taller de Calidad en


bases de datos sobre biodiversidad (2012)
http://elearning.gbif.es/AContent/home/course/content.php?_cid=77

Vdeos de las sesiones tericas


http://www.gbif.es/videos/videos.php

Formacin presencial

http://www.cienciatk.csic.es/
http://www.gbif.es/formaciondetalles.php?IDForm=60

Formacin en lnea

http://elearning.gbif.es/login.php

Formacin en lnea

http://elearning.gbif.es/AContent/home/index.php

Paquete SCORM

Herramienta de validacin

Darwin Test

Software MS Access Windows

Interfaz grfico de fcil manejo a travs de formularios

Validacin y chequeo de los datos en formato Darwin Core

Detecta errores de varios tipos:


Errores de omisin
Errores tipogrficos
Errores de convencin

Errores de congruencia

Permite corregirlos de una manera sencilla desde los propios


formularios de validacin

CARACTERSTICAS I

Validar y chequear las tablas en formato Darwin Core 1.2 y 1.4.

Activacin/desactivacin de las consultas existentes.

Creacin de nuevas consultas.

Corregir los errores detectados.

Importacin/exportacin de archivos con formato Darwin Core Archive.

Importacin de datos procedentes de archivos eml y xml.

CARACTERSTICAS II

Chequeo de los nombres cientficos:


The Catalogue of Life/Species 2000
Tabla Archivos de Autoridad Taxonmica (AAT) del SiB Colombia

Otras base de datos con nombres cientficos.

Conversin de coordenadas a geogrficas en grados decimales.

Detecta y elimina caracteres ASCII anmalos.

Permite la creacin y gestin de filtros de usuario para eliminar registros o


generalizar coordenadas selectivamente de las tablas DARWINCOREV2 y
DARWINCOREV14.

Creacin del ndice de Calidad Aparente (ICA) para el seguimiento de la


mejora de la calidad de los datos. http://www.gbif.es/ICA.php

DESCARGA

Desde la pgina web: http://www.gbif.es/darwin_test/Darwin_Test.php

MS Access 2003 o 2007

Cdigo fuente accesible desde la pgina del proyecto en Sourceforge.net bajo


licencia Creative Commons

ltima versin julio 2012

Manual 3,2

Biodiversity Data Quality (BDQ):

Localizador de recursos relacionados con la calidad de los datos de


biodiversidad
Reunin nodos europeos de GBIF 2011
Compatible con el Centro de Recursos en Lnea de GBIFS
Estructura: herramientas, tesauros, formacin y procesos y
experiencias
Formulario para aadir recursos
http://www.gbif.es/BDQ
Presentacin flash

Biodiversity Data Quality (BDQ):

Cristina Villaverde
Unidad de Coordinacin de GBIF
Real Jardn Botnico -CSIC
Claudio Moyano 1
28014 Madrid, Spain

villaverde@gbif.es
www.gbif.es
Telf: + 34 91 420 3017

Você também pode gostar