CON EL APOYO DE:
Guía de
implementación para la Evaluación de la calidad de información geográfica
2022
CON EL APOYO DE:
Modernización de la Administración de Tierras en Colombia
Guía de implementación para la Evaluación de la calidad de información geográfica
Esta publicación se da en el marco del Contrato xx Xxxxxxxx No. 8937 8937-CO del 13 xx xxxxxx de 2019 con el Banco Internacional de Reconstrucción y Fomento (BIRF), así como del Contrato xx Xxxxxxxx No. 8937 4856/OC-CO firmado con el Banco Interamericano de Desarrollo (BID) el
25 de octubre de 2019, con el propósito de ejecutar el “Programa para la Adopción e Implementación de un Catastro Multipropósito Rural – Urbano”, mediante el Subcomponente 2.4 Fortalecimiento de la ICDE.
1 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Información del documento
Proyecto | “Programa para la Adopción e Implementación de un Catastro Multipropósito Rural – Urbano”, mediante el Subcomponente 2.4 Fortalecimiento de la ICDE. |
Identificador | GU-GD-03 |
Nombre del documento | Guía de implementación para la Evaluación de la calidad de información geográfica. |
Estado | Vigente |
Control de versiones del documento
Versión | Fecha | Descripción del cambio | Elaborado por | Aprobado por |
1.0 | 04/11/2020 | Creación del documento | GIT – Gobierno Geoespacial | GIT – Gobierno Geoespacial Oficina CIAF - IGAC |
1.1 | 22/07/2022 | Actualización plantilla documento, complementación conceptos | Xxxxx Xxxxxx Xxxxxxxxx Xxxxxx | CTO – ICDE Subdirección de Información IGAC |
2 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Contenido
2.4. Normas y guías para consulta 9
3.6 Especificación técnica de producto de datos 11
3.9 Medida básica de calidad 11
3.14 Subelementos de calidad 12
4. Consideraciones generales 12
3 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
4.1. Calidad de la información geográfica 12
4.2. Proceso de evaluación de la calidad de la información geográfica 13
4.3. ¿Quién evalúa la calidad? 14
5. Proceso de evaluación de la calidad 14
5.1.2. Elementos de calidad 16
5.1.2.2. Consistencia lógica 18
5.1.2.3. Exactitud posicional 18
5.1.2.5. Exactitud Temática 19
Exactitud de un atributo cualitativo 19
5.2. Determinar las medidas de calidad 20
5.2.1. Nivel de conformidad 20
5.2.2. Medidas básicas de calidad 21
5.2.2.1. Medidas básicas relacionadas con el conteo 21
5.2.2.2. Medidas básicas relacionadas con la incertidumbre 22
Variable aleatoria de dos dimensiones X e Y 23
Variable aleatoria de tres dimensiones X, Y, Z: 23
5.3. Definir los procedimientos de evaluación 23
5.3.1. Método de evaluación directa 23
4 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
5.3.2. Método de evaluación indirecta 24
5.3.3. Agregación y derivación 25
5.4. Determinar los resultados de la evaluación de la calidad 26
5.4.1. Informe de resultados en el metadato 27
5.4.2. Informe de resultados en un informe independiente 27
5.4.3.1. Informe sobre resultados agregados 27
5.4.3.2. Informe sobre resultados derivados 28
5.4.3.3. Referencia al resultado original 28
5.4.4. Periodicidad del informe de calidad 28
5.4.5. Validación de resultados 28
6. Correspondencia con otras normas o guías 30
7.1. Relación de medidas relacionadas con el conteo 31
7.2. Relación de medidas básicas relacionadas con la incertidumbre 34
7.2.1. Variable aleatoria de una dimensión Z 34
7.2.2. Variable aleatoria de dos dimensiones X e Y 35
7.2.3. Variable aleatoria de tres dimensiones X, Y,Z 36
7.3. Gestión de las medidas 37
7.6.1. Descripción del producto 39
5 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
7.6.2. Proceso de evaluación de la calidad 40
7.6.3. Informe en el metadato 42
7.7. Formato evaluación de la calidad de los datos en el metadato 42
7.7.1. Alcance o nivel de medición de la calidad (*): Elija un elemento 42
7.7.1.2. Elemento/Subelemento de calidad (*): Elija un elemento y subelemento 42
7.7.1.4. Método de evaluación 43
7.7.1.5. Resultado cuantitativo (*) 43
7.7.1.6. Resultado descriptivo(C) 43
7.7.1.7. Resultado de cobertura (C) 43
8. Referencias bibliográficas 45
Índice de tablas
Tabla 1. Descripción del proceso de evaluación de la calidad 15
Tabla 2. Relación de los elementos y subelementos de calidad 17
Tabla 3. Relación de las medidas básicas de calidad relacionadas con el conteo 21
Tabla 4. Relación de medidas de calidad 31
Tabla 5. Relación entre cuantiles de la distribución normal y el nivel de significación 35
Tabla 7. Relación entre la probabilidad P y el radio correspondiente del área circular 36
Tabla 8. Relación entre la probabilidad P y el radio correspondiente del volumen esférico
Tabla 9. Ejemplo de relación de alcances de la evaluación, a relacionar en el informe de calidad 39
Tabla 10. Ejemplo de relación de las unidades de calidad empleadas, a relacionar en el
6 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Tabla 11. Ejemplo de las medidas empleadas, a relacionar en el informe de calidad 40
Tabla 12. Ejemplo de la documentación del resultado del elemento de totalidad 41
Tabla 13. Ejemplo de la documentación del resultado de la evaluación del elemento de totalidad 41
Ilustración 1. Proceso de evaluación de la calidad 15
Ilustración 2. Métodos de evaluación de la calidad de información geográfica 26
Ilustración 3. Proceso de evaluación de la metacalidad 30
7 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
1. Introducción
La incorporación de estándares en las líneas de producción son una actividad fundamental para garantizar los principios de calidad e interoperabilidad del dato, es así como la adopción de estándares de calidad para el geodato y los procesos de elaboración de información espacial cobran relevancia en la situación actual xxx xxxxxxx de la información geográfica que demanda el cumplimiento de requerimientos cada vez más específicos y exigentes conforme se desarrollan las tecnologías de captura y almacenamiento.
Este documento busca ofrecer lineamientos para los procesos de planeación, ejecución y reporte de la evaluación de la calidad, así como algunas consideraciones relevantes para tener en cuenta en su planteamiento, de acuerdo con el tipo de dato, cantidad, características y otras condiciones del productor, que busca cumplir las especificaciones planteadas y atender a los requerimientos del usuario de una manera óptima.
También, ofrece de manera inicial algunas definiciones y conceptos básicos con el fin de facilitar su lectura y comprensión a usuarios de toda clase o formación, continúa con una descripción detallada del proceso de evaluación de la calidad y las consideraciones a tener en cuenta en cada uno de los pasos que comprende dicho proceso y continúa con la relación de la correspondencia de esta guía con otras existentes en el marco de la ICDE.
Finalmente, concluye con una serie de anexos informativos que ayudarán al lector a afianzar conocimientos y a adoptar herramientas que le faciliten la implementación del estándar internacional de calidad para la información geográfica como una relación de medidas (asociadas al recuente y a la incertidumbre), buenas prácticas en la gestión de medidas, métodos de muestreo, recomendaciones en la ejecución de evaluaciones, informe de calidad y reporte de calidad en el metadato.
8 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
2. Objeto
2.1. Objetivo general
Ofrecer a la comunidad ICDE conceptos, lineamientos y buenas prácticas a tener en cuenta para la evaluación de la calidad de la información geográfica y la toma de decisiones que atiendan a sus resultados, los cuales serán de utilidad a las entidades productoras, custodias y usuarias de información geográfica y todos aquellos actores involucrados en dicha tarea. Dichos lineamientos aumentarán las capacidades de la comunidad geográfica para lograr el exitoso cumplimiento de los objetivos de la ICDE en torno a la obtención de información geográfica verídica y oportuna.
2.2. Objetivos específicos
• Conocer los conceptos generales relacionados con la calidad de la Información Geográfica - IG
• Reconocer el estándar internacional de calidad de la IG
• Identificar el proceso de evaluación de la calidad
• Conocer los elementos y subelementos de calidad empleados para la evaluar la información geográfica
• Examinar las medidas de evaluación de calidad y su aplicabilidad de acuerdo con los subelementos
• Reconocer el proceso de reporte de calidad
• Ejecutar procesos de evaluación
2.3. Campo de aplicación
Comunidad geográfica de la Infraestructura Colombiana de Datos Espaciales
2.4. Normas y guías para consulta
El estándar internacional de la evaluación de la calidad es la ISO19157:2013 y su ISO19157:2016. Debido a que la evaluación de la información geográfica responde a la verificación del cumplimiento de requisitos de un producto, proceso o servicios
9 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
geográficos, es evidente su relación con gran parte de las normas internacionales de información geográfica, de las cuales se resaltan las siguientes:
ISO 19104 – Terminología
ISO 19105 – Conformidad y pruebas
ISO 19110 – Metodología para la catalogación de objetos ISO19115 – Metadatos geográficos
ISO 19126 – Concepto, diccionario y registro de objetos ISO 19131 – Especificaciones técnicas de productos ISO ISO 19135 – Procedimiento para el registro de ítems
ISO 19157 – Calidad de datos y su relación con las normas de la familia ISO 19100
3. Términos y definiciones
3.1 Calidad
Grado con el que un conjunto de características inherentes cumple unos requisitos.
3.2 Conformidad
Cumplimiento de los requisitos especificados.
3.3 Conjunto de datos
Colección identificable de datos.
3.4 Corrección
Correspondencia con el universo en discurso.
10 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
3.5 Elemento de calidad
El elemento de calidad es un componente que describe un aspecto de la calidad de los datos geográficos. Estos se ofrecen una medición o apreciación de las inconsistencias de un dato geoespacial respecto a parámetros establecidos en la especificación técnica o a unos requerimientos del usuario; el propósito de estos elementos es identificar las inconsistencias de acuerdo con los aspectos técnicos que son susceptibles de evaluar de acuerdo con el producto definido en el alcance.
3.6 Especificación técnica de producto de datos
Descripción detallada de un conjunto de datos junto con la información adicional que permite su creación, suministro y utilización por otras partes.
3.7 Exactitud
Grado de concordancia entre el resultado de un ensayo o una medición y el valor verdadero.
3.8 Ítem
Lo que se puede describir y considerar individualmente. Un ítem puede ser cualquier parte de un conjunto de datos, como un objeto geográfico, una instancia, un atributo, una relación o una combinación.
3.9 Medida básica de calidad
Medida de la calidad de los datos genérica, utilizada como base para la creación de medidas específicas de la calidad de los datos.
3.10 Medida de calidad
Determina qué se va a examinar en el proceso de evaluación ya a partir de su definición, se diseña la ejecución del proceso de evaluación y la presentación de su resultado.
11 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
3.11 Metacalidad
Información que describe la calidad de la calidad de los datos.
3.12 Nivel de conformidad
Valor umbral o conjunto de calores umbral, para los resultados de la calidad de datos, empleados para determinar lo bien que se adecúan a los criterios expuestos en sus especificaciones técnicas o en los requerimientos del usuario.
3.13 Objeto geográfico
Abstracción de un fenómeno del mundo real.
3.14 Subelementos de calidad
Componente cuantitativo de cualquier elemento de calidad que permite medir y obtener el estado de los datos.
3.15 Unidad de calidad
La unidad de calidad de los datos la compone un alcance y uno o más elementos de calidad.
3.16 Universo en discurso
Vista del mundo real o hipotético que incluye todo aquello que es de interés.
4. Consideraciones generales
4.1. Calidad de la información geográfica
La calidad es conocida como la “propiedad o conjunto de propiedades inherentes a un objeto, que permiten apreciarla como igual, mejor o peor que las restantes de
12 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
su especie” y en el ámbito de la producción de información como “el conjunto de características de un producto o servicio que le confieren su aptitud para satisfacer unas necesidades explícitas e implícitas”.
La evaluación de calidad del dato geográfico tiene como propósito verificar el cumplimiento de los requerimientos de los productores y los usuarios, durante el proceso planeación, producción y publicación de la Información Geográfica (IG).
De esta manera, se garantiza que los resultados sean confiables y expongan resultados requeridos.
Además de éste, existen diversos factores que influyen en la calidad de un producto, como los enunciados a continuación:
• Estudio xx xxxxxxx
• Diseño (escala de detalle, simbología, cumplimiento de estándares)
• Proceso de producción (tecnologías y medios de captura)
• Conformidad con estándares
• Fiabilidad, disponibilidad
• Ciclo de vida un producto
4.2. Proceso de evaluación de la calidad de la información geográfica
Los procesos de evaluación de la calidad se aplican en diferentes fases del ciclo de vida de un producto: planeación o establecimiento de su especificación, producción, inspección, entrega, uso y actualización. Los procesos tienen diferentes objetivos en cada una de las fases.
La calidad de los datos debe describirse para cada alcance deseado empleando los elementos de la calidad. Estos elementos y sus descriptores describen el grado de adecuación de un conjunto de datos a los criterios establecidos en sus especificaciones de producto, o a los requerimientos de usuario, y proporcionan información cuantitativa sobre la calidad.
13 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Es necesario evaluar cada uno de los procesos de producción puesto que es una forma eficaz de minimizar el error. Para ello se propone tener en cuenta las posibles fuentes de error asociadas a cada uno de los procesos de producción:
• Datos primarios, son aquellos datos que serán recolectados para el desarrollo del proyecto
• Captura de datos, es la recopilación manual o automatizada de datos
• Entrada de datos a un sistema, es el proceso de ingresar datos a un ordenador u otro dispositivo electrónico
• Procesamiento de datos, es el manejo o manipulación que se realiza a los datos recolectados para producir información que sea de interés para el proyecto
• Presentación de los datos, etapa que tiene el fin de representar de manera concreta los datos recolectados y la información obtenida posterior a su procesamiento y análisis
• Interpretación de los datos, es la revisión e interpretación de la información obtenida para concluir la relevancia y aporte que tiene para el proyecto.
4.3. ¿Quién evalúa la calidad?
Debido a que las evaluaciones de calidad dependen de las condiciones de captura, producción, procesamiento, y distribución, la evaluación de calidad debe ser definida por el productor quien en conocimiento de estos aspectos conoce las posibles fuentes de imprecisión y su tratamiento.
5. Proceso de evaluación de la calidad
A continuación, se presentan los pasos a tener en cuenta en el proceso de evaluación de la calidad de la información geográfica, de acuerdo con las actividades a realizar en las etapas de planeación y evaluación, como se enseñan en la Ilustración 1 y se describen en la Tabla 1 y los numerales del presente capítulo.
14 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Ilustración 1. Proceso de evaluación de la calidad
Descripción:
Tabla 1. Descripción del proceso de evaluación de la calidad
PASO | ACCIÓN | DESCRIPCIÓN |
1 | Especificar las unidades de la calidad de datos | Una unidad de la calidad de datos se compone de un ámbito y de elementos de calidad. Deben emplearse todos los elementos pertinentes o aplicables, para los datos cuya calidad va a describirse |
2 | Especificar las medidas de la calidad de datos | Si aplica, debe especificarse la medida a emplear para cada elemento de calidad |
3 | Especificar los procedimientos de evaluación de la calidad de los datos | Un procedimiento de evaluación de la calidad consiste en la aplicación de uno o más métodos de evaluación |
4 | Determinar la salida de la evaluación de la calidad de datos | La salida de la aplicación de la evaluación es un resultado, un reporte |
15 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
5.1. Unidades de calidad
Definir la unidad de calidad de los datos depende del alcance y los elementos y subelementos de calidad. A continuación, se realizará la presentación de estos conceptos.
5.1.1 Alcance
Una evaluación de la calidad tiene diversos alcances, es decir, es posible aplicarse a una serie de conjuntos de datos, a un conjunto de datos, o a un subconjunto de datos y que, dentro de éste, compartan características comunes, de forma que pueda evaluarse su calidad. La elección del alcance de la evaluación de la calidad es responsabilidad del productor y el criterio más común es optar por aquel alcance o unidad que más se distribuya o
Algunos alcances para identificar en la calidad de los datos son los siguientes:
• Series de conjuntos de datos
• Conjunto de datos
• Subconjunto de datos definido por:
o Tipos de ítems (objeto, atributos, operaciones, relaciones)
o Ítems específicos (conjuntos de instancias, valores de atributo o instancias de relaciones)
o Extensión geográfica (un lugar específico)
o Extensión temporal (un periodo o momento específico)
5.1.2. Elementos de calidad
El elemento de calidad es un componente que describe la calidad de los datos geográficos. Ofrecen una medición o apreciación de las inconsistencias de un dato geoespacial respecto a parámetros establecidos en la especificación técnica o a unos requerimientos del usuario. Dichos elementos se organizan en diferentes categorías, enseñadas a continuación:
• Totalidad
• Consistencia lógica
• Exactitud posicional
• Calidad temporal
• Exactitud temática
• Usabilidad
A su vez, cada uno de ellos se clasifica en subelementos, que evalúan aspectos específicos del producto:
16 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Tabla 2. Relación de los elementos y subelementos de calidad
Elemento | Subelemento |
Totalidad | Comisión Omisión |
Consistencia lógica | Consistencia conceptual Consistencia de dominio Consistencia de formato Consistencia topológica |
Calidad Temporal | Exactitud de una medida de tiempo Consistencia temporal Validez temporal |
Exactitud Temática | Exactitud de clasificación |
Usabilidad | Atención a los requerimientos del usuario |
A continuación, se presenta una descripción detallada de los elementos y sus correspondientes subelementos:
5.1.2.1. Totalidad
Nivel de veracidad con el cual los elementos capturados representan el mundo real definido en las especificaciones de producto. Describe la presencia o ausencia de objetos, atributos y/o relaciones.
• Comisión:
Medida de la diferencia (por exceso) entre los ítems especificados y los ítems presentes en el conjunto de datos.
• Omisión:
Medida de la diferencia (por defecto) entre los ítems especificados y los ítems presentes en el conjunto de datos.
17 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
5.1.2.2. Consistencia lógica
Grado en que el conjunto de datos se adhiere a las reglas o parámetros establecidos en el modelo conceptual, generado durante la fase de planeación del conjunto de datos.
Consistencia de dominio:
Cercanía de valores del conjunto de datos al valor del dominio.
Grado en el cual los datos están almacenados de acuerdo con la estructura física del conjunto de datos.
Exactitud de las características topológicas codificadas de un conjunto de datos.
5.1.2.3. Exactitud posicional
Describe la exactitud o cercanía en posición de los objetos en el conjunto de datos, en un determinado sistema de referencia, con respecto a su posición verdadera (o a la asumida como verdadera).
Exactitud absoluta o externa
Proximidad de los valores de las coordenadas reportados respecto a los valores verdaderos o asumidos como tales.
Exactitud relativa o interna
Proximidad de las posiciones relativas de los objetos geográficos de un conjunto de datos respecto a sus posiciones relativas verdaderas (como los demás elementos de este conjunto) o aceptadas como tales.
Exactitud posición de datos ráster
Proximidad de los valores de posición de datos grilla a los valores verdaderos o aceptados como tales.
18 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
5.1.2.4. Calidad Temporal
Describe la calidad de los atributos y relaciones temporales de los objetos geográficos. Este elemento es una mezcla de elementos que dependen de reglas lógicas y al conocimiento de la realidad en el terreno.
Exactitud de una medida de tiempo
Describe la cercanía de las medidas de tiempo reportadas, respecto a los valores verdaderos o aceptados como tal (reporte de error de las mediciones de tiempo).
Consistencia temporal
Exactitud del orden de los eventos.
Validez de los datos con respecto al tiempo.
5.1.2.5. Exactitud Temática
Precisión de atributos cuantitativos, de atributos no cuantitativos y de la clasificación de objetos y sus relaciones.
Comparación de las clases asignadas a los objetos o a sus atributos respecto a un universo en discurso (ya sea el terreno o un producto de referencia).
Exactitud de un atributo cualitativo
Medida de si un atributo no cuantitativo es correcto o incorrecto.
Exactitud de un atributo cuantitativo
Cercanía del valor de un atributo cuantitativo respecto a su valor verdadero o aceptado como tal.
5.1.3. Usabilidad
Se puede basar en los requerimientos del usuario que no pueden ser descritos a través de los elementos de calidad: la usabilidad se aplica para describir la idoneidad de un conjunto de datos para una aplicación particular, o su conformidad frente a un conjunto de requisitos. Para su evaluación pueden emplearse todos los
19 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
elementos de calidad (Totalidad, consistencia lógica, exactitud posicional, exactitud temporal y exactitud temática).
Este elemento también puede emplearse cuando se desee ofrecer un resultado de agregación en el que se agreguen resultados de varias categorías.
5.2. Determinar las medidas de calidad
Corresponde a la identificación de la prueba que será aplicada al producto señalado en el alcance, de acuerdo al subelemento de calidad definido, el nivel de conformidad deseado y los procedimientos técnicos desarrollados por el proyecto. Es decir, la medida determina qué se va a examinar en el proceso de evaluación y a partir de su definición se debe ejecutar todo el proceso. Por ejemplo, número de errores, porcentaje de aciertos, presencia de errores, tasa de aciertos…etc.
La evaluación de la calidad de un conjunto de datos se mide empleando diversos métodos. Adoptar una única medida podría ser insuficiente para evaluar, de forma completa, la calidad de un alcance específico y también lo podría ser frente a todos los posibles usos del conjunto de datos. Una combinación de medidas puede proporcionar información útil y por ello se pueden ofrecer múltiples medias de calidad para uno o varios alcances.
Para llevar a cabo de una manera correcta la elección de la medida es necesario aclarar los conceptos de nivel de conformidad, y conocer el tamaño de la población de los datos a evaluar (si son dinámicos o no):
5.2.1. Nivel de conformidad
La conformidad, relacionada con el concepto de calidad y el cumplimiento de un conjunto de características medibles, establecidas por el productor para satisfacer al cliente, hace referencia a una tolerancia o nivel de aceptación que el creador estima para juzgar el producto como aceptable.
En tal sentido, el establecimiento del umbral de conformidad se debe realizar, en primer lugar, atendiendo a las expectativas del cliente y el mercado de la información geográfica. De igual manera se debe tener en cuenta el análisis de la capacidad instalada del productor, su infraestructura y recursos disponibles. El
20 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
estudio de estos aspectos, junto con las características propias del producto geográfico, le permitirá al productor estimar la viabilidad de garantizar la aprobación de la totalidad o parte del alcance al cual le está evaluando la calidad. Por ejemplo, evaluar si es posible analizar la omisión de los predios catastrales de una gran ciudad y estimar si cuenta con los recursos necesarios para ello.
De igual forma, en la definición de esta tolerancia, es de vital importancia tener muyen cuenta que su planteamiento debe obedecer a la medida adoptada para la evaluación de calidad que se planee realizar. Esto es necesario debido a que la tolerancia debe estar expresada en los términos en los que lo está el proceso de evaluación y el resultado.
5.2.2. Medidas básicas de calidad
La elección de la prueba a realizar se realiza a partir de la consideración de un conjunto de medidas básicas de la calidad del dato, las cuales se clasifican de acuerdo con si su método comprende el conteo de errores/aciertos o medidas relacionadas con la incertidumbre. La magnitud medida se puede definir en diferentes dimensiones y dependiendo de dicha dimensión, se emplean diferentes tipos de medias básicas.
5.2.2.1. Medidas básicas relacionadas con el conteo:
Tabla 3. Relación de las medidas básicas de calidad relacionadas con el conteo
Medida básica de calidad | Definición | Ejemplo | Tipo de dato |
Indicador de error | Indicador de un ítem es incorrecto | Falso | Booleana (si el valor es Verdade ro, el ítem es incorrect o) |
Indicador de correcció n | Indicador de un ítem es correcto | Verdadero | Booleano (si el valor es verdadero el ítem es correcto) |
Conteo de errores | Número total de ítems que poseen un error de una tipología concreta | 12 | Entero |
21 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Conteo de aciertos | Número total de ítems que están libres de errores de una tipología concreta | 380 | Entero |
Índice de error | Número de ítems erróneos respecto al número total de ítems | 2,88% | Porcentaje |
0,0288 | Real | ||
Índice de ítems correctos | Número de ítems correctos respecto al número total de ítems | 97,12% | Porcentaje |
0,9712 | Real |
NOTA: Vale la pena resaltar que la elección de la medida y el nivel de conformidad debe realizarse con miras a prevenir la redefinición continua de las especificaciones y su sección de evaluación de calidad, promoviendo su reutilización y validez en el ciclo de producción. Es decir, si el tamaño de la población es constante, podremos optar por una medida básica como número de errores/aciertos, tasa de errores/aciertos, relación de errores/aciertos. Si es dinámico, las mejores opciones serán porcentaje de errores/aciertos o el primer caso enseñado en la tabla anterior, es decir, la búsqueda de total conformidad o existencia de algún error.
5.2.2.2. Medidas básicas relacionadas con la incertidumbre
Los valores numéricos obtenidos mediante medición solo pueden obtenerse con una exactitud determinada. Esa incertidumbre puede cuantificarse al tratar la magnitud medida como una variable aleatoria. En tal sentido, para la definición de este tipo de medidas básicas, se usan las diferentes formas de describir la incertidumbre con métodos estadísticos, los cuales se basan en los siguientes supuestos:
o Incertidumbres homogéneas para todos los valores observados
o No existe correlación entre los valores observados
o Los valores observados tienen una distribución normal
Los posibles casos de medidas básicas se mencionan a continuación, y son descritas más adelante en el numeral 7.1 Relación de medidas relacionadas con el conteo.
Variable aleatoria de una dimensión, Z:
Para una magnitud medida que adopta valores reales es imposible ofrecer la probabilidad de que un único valor sea el verdadero, pero si es posible proporcionar la probabilidad de que el valor verdadero esté en cierto intervalo, llamado ‘intervalo de confianza’.
22 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Variable aleatoria de dos dimensiones X e Y:
Es el caso en que de una variable aleatoria unidimensional Z puede expandirse a dos dimensiones cuando siempre de obtienen dos valores para la magnitud medida. El resultado se da por la tupla X, Y y obedece los mismos supuestos que la aleatoria unidimensional.
Variable aleatoria de tres dimensiones X, Y, Z:
El caso de una variable aleatoria unidimensional Z puede expandirse a tres dimensiones cuando siempre se obtienen tres valores para la magnitud medida. El resultado se caracteriza por la tupla X, Y,Z y sigue los mismos supuestos que la aleatoria unidimensional.
Para su detalle, ver numeral 7.2 Relación de medidas básicas relacionadas con la incertidumbre
5.3. Definir los procedimientos de evaluación
El método es el camino que se debe seguir en los diferentes procedimientos necesarios para realizar la evaluación de la calidad. Un procedimiento de evaluación de calidad de los datos comprende uno o más métodos de evaluación de calidad de datos. Estos métodos pueden dividirse en dos clases principales: directos e indirectos. Los métodos directos determinan la calidad mediante la comparación de los datos con información de referencia interna o externa. Los métodos indirectos infieren o estiman la calidad usando información sobre los propios datos, como el linaje (documentado en el metadato del producto o del alcance). Los métodos directos de evaluación se pueden a su vez subclasificar, atendiendo a la fuente de información necesaria para realizar la evaluación, en internos o externos.
5.3.1. Método de evaluación directa:
Un método de evaluación directa es un método de evaluación de la calidad de un conjunto de datos basado en la inspección de los ítems del conjunto de datos. Los métodos de evaluación directa pueden clasificarse como internos o externos:
23 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Evaluación de la calidad directa interna: Utiliza solo datos que se encuentran en el propio conjunto de datos que se está evaluando.
Evaluación de la calidad directa externa: Requiere datos de referencia externos al conjunto de datos que se está evaluando.
Para ambos métodos de evaluación, externos e internos, puede usarse uno de los siguientes métodos de inspección:
Inspección completa:
Comprueba cada ítem de la población especificada por el alcance de la evaluación de la calidad y es más apropiada para poblaciones pequeñas o para pruebas que puedan realizarse de forma automática.
Ejemplo: Evaluar la correcta nomenclatura de todos los valores de un atributo compuesto por un número de valores determinados alfanuméricos, a través de una consulta o validación en el sistema de base de datos.
Implica que las pruebas se realizan en subconjuntos de los datos geográficos definidos por el alcance de la evaluación de la calidad. En el anexo 7.4 Métodos de muestreo se proporcionan metodologías y ejemplos de muestreo.
Ejemplo: Para verificar la veracidad de la clasificación de uso y cobertura de un estudio en un área de gran extensión, se opta por evaluar una parte de los polígonos o áreas identificadas a partir de un muestreo.
5.3.2. Método de evaluación indirecta:
Un método de evaluación indirecta es un método de evaluación de la calidad de un conjunto de datos basado en conocimiento o experiencia externa sobre el producto y, por ende, generalmente es subjetivo.
Ese conocimiento externo puede incluir una o más informaciones no cuantitativas de la calidad sobre el uso, historia y propósito (véase Guía de Metadatos
24 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
geográficos, basado en ISO19115-1) y otros informes sobre la calidad del conjunto de datos o de los datos usados para producirlo. La calidad puede estimarse, por ejemplo, a partir de información sobre la(s) fuente(s) de información, las herramientas y los métodos usados para capturar los datos, y evaluarse en contraste con procedimientos y especificaciones elaboradas para ese producto.
La calidad evaluada de forma indirecta puede también basarse únicamente en la experiencia. Si se informa sobre la calidad de datos evaluada de forma indirecta, debería acompañarse de una descripción sobre cómo se ha determinado.
El empleo de este método se atiende especialmente cuando no existen herramientas o se desconocen datos para obtener una evaluación cuantitativa.
5.3.3. Agregación y derivación
Se pueden generar resultados adicionales mediante la agregación o la derivación de resultados existentes sin llevar a cabo una nueva evaluación de la calidad de datos.
La agregación combina resultados de evaluaciones de la calidad basadas en diferentes elementos de la calidad o diferentes ámbitos de la calidad.
También pueden derivarse resultados adicionales de resultados existentes, por ejemplo, cuando un resultado de conformidad se obtiene mediante la comparación de un resultado cuantitativo con un nivel de conformidad. Esto es útil por ejemplo si el resultado está expresado de forma diferente al nivel de conformidad. La agregación puede usarse para agregar resultados de diferentes elementos de la calidad para describir la conformidad frente a unas especificaciones.
Ejemplo: Si el resultado se expresa con una probabilidad del 95% y el nivel de conformidad se expresa con una probabilidad del 99%, el resultado podría recalcularse para tener la misma probabilidad que el nivel de conformidad.
25 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Ilustración 2. Métodos de evaluación de la calidad de información geográfica
Por último, para cada medida de la calidad de datos se debe proporcionar un método de evaluación. Éste se usa para describir la metodología empleada para aplicar una medida a los datos especificados por su ámbito, o referenciar una documentación que la describa.
5.4. Determinar los resultados de la evaluación de la calidad
El informe de resultados de la evaluación de la calidad es importante en búsqueda de socializar al productor y al usuario herramientas e información que le permitan determinar el cumplimiento de los requerimientos y especificaciones. De igual manera, para los siguientes aspectos:
• Ayudar a encontrar el conjunto de datos y fomentar su uso
• Socializar el avance de la gestión de los proveedores
• Permitir la posterior retroalimentación o comparación con otros informes de la calidad
• Permitir la correcta toma de decisiones
Los resultados de la evaluación de la calidad se deben informar en los metadatos, de una manera breve y estructurada, o en un informe de calidad independiente,
26 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
que proporciones más detalles que los ofrecidos por los metadatos en un lenguaje sencillo. Sea cual sea la forma, la evaluación de uno o más elementos de calidad debe ofrecer al menos un resultado de los siguientes tipos:
• Resultado cuantitativo: Valor o valores obtenidos tras haber aplicado las medidas de la calidad a cada subelemento evaluado.
• Resultado de conformidad: Valor o conjunto de valores obtenidos comparado(s) con el nivel de conformidad especificado.
• Resultado descriptivo: Su diligenciamiento es obligatorio en el caso que no se determinen medidas de calidad, a excepción del de usabilidad con una especificación determinada.
5.4.1. Informe de resultados en el metadato
En el metadato, la sección de calidad permite documentar los resultados de una o varias unidades de calidad.
5.4.2. Informe de resultados en un informe independiente
Debe emplear un lenguaje sencillo de manera que el lector pueda identificar con facilidad el alcance y extensión de los datos cubiertos por el informe, también debe contener información que permita describir de forma suficiente los principales aspectos de la metodología y los resultados de la evaluación de la calidad.
Es importante, además, que contenga referencias a documentación adicional relacionada, como las especificaciones del producto, el catálogo de medidas empleado, documentos de salvedades, pliegos de condiciones, etc. Ver numeral
7.6 Informe de calidad.
5.4.3. Casos particulares
5.4.3.1. Informe sobre resultados agregados
Cuando se agrega el resultado, se debe informar la calidad de forma independiente para completar la información proporcionada por el metadato.
27 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
También, proporcionará información completa de los resultados originales (con los procedimientos de evaluación y medidas aplicadas), del resultado agregado y del método de agregación, mientras que los metadatos solo pueden describir el resultado agregado con una referencia a los resultados originales.
5.4.3.2. Informe sobre resultados derivados
Cuando sólo se reportan los resultados derivados en el metadato, se debe generar un informe independiente para proporcionar los resultados de la calidad originales, a partir de los cuales se ha determinado el resultado derivado.
5.4.3.3. Referencia al resultado original
Cuando los resultados agregados o derivados se reportan en los metadatos, se debe referenciar el resultado original usando los atributos “elemento derivado” y “standalone” de la Norma ISO19157 incluido en el metadato.
5.4.4. Periodicidad del informe de calidad
Debido a que la creación, actualización y procesamiento de los productos es continuo, los resultados de la evaluación de su calidad pueden variar y pueden verse afectados por diversas circunstancias, como:
• Eliminación, modificación o adición de datos
• Modificación o actualización de las especificaciones técnicas del producto
• Identificación de nuevos requerimientos del usuario
• Cambios en los datos o realidad a capturar
5.4.5. Validación de resultados
Consiste en verificar que los resultados expuestos en el reporte general de calidad sean los establecidos en la especificación técnica del producto geográfico, al igual que tener en cuenta lineamientos descritos en las Normas Técnicas Colombianas relacionadas con calidad de la información geográfica.
Por otro lado, se debe contemplar que la producción de información geográfica, en especial aquella cartográfica, involucra someter los datos y la información a diversas transformaciones, como el modelamiento y procesamiento. Este hecho
28 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
permite deducir que el error y la exactitud se propagan cuando la información se somete a dichas transformaciones.
5.4.6. Metacalidad
La metacalidad es la descripción de la calidad de la evaluación de la calidad de los datos (método cuantitativo) y su resultado, de acuerdo con los siguientes criterios, relacionados con la idoneidad del método de evaluación, medidas aplicadas y sus resultados:
5.4.6.1. Confianza:
Confiabilidad del método empleado y el resultado de calidad de datos. Ejemplo: parámetros estadísticos, desviación estándar, intervalos de confianza.
5.4.6.2. Representatividad:
Grado en que la muestra utilizada ofrece un resultado representativo respecto a los datos evaluados (no solo el tamaño de la muestra).
5.4.6.3. Homogeneidad:
La uniformidad (esperada o probada) de los resultados obtenidos. Ejemplo: Comparación de los resultados de evaluación de varios segmentos de datos del conjunto.
La evaluación de la metacalidad se realiza siguiendo el proceso de evaluación ya expuesto, pero que tendrá como entrada los resultados de la evaluación de la calidad o el método seguido para la misma.
29 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Ilustración 3. Proceso de evaluación de la metacalidad
5.4.7. Formato reporte
Se emplea el formato para reportar los resultados cuantitativos del proceso de evaluación de calidad, que debe incorporar como mínimo los campos obligatorios que se exponen en el formato. Cabe resaltar que el informe de la evaluación de calidad no puede ser reemplazado por el informe de la especificación técnica y/o metadato.
En el capítulo 7.7 se presenta un esquema que permite describir cada uno de los campos utilizados en el formato de reporte de la evaluación.
6. Correspondencia con otras normas o guías
Esta guía se relaciona con otras que están involucradas en diversos procesos del ciclo de la información y que son proporcionadas por la ICDE, como las siguientes:
• Guía para la elaboración de especificaciones técnicas
30 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
• Guía para la catalogación de objetos geográficos
• Guía para la elaboración de metadatos geográficos
• Guía para la formulación de un plan de calidad
7. Anexos informativos
7.1. Relación de medidas relacionadas con el conteo
A continuación, se presenta una sugerencia de medidas sugeridas para su uso, abriendo la posibilidad de crear otras personalizadas e ingresarlas
Tabla 4. Relación de medidas de calidad
Elemento | I d | Nombre de la medida | |
Totalidad | Comisión | 1 | Ítem excedente |
2 | Numero de ítems excedentes | ||
3 | Índice de ítems excedentes | ||
4 | Numero de instancias de objeto geográfico duplicadas | ||
Omisión | 5 | Ítem omitido | |
6 | Numero de ítems omitidos | ||
7 | Índice de ítems omitidos | ||
Consistencia lógica | Consistencia conceptual | 8 | Incumplimiento del esquema conceptual |
9 | Cumplimiento del esquema conceptual | ||
1 0 | Numero de ítems que no cumplen las reglas del esquema conceptual | ||
1 1 | Numero de superposiciones no validas entre superficies | ||
1 2 | Índice de incumplimiento de las reglas del esquema conceptual | ||
1 3 | Índice de cumplimento de las reglas del esquema conceptual | ||
Consistencia de dominio | 1 4 | Conflictos en la estructura física | |
1 5 | Numero de conflictos en la estructura física | ||
1 6 | Índice de conflictos en la estructura física | ||
Consistencia topológica | 1 7 | Numero de fallos en conexiones punto - curva | |
1 8 | Índice de fallos en conexiones punto - curva | ||
1 9 | Número de conexiones omitidas por subtrazo (Undershoot) |
31 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
2 0 | Número de conexiones omitidas por sobretrazo (Overshoot) | ||
2 1 | Número de polígonos ficticios no validos (slivers) | ||
2 2 | Número de errores por auto intersecciones no válidas | ||
2 3 | Número de errores por auto superposiciones no válidas | ||
Exactitud posicional absoluta | Incertidumbres posicionales | 2 4 | Valor medio de las incertidumbres posicionales |
2 5 | Sesgos de las posiciones | ||
2 6 | Valor medio de las incertidumbres posicionales excluyendo atípicos (2D) | ||
2 7 | Número de incertidumbres posicionales mayores que un umbral | ||
2 8 | Matriz de covarianzas | ||
Incertidumbres posicionales verticales | 2 9 | Error lineal probable | |
3 0 | Error lineal típico | ||
3 1 | Exactitud lineal al 90% de nivel de significación | ||
3 2 | Exactitud lineal al 95% de nivel de significación | ||
3 3 | Exactitud lineal al 99% de nivel de significación | ||
3 4 | Exactitud lineal casi directo | ||
3 5 | Error cuadrático medio | ||
3 6 | Exactitud lineal absoluto al 90% de nivel de significación de datos verticales con sesgo | ||
3 7 | Error lineal absoluto al 90% de nivel de significación de datos verticales con sesgo | ||
Incertidumbres posicionales horizontales | 3 8 | Desviación típica circular | |
3 9 | Error circular probable | ||
4 0 | Exactitud circular estándar | ||
4 1 | Error circular al 95% de nivel de significación | ||
4 2 | Error circular casi cierto | ||
4 3 | Error cuadrático medio planímetro | ||
4 4 | Error circular absoluto al 90% de nivel de significación de datos con sesgo |
32 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
4 5 | Elipse de incertidumbre | ||
4 6 | Elipse de confianza | ||
Exactitud posicional | Exactitud relativa | 4 7 | Error vertical relativo |
4 8 | Error horizontal relativo | ||
Exactitud posicional de datos ráster | 4 9 | Incertidumbres posicionales horizontales | |
5 0 | Exactitud de atributos cuantitativos | ||
Calidad temporal | Exactitud de una medida de tiempo | 5 1 | Exactitud al 63,3% de nivel de significancia |
5 2 | Exactitud temporal al 50% de nivel de significación | ||
5 3 | Exactitud temporal al 90% de nivel de significación | ||
5 4 | Exactitud temporal al 95% de nivel de significación | ||
5 5 | Exactitud temporal al 99% de nivel de significación | ||
5 6 | Exactitud temporal al 99,8% de nivel de significación | ||
Consistencia temporal | 5 7 | Orden cronológico | |
Validez temporal | 5 8 | No conformidad de dominio - valor | |
5 9 | Índice de no conformidad en dominio - valor | ||
Exactitud temática | Corrección de la clasificación | 6 0 | Número de objetos geográficos clasificados incorrectamente |
6 1 | Índice de error de la clasificación | ||
6 2 | Matriz de error de la clasificación | ||
6 3 | Matriz de error de la clasificación relativa | ||
6 4 | Coeficiente Kappa | ||
Corrección de atributo no cuantitativo | 6 5 | Numero de valores de atributos incorrectos | |
6 6 | Índice de valores de atributos correctos | ||
6 7 | Índice de valores de atributos incorrectos | ||
Corrección de atributo cuantitativo | 6 8 | Incertidumbre del valor del atributo al 68,3% de nivel designificación | |
6 9 | Incertidumbre del valor del atributo al 50% de nivel de significación | ||
7 0 | Incertidumbre del valor del atributo al 90% de nivel de significación |
33 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
7 1 | Incertidumbre del valor del atributo al 95% de nivel de significación | ||
7 2 | Incertidumbre del valor del atributo al 99% de nivel de significación | ||
7 3 | Incertidumbre del valor del atributo al 99,8% de nivel designificación | ||
Usabilidad | 7 4 | Cumplimiento de especificaciones de producto | |
7 5 | Recuento de especificaciones de producto satisfechas | ||
7 6 | Recuento de especificaciones de producto no satisfechas | ||
7 7 | Índice de especificaciones de producto no satisfechas | ||
7 8 | Índice de especificaciones de producto satisfechas |
Nota: Ver detalle de las medidas en el documento “Catálogo de medidas”
7.2. Relación de medidas básicas relacionadas con la incertidumbre
Como se mencionó en el capítulo 5, los valores numéricos obtenidos a través de mediciones tienen asociada una exactitud determinada. Para mejorar el tratamiento de esta incertidumbre, se opta por tratar la magnitud medida como una variable aleatoria, hecho que lleva a adoptar medidas básicas que describan la incertidumbre a través de métodos estadísticos, como:
7.2.1. Variable aleatoria de una dimensión Z
Debido a que una magnitud puede adoptar valores reales, es imposible ofrecer la probabilidad de un único valor verdadero. Sólo es posible expresar la probabilidad de que el valor verdadero se encuentre en un intervalo, al cual se le nombra ‘Intervalo de confianza’. Dicho intervalo viene dado por la probabilidad P (también llamada nivel designificación) de que el valor verdadero se encuentre entre los límites inferior y superior.
P (límite inferior ≤ valor verdadero ≤ límite superior) = P
Si la desviación típica 𝜎es conocida, los límites vienen dados por los cuantiles u de la distribución normal (gaussiana).
𝜎 (𝜎𝜎 − 𝜎 ∗ 𝜎 ≤ 𝜎𝜎𝜎𝜎𝜎 𝜎𝜎𝜎𝜎𝜎𝜎𝜎𝜎𝜎 ≤ 𝜎𝜎 + 𝜎 ∗ 𝜎) = 𝜎
34 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Tabla 5. Relación entre cuantiles de la distribución normal y el nivel de significación
Probabilidad P | Cuantil | Medida básica | Nombr e | Tipo de valor |
P = 50% | 𝜎50% = 0,6745 | 𝜎50% * 𝜎𝜎 | LE50 | Medida |
P = 68,3% | 𝜎68,3% = 1 | 𝜎68,3% * 𝜎𝜎 | LE68.3 | Medida |
P = 90% | 𝜎90% = 1,645 | 𝜎90% * 𝜎𝜎 | LE90 | Medida |
P = 95% | 𝜎95% = 1.960 | 𝜎95% * 𝜎𝜎 | LE95 | Medida |
P = 99% | 𝜎99% = 2,576 | 𝜎99% ∗ 𝜎𝜎 | LE99 | Medida |
P = 99,8% | 𝜎99,8% = 3 | 𝜎99,8% * 𝜎𝜎 | LE99.8 | Medida |
Si la desviación típica 𝜎 es conocida, pero la variable aleatoria Z se mide de forma redundante a través de N observaciones independientes, es posible determinar la desviación típica a partir de dichas observaciones, así:
Probabilidad P | Cuantil para r = 10 | Cuantil para r = 5 | Cuantil para r = 4 | Cuantil para r = 3 | Cuantil para r = 2 | Cuantil para r = 1 |
P = 50 % | t = 1,221 | t = 1,301 | t = 1,344 | t = 1,423 | t = 1,604 | t = 2,414 |
P = 68,3 % | t = 1,524 | t = 1,657 | t = 1,731 | t = 1,868 | t = 2,203 | t = 3,933 |
P = 90 % | t = 2,228 | t = 2,571 | t = 2,776 | t = 3,182 | t = 4,303 | t = 12,706 |
P = 95 % | t = 2,634 | t = 3,163 | t = 3,495 | t = 4,177 | t = 6,205 | t = 25,452 |
P = 99 % | t = 3,581 | t = 4,773 | t = 5,598 | t = 7,453 | t = 14,089 | t = 127,321 |
P = 99,8 % | t = 4,587 | t = 6,869 | t = 8,610 | t = 12,924 | t = 31,599 | t = 636,619 |
7.2.2. Variable aleatoria de dos dimensiones X e Y Una variable aleatoria Z puede expandirse a dos dimensiones en el caso que siempre se obtengan dos valores para la magnitud medida. El resultado se expresa a través de la tupla X, Y.
Las observaciones son 𝜎𝜎𝜎 y la equivalencia al intervalo de confianza del numeral anterior, en este caso es el área de confianza, la cual se describe usualmente
como un círculo en tono a la mejor estimación del valor verdadero. De esta forma, la probabilidad de que el valor verdadero esté situado dentro de esta área se
35 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
calcula a través de la integración de superficies sobre la función de densidad bidimensional de la distribución normal. Un área circular se caracteriza por su radio R, el cual se usa como medida de la exactitud de variables aleatorias bidimensionales.
El radio puede calcularse para algunas probabilidades concretas dependiendo de las desviaciones típicas 𝜎𝜎 y 𝜎𝜎.
Tabla 7. Relación entre la probabilidad P y el radio correspondiente del área circular
Probabilidad P | Medida básica de la calidad de los datos | Nombre | Tipo de valor |
P = 39,4 % | 1 √𝜎2 +𝜎2 √2 𝜎 𝜎 | CE39.4 | Medida |
P = 50 % | 1,1774 √𝜎2 +𝜎2 √2 𝜎 𝜎 | CE50 | Medida |
P = 90 % | 2,146 √𝜎2 +𝜎2 √2 𝜎 𝜎 | CE90 | Medida |
P = 95 % | 2,4477 √𝜎2 +𝜎2 √2 𝜎 𝜎 | CE95 | Medida |
P = 99,8 % | 3,5 √𝜎2 +𝜎2 √2 𝜎 𝜎 | CE99.8 | Medida |
7.2.3. Variable aleatoria de tres dimensiones X, Y,Z
Este es el caso en el que la variable aleatoria Z se expande a tres dimensiones, obteniendo siempre tres valores para la magnitud medida; el resultado está dado por la tupla X, Y,Z y obedece los mismos supuestos de la variable aleatoria unidimensional (5.2.2.2 Medidas básicas relacionadas con la incertidumbre).
Las observaciones son 𝜎𝜎𝜎, 𝜎𝜎𝜎 y 𝜎𝜎𝜎. En este caso, se habla de volumen de confianza, el cual se describe como una esfera en torno a la mejor estimación del
valor verdadero. La probabilidad de que el valor verdadero esté situado dentro de este volumen se calcula mediante la integración de volúmenes sobre la función de densidad tridimensional e la distribución normal. El volumen se caracteriza también por su radio, el cual se usa como medida de la exactitud de variables aleatorias tridimensionales.
36 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Tabla 8. Relación entre la probabilidad P y el radio correspondiente del volumen esférico
Probabilidad P | Medida básica de la calidad de los datos | Nombre | Tipo de valor |
P = 50 % | 0,51 (𝜎𝜎 + 𝜎𝜎 + 𝜎𝜎) | Error esférico probable (SEP, spherical error probable) | Medida |
P = 61 % | √𝜎2 +𝜎2 +𝜎2 □ 𝜎 𝜎 | Error esférico radial medio (MRSE, Mean Radial Spherical Error) | Medida |
P = 90 % | 0,833 (𝜎𝜎 + 𝜎𝜎 + 𝜎𝜎) | Estándar de exactitud esférica al 90% | Medida |
P = 99 % | 1,122 (𝜎𝜎 + 𝜎𝜎 + 𝜎𝜎) | Estándar de exactitud esférica al 99% | Medida |
7.3. Gestión de las medidas
Una nueva práctica en la adopción y empleo de las medidas de calidad es su gestión. Este proceso comprende la descripción completa y actualizada de las medidas básicas, las medidas personalizadas, así como de los parámetros involucrados en un ambiente que facilite su administración y diseminación, por ejemplo, a través de un registro o de un catálogo. El caso de registro se emplea en un uso global, o institucional y el catálogo para un proyecto o conjunto de datos específico. Su elección de almacenamiento depende de las necesidades e implementación de este.
7.4. Métodos de muestreo
Teniendo en cuenta que el muestreo es una operación para obtener una proporción seleccionada de la población de estudio, siempre y cuando esta sea representativa respecto a las propiedades que se analizarán dentro de los límites medibles del error, es necesario contar con un procedimiento suficiente para la captura de dicha muestra.
Existen dos tipos de muestreo, el probabilístico que se apoya de alguna forma de selección aleatoria de los puntos muestrales, como el aleatorio simple, sistemático, estratificado y por conglomeraciones; y el no probabilístico que no involucra
37 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
ninguna selección aleatoria de los puntos muestrales, por juicio u opinión, por xxxxxx, accidental, conveniencia o bola de nieve.
7.5. Recomendaciones
• Antes de iniciar el proceso de evaluación de la calidad, planee las actividades, estudie la información geográfica y su proceso de elaboración, así como la infraestructura y recursos con los que se cuenta para ejecutar las pruebas.
• Tras la obtención de resultados de las pruebas de calidad, realice un balance general de los aspectos que generan mayor cantidad de errores.
• De manera periódica, programe la elaboración de un análisis de los resultados de las evaluaciones de calidad, con el fin de identificar:
o Errores más frecuentes
o Posibles fuentes de error (a fin de identificar si se encuentra en las fuentes de información, en el procesamiento, en la infraestructura tecnológica o en el procedimiento técnico)
o Errores que más impactan en el proceso de producción de información
o Subelementos de calidad que ofrecen más resultados negativos
o Subelementos de calidad que siempre o frecuentemente arrojan resultados positivos
• Con los resultados anteriores, se podrá realizar una gestión y retroalimentación del proceso de evaluación, tras lo cual se podrán tomar las siguientes acciones:
o Descartar u obviar la ejecución de pruebas de calidad que siempre resultan exitosas
o Replantear la ejecución de aquellas con más cantidad de desaciertos, a partir de la redefinición de los niveles de conformidad, modificación del alcance
o Acciones de mejora en el proceso de producción, de evaluación, o en el procedimiento llevado a cabo por el personal
• Abordaje de los elementos de calidad: se presenta a continuación una recomendación acerca del orden de abordaje de las evaluaciones de los elementos de calidad, para evitar la propagación del error, ya que la existencia de un error individual o humano puede replicarse en otros.
o Evaluación de la consistencia de formato: legibilidad de los datos para verificar que puedan ser legibles y comprensibles
38 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
o Evaluación de consistencia lógica: Aseguramiento del cumplimiento de las reglas de esquema conceptual
o Evaluación de totalidad: Corroborar la representación de la realidad planeada a través de una comparación de la realidad o el producto resultante
o Evaluación de exactitud posicional: medir la diferencia entre las propiedades geométricas del objeto y la verdad en el terreno
7.6. Informe de calidad
A continuación, se enuncia un ejemplo de la estructura que puede contener un informe independiente acerca de la calidad de un producto geográfico.
7.6.1. Descripción del producto
• Especificación del producto, con referencia al documento.
%20Especificacion%20Tecnica%20Mapa%20de%20Referencia%20V0 6_15.pdf
• Relación de los alcances (conjunto de datos, tipos de objetos, atributos o instancias) que han sido evaluados en el proceso que informe el documento informe.
Ejemplo:
Tabla 9. Ejemplo de relación de alcances de la evaluación, a relacionar en el informe de calidad
Objeto | Atributo | Tipo de valor | Dominio |
Sector | Tipo | Alfanumérico | Urbano, Rural, Expansión |
Sitio de interés | Tipo | Texto | Comercial, Religioso, Turístico, Deportivo |
Reglas
Ejemplo: Todos los predios deben estar contenidos en una manzana.
El atributo “Acto administrativo” de la Unidad administrativa” no puede tener valores nulos. NOTA: Se puede hacer referencia al documento catálogo de objetos.
39 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Requisitos de calidad:
Requisitos que se deben cumplir para ser conforme con los requisitos de la calidad de los datos, sin necesidad de examinar el catálogo de objetos o los modelos lógicos.
Ejemplo: Para el objeto ‘Vereda’ no se podrá omitir ningún registro Nota: Se puede hacer referencia al documento especificación técnica.
7.6.2. Proceso de evaluación de la calidad
Unidades de calidad
Se relaciona cada alcance y los elementos de calidad evaluados para cada uno Ejemplo:
Alcance | Totalida d | C. Lógica | Ex. posiciona l | C. Tempor al | Ex. temátic a | Usabilidad |
Drenaje doble | x | x | x | |||
Predio | x | x | x | x | ||
ZHG | x | x |
Medidas
Se resumen las medidas de calidad empleadas durante la evaluación de la calidad. Ejemplo:
Tabla 11. Ejemplo de las medidas empleadas, a relacionar en el informe de calidad
Elemen to | Identificador de medida(s) | Nombre(s) de la(s) medida(s) |
Consistencia lógica | 9 | Cumplimiento del esquema conceptual |
Totalidad | 1 | Número de ítems en exceso |
2 | Número de ítems faltantes |
Procedimiento de evaluación
Ejemplo: Para el caso de la evaluación de la consistencia de formato del atributo ‘Código’ se realizó una inspección completa.
40 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Resultados de la evaluación
Se identifican los errores hallados, referenciando el universo en discurso, el producto final y los resultados de cada una de las evaluaciones.
Nota: se puede emplear formatos de relación de errores personalizados y gráficas comparativas.
Ejemplo: Se encontraron 2 errores de omisión de edificios industriales. Falta un edificio industrial (el número 10 y 12 en el universo en discurso).
Tabla 12. Ejemplo de la documentación del resultado del elemento de totalidad
Alcance | Elemento | Requisi to | Número de evaluaciones | Recuentos | Aprue ba |
Objeto edificios | Consistencia conceptual | No pueden faltar registros | 1 (no se hallaron 2 delos50 existentes) | 1 | No |
Tabla 13. Ejemplo de la documentación del resultado de la evaluación del elemento de totalidad
Tipo de obje to | Número de instancias enel universo en discurso | # Comisiones | % Comisiones | # Omisiones | % Xxxxxxxxx |
Xxx | 00 | 0 | 0 |
Universo en discurso | Parcela | Xxxxxxxxx | Xxxxx | Xxxxxxxx | Xxxxxx |
Xxxxxxx | 00 | ||||
Carretera | 8 | ||||
Árbol | 34 | ||||
Edificio | 25 | ||||
Parque | 6 |
41 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
7.6.3. Informe en el metadato
(Ver 7.7. Formato evaluación de la calidad de los datos en el metadato)
7.6.4. Salvedades
En este apartado se incluirán todas aquellas condiciones externas o internas, documentadas a modo de salvedades, que aclararán motivos técnicos o jurídicos que justifican el incumplimiento de alguna regla por circunstancias técnicas o jurídicas.
7.7. Formato evaluación de la calidad de los datos en el metadato
El formato de planeación y reporte de la evaluación de la calidad obedece a las consideraciones de normatividad internacional de referencia y presenta la condicionalidad del diligenciamiento de los campos de la siguiente forma en: Obligatorio (Indica que el elemento debe ser diligenciado siempre), Condicional (Indica la presencia del elemento sometido a una pregunta. Si la respuesta a esta es afirmativa, el elemento debe ser diligenciado) y opcional: Indica que la inclusión del elemento está sujeta a la discreción del autor de la evaluación de la calidad.
7.7.1. Alcance o nivel de medición de la calidad (*): Elija un elemento.
7.7.1.1. Nombre: Xxxxxxxx
7.7.1.2. Elemento/Subelemento de calidad (*): Elija un elemento y subelemento
7.7.1.3. Medida
Identificador de la medida | |
Nombre de la medida | |
Alias de la medida | |
Nombre de la medida básica de calidad | |
Definición de la medida básica | |
Tipo de valor |
42 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Nombre del parámetro | |
Definición del parámetro |
7.7.1.4. Método de evaluación
Tipo de método de evaluación | Elija un método |
Descripción del método de evaluación | |
Fuente de referencia | |
Fecha de la evaluación |
7.7.1.5. Resultado cuantitativo (*)
Nivel de conformidad* | |
Unidad de valor del resultado | |
Título de la especificación técnica | |
Resultado |
7.7.1.6. Resultado descriptivo(C)
Declaración: Xxxxx
7.7.1.7. Resultado de cobertura (C)
Tipo de representación especial: Xxxxxx Número de dimensiones: Xxxxxx Tamaño de la dimensión: Xxxxxx Geometría de la celda: Xxxxxx
Disponibilidad de parámetros de transformación: Xxxxxx
7.7.1.8. Linaje
Descripción | |
Escala / resolución | |
Fecha | |
Proceso |
(en desarrollo) Etapa del proceso
43 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
Origen
Descripción | |
Escala / resolución | |
Sistema de referencia espacial | |
Citación de la fuente | |
Extensión geográfica y temporal |
44 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
8. Referencias bibliográficas
Asociación Española de Normalización y Certificación. UNE-EN ISO 19157. España 2014. International Standardization Organization. ISO 19157:2013, Amd:2016. Suiza 2016.
45 | 46
Guía de implementación para la Evaluación de la calidad de información geográfica
46 | 46