Sistema de recuperación conceptual mediante niveles semánticos en la representación de esquemas de metadatos

De
Publicado por


Los metadatos son descripciones que facilitan la recuperación, utilización y gestión de recursos de información. Así, pueden ser utilizados para organizar recursos electrónicos heterogéneos o facilitar la interoperatividad. Normalmente, la semántica de los elementos de vocabularios se define localmente, con escasa formalización y sin contemplar definiciones consensuadas con otros vocabularios, con el consiguiente perjuicio para la interoperatividad. En esta tesis se propone generar una representación semántica de los vocabularios de metadatos, que permita eliminar la ambigüedad sintáctica y semántica, facilitando así la interoperatividad. La representación propuesta posee dos vertientes: la primera, denominada esquema cualificado, tiene como objetivo la sustitución del esquema original y proporciona una estructura homogénea para todos los esquemas, al tiempo que permite incluir la semántica de cada uno de sus elementos; la segunda, denominada ontología específica, permite establecer definiciones formales de los elementos incluidos en el esquema original, al tiempo que proporciona soporte a aspectos como la sinonimia y el plurilingüismo. La representación semántica de los esquemas se completa con el uso de un recurso semántico, contra el cual se interrelacionarán los conceptos de las ontologías específicas mediante un proceso de alineamiento, articulado a través de una ontología independiente. De este modo se facilitará la interoperatividad entre esquemas, la recuperación conceptual de documentos y esquemas, así como el uso más amigable de los vocabularios. El desarrollo de la propuesta incluye la definición del modo de generar las representaciones semánticas de los esquemas, la definición de los recursos necesarios y la metodología generada a partir de la aplicación del método sobre un conjunto de esquemas y recursos semánticos seleccionados como ejemplo. Además, se propone una metodología de documentación y cualificación de esquemas, desarrollada a partir de la experiencia con los esquemas seleccionados. La metodología incluye el procedimiento y plantillas documentales, para la creación de un documento de descripción del esquema, completado con dos vistas: una dirigida a usuarios y otra en RDF, procesable automáticamente. Seguidamente, se establecen los requisitos para la selección de la ontología de referencia y, tras un proceso de evaluación de recursos existentes, se selecciona uno a modo de ejemplo. A continuación se establece el modo de interrelacionar los conceptos de los distintos componentes, ontología específica y ontología de referencia, a partir de la evaluación de los métodos existentes. Establecido el método, y mediante un método inductivo, se genera una metodología de interrelación de conceptos, a partir del proceso de alineamiento entre el conjunto de esquemas seleccionados y la ontología de referencia. Para finalizar el planteamiento, éste será validado y verificado con el objetivo de comprobar que responde cubre los objetivos establecidos de forma correcta. La solución complementa y es compatible con propuestas anteriores de definición y gestión de metadatos como los registros de metadatos o las propuestas del DCMI. Además, contempla criterios de modularidad, extensibilidad, refinamiento y plurilingüísmo. Una vez establecida y probada la propuesta, se incluye la especificación del Proceso de Desarrollo de un sistema informático que la soporte. Con el fin de evaluar el planteamiento, se realiza una valoración y comparación del método propuesto, con otros métodos de recuperación alternativos, siguiendo la metodología DESMET. Además, se realiza un análisis y valoración de los resultados generados. Finalmente, se incluyen las conclusiones obtenidas durante la elaboración de la propuesta y las posibles líneas de investigación que quedan abiertas para futuros trabajos.
Publicado el : viernes, 01 de enero de 2010
Lectura(s) : 65
Fuente : e-archivo.uc3m.es
Licencia: Más información
Atribución, no uso comercial, sin cambios
Número de páginas: 308
Ver más Ver menos


Universidad Carlos III de Madrid
Facultad de Humanidades, Comunicación y Documentación
Departamento de Biblioteconomía y Documentación

Doctorado en Documentación
Archivos y Bibliotecas en el Entorno Digital



Sistema de Recuperación Conceptual
mediante Niveles Semánticos en la
representación de Esquemas de
Metadatos



Tesis Doctoral


Autor
Vicente Palacios Madrid

Director
Prof. Dr. D. José Antonio Moreiro González
Prof. Dr. D. Jorge Morato Lara


Getafe, junio de 2010 Resumen
Los metadatos son descripciones que facilitan la recuperación, utilización y gestión de
recursos de información. Así, pueden ser utilizados para organizar recursos electrónicos
heterogéneos o facilitar la interoperatividad. Normalmente, la semántica de los
elementos de vocabularios se define localmente, con escasa formalización y sin
contemplar definiciones consensuadas con otros vocabularios, con el consiguiente
perjuicio para la interoperatividad. En esta tesis se propone generar una representación
semántica de los vocabularios de metadatos, que permita eliminar la ambigüedad
sintáctica y semántica, facilitando así la interoperatividad. La representación propuesta
posee dos vertientes: la primera, denominada esquema cualificado, tiene como objetivo
la sustitución del esquema original y proporciona una estructura homogénea para todos
los esquemas, al tiempo que permite incluir la semántica de cada uno de sus elementos;
la segunda, denominada ontología específica, permite establecer definiciones formales
de los elementos incluidos en el esquema original, al tiempo que proporciona soporte a
aspectos como la sinonimia y el plurilingüismo. La representación semántica de los
esquemas se completa con el uso de un recurso semántico, contra el cual se
interrelacionarán los conceptos de las ontologías específicas mediante un proceso de
alineamiento, articulado a través de una ontología independiente. De este modo se
facilitará la interoperatividad entre esquemas, la recuperación conceptual de
documentos y esquemas, así como el uso más amigable de los vocabularios. El
desarrollo de la propuesta incluye la definición del modo de generar las
representaciones semánticas de los esquemas, la definición de los recursos necesarios y
la metodología generada a partir de la aplicación del método sobre un conjunto de
esquemas y recursos semánticos seleccionados como ejemplo. Además, se propone una
metodología de documentación y cualificación de esquemas, desarrollada a partir de la
experiencia con los esquemas seleccionados. La metodología incluye el procedimiento y
plantillas documentales, para la creación de un documento de descripción del esquema,
completado con dos vistas: una dirigida a usuarios y otra en RDF, procesable
automáticamente. Seguidamente, se establecen los requisitos para la selección de la
ontología de referencia y, tras un proceso de evaluación de recursos existentes, se
selecciona uno a modo de ejemplo. A continuación se establece el modo de
interrelacionar los conceptos de los distintos componentes, ontología específica y
ontología de referencia, a partir de la evaluación de los métodos existentes. Establecido
el método, y mediante un método inductivo, se genera una metodología de interrelación
de conceptos, a partir del proceso de alineamiento entre el conjunto de esquemas
seleccionados y la ontología de referencia. Para finalizar el planteamiento, éste será
validado y verificado con el objetivo de comprobar que responde cubre los objetivos
establecidos de forma correcta. La solución complementa y es compatible con
propuestas anteriores de definición y gestión de metadatos como los registros de
metadatos o las propuestas del DCMI. Además, contempla criterios de modularidad,
extensibilidad, refinamiento y plurilingüísmo. Una vez establecida y probada la
propuesta, se incluye la especificación del Proceso de Desarrollo de un sistema
informático que la soporte. Con el fin de evaluar el planteamiento, se realiza una
valoración y comparación del método propuesto, con otros métodos de recuperación
alternativos, siguiendo la metodología DESMET. Además, se realiza un análisis y
valoración de los resultados generados. Finalmente, se incluyen las conclusiones
obtenidas durante la elaboración de la propuesta y las posibles líneas de investigación
que quedan abiertas para futuros trabajos. Agradecimientos
Quiero expresar mi más sincero agradecimiento a todas aquellas personas que, directa o
indirectamente, han hecho posible que hoy esté escribiendo estas líneas.
En primer lugar, agradezco a los profesores Dr. D. Jose A. Moreiro y Dr. D. Jorge
Morato su confianza, ayuda, apoyo y amistad en los momentos buenos y menos buenos.
En segundo lugar, a mis compañeros, tanto del Servicio de Informática como del
Departamento de Informática, sin su ayuda, compresión y apoyo no habría sido posible
la elaboración de esta tesis. En especial a la Profª. Dra. Dª. Sonia Sanchez y al Prof. Dr.
D. Juan B. Llorens como compañeros y amigos.
Finalmente y con todo mi cariño, agradecer a mi familia su paciencia, compresión y
apoyo durante todos estos años. Tabla de Contenidos
CAPÍTULO I: INTRODUCCIÓN .............................................................................................. 1
1.1 Motivación ..........................................................................................3
1.2 Hipótesis .............................................................................................5
1.3 Objeto ...................................................................................................5
1.4 Objetivos .............................................................................................5
1.5 Metodología .......................................................................................7
1.6 Fuentes ............................................................................................. 15
CAPÍTULO II: FUNDAMENTOS TEÓRICOS .................................................................... 17
2.1 La Web Semántica ........................................................................ 17
2.1.1 Introducción.................................................................... 17
2.1.2 Arquitectura .................................................................... 18
2.1.3 Lenguajes.......................................... 21
2.1.4 Situación actual de la Web Semántica ................................................................................................................. 28
2.2 Metadatos ........................................................................................................................................................ 31
2.2.1 Esquemas de metadatos ............................................ 31
2.2.2 Esquemas de metadatos seleccionados .............................................. 36
2.2.3 Interoperatividad ......................................................................................................................... 39
2.2.4 Correspondencia entre Esquemas ........................ 40
2.3 Ontologías ....................................................................................................................................................... 44
2.3.1 Introducción.................................... 44
2.3.2 Componentes de una ontología .............................. 46
2.3.3 Áreas de aplicación ...................................................................................................................................................... 47
2.3.4 Ontologías de acceso libre ........................................................................................................................................ 48
2.3.5 Repositorios semánticos ........... 50
2.3.6 Métodos de correspondencia entre ontologías ............................... 56
2.4 Recuperación de documentos XML ........................................................................................................ 62
2.5 Marco teórico y herramientas del Proceso de Desarrollo ............................ 64
2.5.1 Fundamentos .................................................................................................................................................................. 64
2.5.2 Actividades de gestión del Proceso Software... 65
2.5.3 Ciclo de vida del software ......... 66
2.5.4 El Lenguaje de Modelado Unificado: UML ......................................................................................................... 70
2.5.5 Estilos arquitectónicos y patrones de diseño .. 79
CAPÍTULO III: MARCO EXPERIMENTAL ........................................................................ 85
3.1 Representación ontológica de esquemas ............................ 87
3.1.1 Definición de la representación semántica de esquemas ........................................................................... 88
3.1.2 Búsqueda y selección de esquemas ................................................... 109
3.1.3 Representación semántica de los esquemas seleccionados ... 111
3.1.4 Publicación de esquemas semánticos............................................................................... 120 3.2 Selección de la ontología de referencia ............................................................................................. 122
3.2.1 Definición de requisitos de la ontología de referencia ............................................. 123
3.2.2 Evaluación y selección de la ontología de referencia ................................................ 124
3.2.3 Representación compatible de la ontología de referencia ...... 134
3.2.4 Publicación de la ontología de referencia ....................................................................... 138
3.3 Correspondencia entre esquemas y la ontología de referencia ............................................... 139
3.3.1 Evaluación y selección del método de correspondencia .......................................... 140
3.3.2 Correspondencia de conceptos entre esquemas y la ontología de referencia ............................... 145
3.3.3 Publicación de la ontología de correspondencia ......................................................... 158
3.4 Validación y verificación de la propuesta ........................................................ 159
3.5 Proceso de desarrollo del sistema informático de soporte ....................... 168
3.5.1 Especificaciones informales .................................................................................................. 169
3.5.2 Especificación de requisitos de usuario .......................................... 173
3.5.3 Especificación de requisitos software .............................................................................................................. 197
3.5.4 Diseño de la arquitectura ....................................... 197
3.5.5 Diseño detallado, codificación y pruebas ........ 198
3.5.6 Desarrollo de infraestructuras de soporte ..................................................................................................... 199
3.5.7 Estado actual de la plataforma ............................................................ 200
CAPÍTULO IV: RESULTADOS, EVALUACIÓN Y DISCUSIÓN ................................... 201
4.1 Resultados y discusión ............................................................................................ 201
4.1.1 Resultados de la representación ontológica de esquemas ...................................... 202
4.1.2 Resultados de la selección de la ontología de referencia ......................................... 212
4.1.3 Resultados de la correspondencia entre esquemas y la ontología de referencia ......................... 214
4.1.4 Resultados de la validación y verificación de la propuesta .................................... 219
4.1.5 Resultados del proceso de desarrollo del sistema informático de soporte ..................................... 221
4.2 Evaluación y comparativa de la propuesta ...................................................................................... 224
4.2.1 Presentación del método de evaluación .......................................... 225
4.2.2 Definición del marco comparativo ..................................................... 226
4.2.3 Evaluación de métodos de recuperación de documentos XML ............................. 230
4.2.4 Presentación, análisis y discusión de resultados ......................................................................................... 233
CAPÍTULO V: CONCLUSIONES ....................................................................................... 239
CAPÍTULO VI: TRABAJOS FUTUROS ............ 243
CAPÍTULO VII: BIBLIOGRAFÍA ...................................................................................... 245
CAPÍTULO VIII: GLOSARIO ............................. 271
ANEXO A: PLANTILLA DE DESCRIPCIÓN DE ESQUEMAS DE METADATOS .... 277
ANEXO B: RESULTADOS DE LA EVALUACIÓN DE REPOSITORIOS SEMÁNTICOS
................................................................................................................................................. 281
Índice de Figuras
Figura I-1: Principales pasos de la metodología propuesta ................................................ 7
Figura I-2: Tareas de la fase de representación ontológica de esquemas ..................... 8
Figura I-3: Tareas de la fase de selección de la ontología de referencia ........................ 9
Figura I-4: Tareas de la fase de correspondencia entre esquemas y la ontología de
referencia ..............................................................................................................................................10
Figura I-5: Tareas del proceso de desarrollo del sistema informático de soporte ...11
Figura II-1: Estructura y lenguajes de la Web Semántica...................................................18
Figura II-2: Estructura y estándares de la Web Semántica. Extraído de (Sure, Y.;
Studer, R., 2005) .................................................................................................................................20
Figura II-3: Representación gráfica de una sentencia RDF. Extraído de (World Wide
Web Consortium, 2004d). ..............................................................................................................24
Figura II-4: Esquema de anotación semántica en KIM extraído de (Ontotext,
2010b). ...................................................................................................................................................52
Figura II-5: Función de alineamiento, tomada de (Euzenat, J.; Shvaiko, P., 2007) ...59
Figura II-6: Ciclo de vida de los alineamientos, tomado de (Euzenat, J.; Shvaiko, P.,
2007) ......................................................................................................................................................60
Figura II-7: Representación un proceso de desarrollo software .....................................65
Figura II-8: Ciclo de vida en cascada ..........................................................................................67
Figura II-9: Ciclo de vida en espiral ............................69
Figura II-10: Diagrama ejemplo de casos de uso ...................................................................72
Figura II-11.Representación gráfica de un paquete .............................73
Figura II-12. Representación gráfica de clase .........................................................................73
Figura II-13. Representación gráfica de una interfaz junto a la clase que la realiza73
Figura II-14. Ejemplo de diagrama de clases ..........................................................................74
Figura II-15. Ejemplo de diagrama de estado .........75
Figura II-16. Ejemplo de diagrama de actividades. ..............................................................75
Figura II-17. Ejemplo de diagrama de secuencia ...................................76
Figura II-18. Ejemplo de diagrama de colaboración ............................................................77 Figura II-19. Ejemplo de diagrama de componentes ...........................................................78
Figura II-20. Ejemplo de diagrama de despliegue .................................78
Figura II-21: Patrón arquitectónico MVC modelo 2 .............................................................79
Figura II-22: Combinación de los estilos arquitectónicos Capas y MVC .......................81
Figura II-23: Estructura del patrón de diseño Value Object .............................................82
Figura II-24: Estructura del patrón de diseño Factory Method .......83
Figura II-25: Estructura del patrón de diseño Facade .........................................................83
Figura III-1: Principales pasos de la metodología propuesta ...........................................87
Figura III-2: Tareas de la fase de representación ontológica de esquemas ................88
Figura III-3: Ejemplo de representación semántica del elemento ‘rights’ definido en
el esquema de metadatos de Dublin Core ............................................................................. 109
Figura III-4: Tareas de la fase de selección de la ontología de referencia ................ 123
Figura III-5: Tareas de la fase de correspondencia entre esquemas y la ontología de
referencia ........................................................................................................................................... 140
Figura III-6:Diagrama de actividad del proceso de correspondencia de un concepto.
................................................................................................................................................................ 147
Figura III-7:Diagrama de actividad del tratamiento de casos específicos en la
correspondencia de propiedades. ............................................................................................ 153
Figura III-8: Esquema de recuperación de documentos. Extraído de (Baeza, R.;
Ribeiro, B., 1999). ........................................................... 160
Figura III-9: Definición de la precisión. .................................................................................. 161
Figura III-10: Definición de la exhaustividad. ...... 161
Figura III-11: Tareas del proceso de desarrollo del sistema informático de soporte
................................................................................................................................................................ 169
Figura III-12: Diagrama inicial de Casos de Uso . 171
Figura III-13: Representación gráfica de la jerarquía de usuarios .............................. 173
Figura III-14: Diagrama general de Casos de Uso. ............................................................. 174
Figura III-15: Diagrama de casos de uso del rol usuario ................. 175
Figura III-16: Diagrama de gestión de documentos .......................................................... 181
Figura III-17: Diagrama de gestión de perfiles de aplicación ........................................ 181

¡Sé el primero en escribir un comentario!

13/1000 caracteres como máximo.