Congreso ONLINE del Observatorio para la Cibersociedad

De
Publicado por

CULTURA & POLÍTICA @ CIBERESPACIO. 1er Congreso ONLINE del Observatorio para la. CiberSociedad. Comunicaciones – Grupo 2. Catalogación de ...

Publicado el : lunes, 16 de abril de 2012
Lectura(s) : 75
Número de páginas: 9
Ver más Ver menos
CULTURA & POLÍTICA @ CIBERESPACIO
1er Congreso ONLINE del Observatorio para la
CiberSociedad
Comunicaciones – Grupo 2
Catalogación de Recursos de Internet:
Criterios, sistemas y soportes
Coordinación: José Ignacio Sánchez de Villapadierna y Luis
Bellido Triana (
js.villapadierna@cervantes.es
)
http://cibersociedad.rediris.es/congreso
Lingu@net Europa: Un catálogo de recursos
multilingüe con garantía de calidad
Luis Bellido
Departamento de Ingeniería de Sistemas Telemáticos
Universidad Politécnica de Madrid
lbellido@dit.upm.es
Encarna Pastor
Departamento de Ingeniería de Sistemas Telemáticos
Universidad Politécnica de Madrid
epastor@dit.upm.es
Resumen
Lingu@net Europa es un centro de recursos multilingüe en Internet que ofrece acceso
gratuito a un directorio de más de 1500 recursos, relacionados con la enseñanza y el
aprendizaje de unos 45 idiomas. La presente comunicación trata sobre los aspectos
más técnicos de la creación de este centro de recursos multilingüe: catalogación y
clasificación de los recursos on-line, uso de metadatos y Dublin Core, herramientas
para la catalogación y publicación, e interfaz de usuario multilingüe.
Abstract
Lingu@net Europa is a multilingual resources centre on the internet which offers free
access to more than 1,500 on-line resources related to the teaching and learning of
over 45 foreign languages. This paper describes the technical aspects of the creation of
this multilingual resource centre: cataloguing and classification of on-line resources,
use of metadata, tools for cataloguing and publishing, multilingual user interface.
Introducción
Lingu@net Europa es un centro de recursos multilingüe en Internet que ofrece acceso
gratuito a un directorio de más de 1500 recursos, seleccionados no sólo en Europa,
sino también en el resto del mundo, relacionados con la enseñanza y el aprendizaje
de unos 45 idiomas. Este centro ha sido desarrollado desde 1998 por un consorcio de
organizaciones académicas, educativas, de formación profesional, culturales y
tecnológicas, principalmente de Europa, y es utilizado por más de 5000 usuarios cada
mes.
El reto para el equipo de Lingu@net Europa ha sido disminuir el tiempo que
profesores, educadores, bibliotecarios, investigadores y otros profesionales de la
enseñanza de idiomas dedican a la búsqueda de recursos en Internet, mediante la
creación de un centro en el que se accede con garantías de calidad a los recursos
relevantes para sus necesidades específicas, y con la facilidad adicional del acceso en
varios idiomas.
La presente comunicación trata sobre los aspectos más técnicos de la creación
de un centro de recursos multilingüe: catalogación y clasificación de los recursos, uso
de metadatos, herramientas para la catalogación y publicación, e interfaz de usuario
multilingüe.
Catalogación y clasificación de los recursos
on-line
.
Lingu@net Europa se centra en la catalogación y clasificación de recursos
on-line
relacionados con enseñanza y aprendizaje de idiomas. Un grupo de expertos del
proyecto ha identificado qué piezas de información son necesarias para disponer de
una clasificación útil para los profesionales de la enseñanza de idiomas, proponiendo
un conjunto de hasta 32 elementos que permiten una catalogación de recursos que da
soporte a la garantía de calidad. Algunos de los elementos son genéricos (autor, título,
etc.) mientras que otros son claramente específicos del campo de conocimiento objeto
del proyecto (idioma objeto de aprendizaje, sector educativo, nivel de conocimientos,
habilidades y aptitudes, etc.).
Uso de metadatos y
Dublin Core
.
La inclusión de metadatos en páginas web, para expresar información que facilite la
búsqueda de recursos, fue el punto de partida del proyecto para la definición de un
soporte de catalogación de recursos. Para realizar una catalogación se hace necesario
disponer de una información estructurada sobre los objetos que se pretende catalogar.
Esa es la función que cumplen los metadatos en Lingu@net Europa. En cuanto a la
semántica de los metadatos, las definiciones aportadas por la Dublin Core Metadata
Inititative (DCMI, 2002) son aprovechadas en la medida de lo posible.
Dublin Core Metadata Element Set
, (DCMI, 1999) o para simplificar, los metadatos
Dublin Core
, fue el primer estándar de metadatos realizado por la DCMI. Consta de un
vocabulario semántico de 15 elementos para describir las propiedades principales (
core
properties
) de objetos para sistemas basados en descubrimiento de recursos (
resource
discovery
). Este conjunto de 15 elementos fue creado para ser utilizado por el más
amplio rango de industrias y disciplinas de estudio (LIZCANO, 2002).
Muchas comunidades utilizan los metadatos Dublin Core para describir los
recursos de sus sistemas de información. Algunas de ellas son:
Organizaciones educativas.
Bibliotecas.
Instituciones gubernamentales
Autores de páginas web.
Corporaciones con grandes sistemas de gestión del conocimiento.
En Lingu@net Europa, se utiliza un subconjunto de los metadatos Dublin Core, y
a su vez se extiende con nuevos metadatos para dar cabida al sistema de catalogación
específico para recursos de educación y aprendizaje de idiomas creado por el grupo de
expertos del proyecto. A pesar de que esta extensión de los metadatos Dublin Core
pueda restar interoperabilidad semántica, pues otras comunidades no conocerán el
significado de los nuevos metadatos, es necesaria para proporcionar la funcionalidad
requerida por los usuarios del centro de recursos.
Sintaxis de representación
Uno de los objetivos por los que surge el estándar de metadatos
Dublin Core
es
obtener un formato simple para el intercambio de metadatos entre aplicaciones. Por
ello, además de conocer cuál es el conjunto de términos que se utiliza para definir los
documentos (los metadatos), es necesario definir la sintaxis de representación que
permita ese intercambio de metadatos entre aplicaciones. La mejor solución en un
futuro a corto plazo consiste en utilizar los metadatos Dublin Core como semántica y
RDF (W3C, 1999) como expresión de esa semántica (LIZCANO, 2002).
En Lingu@net Europa la solución adoptada en el momento de su diseño
consistió en almacenar los metadatos Dublin Core en parejas atributo-valor en
etiquetas META dentro de los elementos HEAD de documentos HTML. Esta solución es
la más adoptada y permite a los robots utilizados para descubrimiento de recursos
(spiders, harvesters,...) encontrar la información en el propio documento HTML y
utilizar los evaluadores de expresiones HTML existentes para analizar y extraer esa
información.
Lingu@net Europa mantiene una base de datos de documentos HTML en los que
se guarda la información de los recursos relacionados con la enseñanza y el
aprendizaje de idiomas. Lingu@net Europa no guarda la información en sí, sólo la
metainformación que permite clasificar el recurso, y el URL que permite acceder al
recurso en su lugar de origen. A continuación se muestra el código de un documento
HTML con la metainformación sobre un recurso en Internet (Figura 1).
<HTML><HEAD><TITLE>Resource: http://cvc.cervantes.es/aula/didactiteca/</TITLE>
<META NAME="DC.Creator" CONTENT="Centro Virtual Cervantes, varios autores">
<META NAME="DC.Title" CONTENT="Didactiteca">
<META NAME="DC.Date.Created" CONTENT="2000--">
<META NAME="DC.Date.X-MetadataCreated" CONTENT="2001-03-28">
<META NAME="DC.Publisher" CONTENT="Centro Virtual Cervantes">
<META NAME="DC.Publisher.X-Email" CONTENT="cvc@cervantes.es">
<META NAME="DC.Coverage.Placename" CONTENT="Spain">
<META NAME="LING.ResourceLocation" CONTENT="Education and training">
<META NAME="DC.Type" CONTENT="Teaching and learning materials; Exercises and Tasks">
<META NAME="LING.SourceLanguage" CONTENT="Spanish">
<META NAME="LING.TargetLanguage" CONTENT="Spanish">
<META NAME="LING.EducationalSector" CONTENT="Secondary education; Further education;
Higher education; Teacher training">
<META NAME="LING.VocationalSector" CONTENT="Art and Design; Business and Administrat
ion (includes Management); Education; Financial Services (includes Accounting, Banki
ng, Insurance); Hospitality and Catering; Leisure and Tourism (includes Sport)">
<META NAME="LING.ProficiencyLevel" CONTENT="Beginner; Intermediate; Advanced">
<META NAME="LING.Skills" CONTENT="Reading; Writing; Listening; Speaking; Grammar; Vo
cabulary; Pronunciation; Spelling">
<META NAME="LING.Content.Assessment" CONTENT="">
<META NAME="LING.Content.Methodology" CONTENT="Methodology; Audiovisual aids; Authen
tic materials; Communicative language teaching; Creative activities; Games; Informat
ion and Communication Technology; Songs; Textbooks; Video">
<META NAME="LING.Content.Learners" CONTENT="Learners; Learner attitudes; Learning st
rategies; Motivation">
<META NAME="LING.Content.Organisation" CONTENT="Organisation and planning; Curriculu
m development">
<META NAME="LING.Content.Topics" CONTENT="">
<META NAME="DC.Description" CONTENT="Importante archivo de actividades con técnicas
pedagógicas, propuestas didácticas y consejos para el profesor de E/LE">
<META NAME="DC.Description.Language" CONTENT="Spanish">
<META NAME="LING.UserComments" CONTENT="">
<META NAME="LING.RightsOfUse" CONTENT="Refer to resource provider">
<META NAME="DC.Format.X-Size" CONTENT="not known">
<META NAME="DC.Format" CONTENT="text/html">
<META NAME="DC.Format.X-Requirements" CONTENT="standard browser">
<META NAME="DC.Identifier" CONTENT="http://cvc.cervantes.es/aula/didactiteca/">
<META NAME="LING.AccessionNumber" CONTENT="1039">
<META NAME="LING.Approver1" CONTENT="CERVANTES.Sánchez.2001-03-28">
<META NAME="LING.Cataloguer" CONTENT="CERVANTES.Sánchez.2001-03-28">
<META NAME="LING.MetadataInputBy" CONTENT="CERVANTES.Sánchez.2001-03-28">
<META NAME="LING.X-MetadataLastModified" CONTENT="CERVANTES.Sánchez.2001-05-22">
<META NAME="LING.AuthorisedReady" CONTENT="BDP.Venturi.2001-05-22">
</HEAD><BODY></BODY></HTML>
Figura 1: Código fuente de un documento de metainformación
Actualmente, la tendencia es abandonar la representación de los metadatos en
HTML y optar por una solución en la que se combine Dublín Core, XML (W3C, 2000) y
RDF. Esto permite que los recursos se puedan procesar por aplicaciones que no sólo
presenten la información, sino que también sean capaces de “entenderla” en cierta
medida. XML aporta, frente a HTML, validación del código, mayor estructuración en los
documentos, extensibilidad, internacionalización, orientación a objetos, facilidad de
intercambio de datos entre aplicaciones y mejoras en el tratamiento de los
metacontenidos.
Selección de recursos y proceso de garantía de calidad.
Un equipo de expertos en la enseñanza y aprendizaje de idiomas es el encargado de
realizar la selección de recursos y su clasificación, utilizando para ello las herramientas
puestas a su disposición en el área de trabajo del centro virtual. Las herramientas,
desarrolladas en su mayoría en Perl, permiten la automatización de ciertas tareas de
catalogación, y dan soporte al proceso de garantía de calidad ofreciendo dos
almacenes de recursos: la “sala de espera”, donde los recursos son clasificados y
almacenados por el equipo de expertos, y la “sala de publicación”, donde se publican
los recursos una vez que un reducido grupo de expertos los revisan y dan su visto
bueno. Una vez que se valida la catalogación realizada, los recursos son publicados y
quedan accesibles gratuitamente para los usuarios del centro virtual. La Figura 2
muestra como ejemplo la herramienta de creación de documentos de metadatos.
El uso de Perl como lenguaje de desarrollo de las herramientas ha permitido un
enfoque de prototipado rápido, con una fuerte realimentación por parte de los usuarios
del área de trabajo del centro virtual. Las herramientas se caracterizan por su
sencillez: son simples “forms” HTML, con un diseño gráfico sencillo y que requieren por
parte del usuario únicamente un cliente web (Netscape, Internet Explorer, Mozilla,...).
La garantía de calidad se apoya en estas herramientas que permiten al equipo
de expertos seleccionar los valores para los metadatos de una manera cómoda.
Además, las herramientas fuerzan el proceso de garantía de calidad, pues este se basa
en la separación entre el “redactor” y el “editor”. El primero crea y edita el documento
de metadatos, mientras el segundo revisa los y asegura que estos sean conformes a
una serie de directivas de calidad para, finalmente, publicarlos.
Figura 2: Herramienta de creación de documentos de metadatos
Una de las ventajas que ha tenido Perl como lenguaje de programación es su
potencia en el tratamiento de cadenas de texto. Sin embargo, en la actualidad
parecería más adecuado desarrollar este tipo de herramientas usando el lenguaje de
programación Java, que dispone de un API muy potente y permite la portabilidad a
distintas plataformas hardware.
Opciones de búsqueda de recursos
Una vez decidido cuál es el mejor sistema de catalogación de los recursos, y una vez
que se ha optado por utilizar hasta 32 campos para definir un recurso, es necesario
responder a la pregunta: ¿cómo va el usuario a encontrar el recurso que necesita? Esta
pregunta no tiene una respuesta sencilla, pues las necesidades de los usuarios varían:
desde el usuario curioso que desea “echar un vistazo” para ver qué recursos se pueden
encontrar, hasta el usuario con unas necesidades muy concretas, por ejemplo, un
profesor de inglés que busca un vídeo (en inglés) sobre microbiología como material de
soporte para sus clases a un grupo de biólogos.
La
solución
adoptada
en
Lingu@net
Europa
consiste
en
ofrecer
tres
posibilidades distintas para el acceso de recursos: navegación, búsqueda guiada y
búsqueda libre. La navegación permite acceder a los recursos seleccionando una serie
de valores clave: ámbito educativo, tipo de recurso, e idioma objeto de aprendizaje, y
permite con sólo tres pulsaciones de ratón, acceder a la lista de recursos que
satisfacen los valores elegidos para dichos campos. La búsqueda guiada permite el
acceso a los recursos mediante la selección de los valores para un conjunto más
amplio de campos, que son mostrados al usuario mediante menús desplegables. La
búsqueda libre permite por último al usuario introducir uno o varios términos
cualquiera, y obtener los recursos que se correspondan con dichos términos.
Desde el punto de vista técnico, las distintas opciones de búsqueda de recursos
se basan en la existencia de un índice de los documentos de metadatos. Dicho índice
se actualiza cada vez que se publica un nuevo documento de metadatos, y permite la
realización de búsquedas basándose en los valores de las etiquetas META y también
búsquedas de cualquier palabra que aparece en los documentos de metadatos.
Interfaz de usuario multilingüe
Uno de los aspectos más importantes para el éxito o el fracaso un centro virtual de
este tipo es su interfaz de usuario. En el caso de Lingu@net Europa, la interfaz de
usuario ha evolucionado desde un primer prototipo con una interfaz relativamente
sencilla, principalmente textual, hasta una interfaz mucho más rica desde el punto de
vista gráfico, y en la cuál se aprecia la influencia de los denominados “portales” de
Internet. El número de idiomas soportados ha evolucionado también, pasando de
cuatro, inglés, francés, alemán y holandés, a seis, con la inclusión del español y el
italiano.
Figura 3: Página pública de Lingu@net Europa
El diseño gráfico actual de las páginas públicas de Lingu@net Europa (Figura 3)
ha sido el fruto de un intenso trabajo por parte de los socios del proyecto, asesorado
por un diseñador gráfico experto en interfaces web.
Las páginas de Lingu@net Europa se generan dinámicamente, utilizando un
conjunto de bibliotecas en Perl diseñadas específicamente para el proyecto, pero de
uso general. Dichas bibliotecas permiten crear las páginas a partir de distintos
módulos,
como
por
ejemplo,
el
módulo
barra_superior
,
el
módulo
botones_de_la_izquierda
, etc. Además, se han definido una serie de etiquetas de
escape que aportan mayor flexibilidad a los módulos. Cada etiqueta lleva asociada una
acción, y el resultado de dicha acción se inserta automáticamente en el punto del
documento correspondiente (FERRER, 2001)
Las etiquetas de escape facilitan la creación del interfaz en distintos idiomas.
Por ejemplo, se definen etiquetas para insertar ficheros dependientes del idioma de
navegación del usuario, o etiquetas que permiten traducir un término en inglés por el
término correspondiente en el idioma de navegación del usuario.
En este punto es conveniente aclarar el funcionamiento, desde el punto de vista
de los idiomas, del conjunto de valores de los metadatos utilizados en Lingu@net
Europa. La definición de los valores se ha realizado en inglés por un equipo de
expertos del proyecto, tras lo cual se ha realizado su traducción a los distintos idiomas
del centro virtual. El proceso ha requerido una fase posterior de refinamiento, pues
algunos de los términos en inglés no tienen un único equivalente en otros idiomas y
viceversa. En este sentido son interesantes los trabajos de indexación semántica
(VERDEJO, 2000), que presentan una posible solución al problema del uso del inglés (u
otro idioma) como base para la generación de términos en otros idiomas.
Finalmente, una vez acordados los términos, estos se introducen en un tesauro
que relaciona los términos en inglés con los términos en otros idiomas. De esta forma,
es posible crear gran parte del diseño web (los módulos) en un único idioma y utilizar
las etiquetas de traducción que se basan en el tesauro para generar automáticamente
las páginas en el resto de idiomas.
Conclusiones
Se han presentado las soluciones adoptadas en Lingu@net Europa para resolver los
problemas que presenta la creación y mantenimiento de un catalogo multilingüe de
recursos en Internet. A pesar de estar enfocado a un campo específico (los recursos
educativos y formativos para idiomas), se ha buscado una solución lo más general
posible. También se han presentado soluciones alternativas, disponibles hoy en día o
en un futuro cercano (Java frente a Perl, Dublín Core/RDF/XML frente a Dublín
Core/HTML) que facilitarían gran parte del trabajo desarrollado en Lingu@net Europa y
permitirían la creación de un centro virtual más flexible y escalable.
Agradecimientos
Lingu@net Europa fue desarrollado inicialmente como un proyecto europeo (1998-
2001), con el apoyo financiero de la Comisión Europea (Dirección General de Educación
y Cultura). En la actualidad opera como una compañía sin ánimo de lucro que está
abierta a la entrada de nuevos socios y miembros, tanto de Europa como del resto del
mundo.
REFERENCIAS
CILT,
Centre
for
Information
on
Language
Teaching
and
Research,
UK,
http://www.cilt.org.uk
CVC, Centro Virtual Cervantes,
http://cvc.cervantes.es/
DCMI,
1999,
Dublin
Core
Metadata
Element
Set,
Version
1.1,
http://dublincore.org/documents/dces/
DCMI, 2002, Dublin Core Metadata Initiative,
http://dublincore.org
FERRER, Adrián, 2001, Gestión de Documentos para un Centro Virtual Multilingüe,
Proyecto Fin de Carrera, ETSI de Telecomunicación de Madrid.
Lingu@net Europa,
http://www.linguanet-europa.org/
LIZCANO, Alejandro, 2002, Integración de Tecnologías XML y Java para Gestión de
Sistemas de Información, Proyecto Fin de Carrera, ETSI de Telecomunicación de
Madrid.
IMS Global Learning Consortium, 2002, IMS Specifications,
http://www.imsproject.org/specifications.html
VERDEJO, Felisa, GONZALO, Julio, FERNÁNDEZ , David, PEÑAS , Anselmo, LÓPEZ,
Fernando, 2000, “ITEM: Un Motor de Búsqueda Multilingüe Basado en Indexación
Semántica”,
I
Jornadas
Españolas
de
Bibliotecas
Digitales,
Valladolid,
http://gaia.dcs.fi.uva.es/~jbidi2000/comunicaciones/13_item.pdf
W3C, 1999, Resource Description Framework (RDF) Model and Syntax Specification,
W3C Recommendation,
http://www.w3.org/TR/REC-rdf-syntax/
W3C, 2000, Extensible Markup Language (XML) 1.0 (Second Edition), W3C
Recommendation,
http://www.w3.org/TR/2000/REC-xml-20001006
¡Sé el primero en escribir un comentario!

13/1000 caracteres como máximo.