Historia de las Bibliotecas Digitales
Este elemento es una expansión del contenido de los cursos y guías de Lawi. Ofrece hechos, comentarios y análisis sobre este tema. [aioseo_breadcrumbs] En inglés: History of Digital Libraries.
Historia de las Bibliotecas Digitales
El primer reconocimiento importante de la importancia de las bibliotecas digitales llegó con el anuncio en 1994 de que se repartirían 24,4 millones de dólares de fondos federales estadounidenses entre seis universidades para la investigación de “bibliotecas digitales”. Esta financiación (o financiamiento) llegó a través de una iniciativa conjunta de la Fundación Nacional de la Ciencia (NSF), la Agencia de Proyectos de Investigación Avanzada del Departamento de Defensa (ARPA) y la Administración Nacional de Aeronáutica y del Espacio (NASA). Los proyectos se llevaron a cabo en la Universidad Carnegie Mellon, la Universidad de California-Berkeley, la Universidad de Michigan, la Universidad de Illinois, la Universidad de California-Santa Bárbara y la Universidad de Stanford.
Estos seis proyectos bien financiados ayudaron a poner en marcha la definición popular de “biblioteca digital”. Estos proyectos eran experimentos de ciencias de la computación, principalmente en las áreas de arquitectura y recuperación de información. Con razón o sin ella, las subvenciones DLI-1 fueron criticadas, en su época y con frecuencia, como ejercicios de investigación pura, con pocas aplicaciones prácticas.
Aunque estos proyectos eran interesantes intentos de experimentar con las colecciones digitales, en ningún sentido se parecían a las bibliotecas. Tenían poco o ningún componente de servicio, no tenían custodia sobre las colecciones, no eran sostenibles, no tenían una base de usuarios y no tenían tradiciones éticas. A esto lo llamaremos la etapa “experimental” del desarrollo de las bibliotecas digitales. Debido a que los esfuerzos durante esta etapa experimental fueron los primeros en recibir un reconocimiento tan amplio bajo el término “biblioteca digital”, establecieron una comprensión popular de ese término que ha persistido durante muchos años.
En 1996, los científicos sociales que habían trabajado anteriormente con bibliotecas convencionales empezaron a intentar ampliar el término “bibliotecas digitales”.Si, Pero: Pero el verdadero avance se produjo a finales de 1998, cuando el gobierno federal de EE.UU. concedió sus premios DL-2, altamente financiados (Griffin 1999), a proyectos que contenían algunos elementos del servicio bibliotecario tradicional, como la custodia, la sostenibilidad y la relación con una comunidad de usuarios. También por esa época, los administradores de las bibliotecas convencionales comenzaron a crear componentes digitales serios.
A medida que los bibliotecarios y los científicos sociales se involucraron más en estos proyectos digitales, los esfuerzos se alejaron de los experimentos informáticos y se convirtieron en proyectos más operativos. Llamaremos a esto la etapa de “desarrollo” de las bibliotecas digitales. A finales de la década de los noventa, sobre todo bajo la influencia de la Federación de Bibliotecas Digitales de Estados Unidos, los proyectos empezaron a abordar componentes tradicionales de las bibliotecas, como la administración de una colección y la interoperabilidad entre colecciones.Si, Pero: Pero aunque los desarrolladores de bibliotecas digitales han hecho grandes progresos en cuestiones como la interoperabilidad real y la preservación digital, éstas están lejos de estar resueltas en un entorno operativo sólido. Para entrar en la fase de “madurez” en la que podamos llamar realmente a estas nuevas entidades “bibliotecas digitales”, tendrán que avanzar mucho más en el traslado de los componentes convencionales de las bibliotecas, como la sostenibilidad y la interoperabilidad, al ámbito digital. Y los desarrolladores tienen que empezar a abordar seriamente cómo pueden trasladar las tradiciones éticas de las bibliotecas (como la libertad de expresión, la privacidad y la igualdad de acceso) también al ámbito digital. El resto de este capítulo examina importantes esfuerzos para avanzar en esas direcciones.
Avanzar hacia una arquitectura más centrada en el usuario
Tanto los primeros experimentos informáticos en bibliotecas digitales como los primeros esfuerzos para construir catálogos de acceso público en línea (OPAC). Bajo este modelo, un usuario necesitaba interactuar con cada repositorio digital de forma independiente, aprender la sintaxis soportada por cada repositorio digital y tener instalado en su propio ordenador el software de aplicaciones necesario para ver los tipos de objetos digitales soportados por cada repositorio digital.
Así, para que un usuario pueda buscar en el repositorio A, primero tendría que ajustarse a la interfaz de usuario especializada del repositorio As, y luego aprender la sintaxis de búsqueda soportada por este repositorio. (Por ejemplo, los OPACs basados en NOTIS requerían una sintaxis de búsqueda como A=Besser, Howard, mientras que los OPACs basados en Inovative requerían una sintaxis de búsqueda como FIND PN Besser, Howard). Una vez completada la búsqueda, el usuario podría recuperar los objetos digitales apropiados, pero no necesariamente podría verlos. Cada repositorio sólo admite un número limitado de formatos de codificación y requiere que el usuario tenga instalado un software específico en su ordenador personal (como visores para Microsoft Word 98, SGML, Adobe Acrobat, TIFF, PNG, JPEG o software especializado distribuido por el repositorio) para poder ver el objeto digital. De este modo, los usuarios podrían buscar y encontrar las obras pertinentes, pero no podrían verlas.
El usuario tendría que repetir este proceso con el repositorio B, C, D, etc., y cada uno de estos repositorios podría requerir una sintaxis y un conjunto de visores diferentes. Una vez que el usuario había buscado en varios repositorios diferentes, seguía sin poder examinar juntos todos los objetos recuperados. No había forma de fusionar los conjuntos. Y como los distintos repositorios admitían diferentes programas de visualización, cualquier intento de examinar objetos de varios repositorios probablemente requeriría ir y venir entre varios programas de aplicaciones diferentes utilizados para la visualización.
Obviamente, el modelo de la figura 36.1 no era muy fácil de usar. Los usuarios no quieren aprender varias sintaxis de búsqueda, no quieren instalar una variedad de aplicaciones de visualización y quieren hacer una sola consulta que acceda a una variedad de repositorios diferentes. Los usuarios quieren acceder a un mundo de información interoperable, en el que un conjunto de repositorios separados les parezca un único portal de información.Entre las Líneas En la figura 36.2 se presenta un modelo más fácil de usar.Entre las Líneas En este modelo, el usuario realiza una única consulta que se propaga a través de múltiples repositorios. El usuario sólo debe aprender una sintaxis de búsqueda.
El usuario no necesita tener un gran número de aplicaciones de software instaladas para la visualización, y los conjuntos de objetos digitales recuperados pueden consultarse juntos en la estación de trabajo del usuario. El modelo de la figura 36.2 prevé un mundo de repositorios digitales interoperables, y es un modelo al que debemos aspirar.
A lo largo de los años, los desarrolladores han hecho algunos progresos significativos hacia el modelo señalado más arriba, especialmente en el área de los OPAC. Los navegadores web han proporcionado un “look-and-feel” común entre las diferentes interfaces de usuario de los repositorios. Los protocolos Z39-50 han permitido a los usuarios emplear una sintaxis de búsqueda única y familiar, incluso cuando la sintaxis de búsqueda nativa del repositorio parece extraña. Z39-50 también ha prometido permitir que las consultas de los usuarios se propaguen a diferentes repositorios.Si, Pero: Pero cuando se abandona el mundo de los OPAC y se entra en el de los repositorios digitales, aún queda mucho trabajo por hacer para lograr una verdadera interoperabilidad. La mayor parte de este trabajo implica la creación y adopción de una amplia variedad de normas: desde normas para los distintos tipos de metadatos (administrativos, estructurales, de identificación, de longevidad), hasta formas de hacer visibles esos metadatos a sistemas externos (harvesting), pasando por arquitecturas comunes que soporten la interoperabilidad (archivos abiertos).
Procesos generales y etapas de desarrollo tecnológico
La automatización de cualquier tipo de proceso convencional suele seguir una serie de pasos pragmáticos, así como una serie de etapas conceptuales.
Las etapas pragmáticas de aplicación suelen comenzar con el uso de la tecnología para experimentar con nuevos métodos de realización de alguna función, seguido de la construcción de sistemas operativos, seguido de la construcción de sistemas operativos interoperables. Y en las últimas etapas, los desarrolladores empiezan a intentar que estos sistemas sean útiles para los usuarios. Este modelo (de sistemas experimentales a sistemas operativos, de sistemas interoperables a sistemas útiles) se repite en el desarrollo de los OPAC, los servicios de indexación y abstracción y la recuperación de imágenes. La automatización de cada uno de ellos ha comenzado con experimentos, seguidos de implementaciones que preveían sistemas operativos cerrados (con cuerpos de usuarios conocidos que necesitan aprender interfaces de usuario y sintaxis particulares para interactuar con el sistema), seguidos de implementaciones que permitían al usuario interactuar más fácilmente con múltiples sistemas (y a veces incluso buscar en varios sistemas). Las “bibliotecas digitales” actuales no han pasado de la fase experimental inicial y necesitan mucho más trabajo para que sean realmente interoperables y estén centradas en el usuario.
Los pasos conceptuales suelen incluir, en primer lugar, el intento de replicar las actividades básicas que funcionaban en el entorno analógico, luego el intento de replicar algunas (pero no todas) las funciones no básicas del entorno analógico y, por último, (después de utilizar los sistemas durante algún tiempo) descubrir e implementar nuevas funciones que no existían en el entorno analógico anterior. Sólo con este último paso se hace realidad el nuevo entorno funcional que permite la nueva tecnología. Así, por ejemplo, los procesadores de texto se construyeron inicialmente como máquinas de escribir con mecanismos de almacenamiento, pero con el tiempo fueron incorporando funciones como el corrector ortográfico y el seguimiento de revisiones, y finalmente permitieron funciones muy diferentes (como la autoedición). Nuestros primeros esfuerzos en la creación de registros MARC comenzaron como formas de automatizar la producción de tarjetas de catálogo, luego pasaron a la creación de utilidades bibliográficas y sus catálogos colectivos, y después a los OPAC. Desde el punto de vista funcional, nuestros OPACs empezaron como meras réplicas de los catálogos de tarjetas, luego añadieron la búsqueda booleana, después la búsqueda por título y ahora están preparados para permitir a los usuarios propagar las búsquedas distribuidas a través de una serie de OPACs. Las colecciones digitales actuales no han superado la fase inicial en la que replicamos las colecciones de contenido y catalogación que existían en forma analógica, y apenas empezamos a añadir funciones menores.Entre las Líneas En el futuro podemos esperar que nuestras bibliotecas digitales incorporen una variedad de funciones que empleen los nuevos entornos tecnológicos de formas que hoy apenas podemos imaginar.
La importancia de las normas
Al pasar de las colecciones digitales dispersas a las bibliotecas digitales interoperables, la actividad más importante en la que deben centrarse los desarrolladores son las normas. Esto incluye normas y protocolos para archivos abiertos y recolección de metadatos.Si, Pero: Pero lo más importante es la gran variedad de normas de metadatos que se necesitan.
Pormenores
Las actividades de metadatos más extensas se han centrado en los metadatos de descubrimiento (como el Dublin Core), pero los metadatos también incluyen una amplia variedad de otras funciones: los metadatos estructurales se utilizan para pasar las páginas de un libro digital, los metadatos administrativos se utilizan para garantizar que todas las páginas individuales de un libro digital se mantengan juntas a lo largo del tiempo, los sistemas de recuperación de imágenes basados en ordenador emplean metadatos para ayudar a los usuarios a buscar colores, formas y texturas similares, etc.
Informaciones
Los desarrolladores deben emplear ampliamente los metadatos descriptivos para una descripción coherente, los metadatos de descubrimiento para encontrar obras, los metadatos administrativos para ver y mantener las obras, los metadatos estructurales para navegar por una obra individual, los metadatos de identificación para determinar que se ha accedido a la versión adecuada de una obra, y los metadatos de términos y condiciones para cumplir con las restricciones de uso.
Tener un consenso sobre los metadatos y otras normas es importante por varias razones. Los metadatos administrativos y de longevidad son necesarios para gestionar los archivos digitales a lo largo del tiempo, para asegurarse de que todos los archivos necesarios se mantienen juntos y para ayudar a visualizar estos archivos cuando el software de aplicación actual se vuelve inutilizable. Debido a la mutabilidad de las obras digitales, los desarrolladores necesitan normas que garanticen la veracidad de una obra y que ayuden a asegurar a los usuarios que una obra concreta no ha sido alterada y que es realmente la versión de la obra que pretende ser. Y los desarrolladores necesitan una variedad de tipos de metadatos y normas para permitir la interoperabilidad de varias colecciones digitales y para ayudar a los usuarios a sentir que pueden buscar entre grupos de colecciones. Una de las ventajas de llegar a un consenso sobre los metadatos que se registrarán de forma coherente es que los proveedores tendrán un incentivo económico para reajustar las aplicaciones para incorporar estos metadatos (porque pueden repartir sus costes entre una amplia variedad de instituciones que querrán emplear estos estándares).
Los distintos tipos de metadatos
Las bibliotecas tienen acuerdos sobre normas de metadatos desde hace muchas décadas. Las Reglas de Catalogación Angloamericanas definieron un conjunto de metadatos descriptivos para las obras bibliográficas (y posteriormente, para otras), y el formato MARC nos dio una sintaxis para transportar esos registros bibliográficos. Asimismo, los Encabezamientos de Materia de la Biblioteca del Congreso y los Encabezamientos de Materia de Sears nos han proporcionado durante muchos años metadatos de descubrimiento para ayudar a los usuarios a encontrar el material pertinente.Entre las Líneas En el último cuarto del siglo XX, surgieron otros tipos de metadatos de localización para servir a campos especializados, como el Tesauro de Arte y Arquitectura (AAT) y los Encabezamientos de Materia Médica (MeSH). Aunque tanto el AAT como el MeSH estaban pensados para su uso en un entorno en línea, ambos se desarrollaron en una época en la que los registros de indexación y catalogación podían estar en un ordenador, pero las obras a las que se referían no. Y ambos se desarrollaron en un momento en el que era improbable que la fusión de los registros de estos campos especializados con los registros de obras más generales se produjera de forma generalizada.
La rápida aceptación de la World Wide Web hizo que algunos de nosotros nos planteáramos cómo permitir a los usuarios buscar en una variedad de registros y recursos en línea, especialmente cuando algunos de esos recursos recibían una amplia catalogación, mientras que otros recibían poca o ninguna. Esto condujo a la reunión de marzo de 1995, en la que se definió el núcleo de Dublín como un tipo de metadatos de descubrimiento que permitiría a los usuarios buscar entre una amplia variedad de recursos, incluyendo tanto el material altamente catalogado (a menudo heredado) como el material (en gran parte nuevo y en forma electrónica) al que se le había asignado sólo una cantidad mínima de metadatos. Concebimos el Dublin Core como una especie de conjunto unificador de metadatos que permitiera la búsqueda en todo tipo de registros y recursos digitales. Los registros de catalogación de las bibliotecas o los registros de gestión de las colecciones de los museos podrían “simplificarse” para parecerse a los registros Dublin Core (DC), mientras que los registros DC para recursos como el trabajo de investigación de un individuo podrían ser lo suficientemente fáciles de crear para el individuo, o incluso podrían ser generados automáticamente por el procesador de textos del individuo. La promesa aún no cumplida del Dublin Core (véase la siguiente sección sobre recolección) era proporcionar interoperabilidad a nivel de descubrimiento en todos los tipos de índices y recursos en línea, desde los OPAC altamente catalogados hasta los sitios y páginas web de individuos y organizaciones. Y como el Dublin Core existe desde hace aproximadamente siete años (y ha sido designado recientemente como Norma NISO Z39-85), está más desarrollado y es más conocido que cualquiera de los otros tipos de metadatos creados para los recursos electrónicos.
Aunque el Dublin Core fue desarrollado como una forma de metadatos digitales para ser aplicados a obras tanto en forma digital como no digital, una variedad de otros tipos de metadatos han sido desarrollados más recientemente específicamente para colecciones de obras en forma digital. A continuación, se comentan brevemente los esfuerzos realizados para definir los metadatos estructurales, los metadatos administrativos, los metadatos de identificación (especialmente para las imágenes) y los metadatos de longevidad. Todos estos tipos de metadatos son fundamentales para pasar de un conjunto de colecciones digitales independientes a verdaderas bibliotecas digitales interoperables.
Una Conclusión
Por lo tanto, todos ellos incorporan funciones que probablemente conduzcan a una mayor interoperabilidad o a los servicios más completos y sólidos que caracterizan a una biblioteca más que a una colección.
Los metadatos estructurales reconocen que, para muchas obras en formato digital, no basta con mostrar la obra; los usuarios pueden necesitar navegar por ella. Los metadatos estructurales reconocen que los usuarios esperan ciertos “comportamientos” de una obra. Por ejemplo, imagine un libro compuesto por cientos de archivos digitales, cada uno de los cuales es el escaneo de una sola página del libro. Los metadatos estructurales son necesarios para que los usuarios realicen los comportamientos normales que pueden esperar de un libro. Los usuarios esperan poder ver el índice de contenidos y luego saltar a un capítulo concreto. Cuando lean ese capítulo, esperarán pasar de página y, ocasionalmente, volver a leer la página anterior. Cuando lleguen a una cita, querrán saltar a la bibliografía para leer la cita, y luego volver a saltar. Y cuando lleguen a un marcador de nota a pie de página, querrán saltar hasta donde puedan leer el contenido de la nota, y luego volver a saltar. Todos estos son comportamientos normales que esperamos de cualquier tipo de libro, pero todos estos comportamientos requieren metadatos estructurales. Sin ellos, el libro no sería más que una serie de páginas individuales escaneadas, y los usuarios tendrían muchas dificultades para intentar siquiera colocar las páginas en el orden correcto, y mucho menos para leer el libro. Los metadatos estructurales tienen una función en cualquier tipo de material que se beneficie de la navegación interna (incluidos los diarios y las revistas).
Los metadatos administrativos mantienen la información necesaria para que una obra digital siga siendo accesible a lo largo del tiempo.Entre las Líneas En el caso de un libro digitalizado, los metadatos administrativos anotan todos los archivos individuales necesarios para ensamblar el libro, dónde se encuentran los archivos y qué formatos de archivo y software de aplicación son necesarios para ver el libro o sus páginas individuales. Los metadatos administrativos cobran especial importancia cuando se trasladan los archivos a un nuevo servidor o se realizan actividades relacionadas con la longevidad digital, como la actualización o la migración.
En lugar de emplear estándares abiertos para los metadatos estructurales y administrativos, muchas personas y organizaciones optan por codificar sus documentos en productos comerciales como Adobe Acrobat. Aunque esto es muy cómodo (sobre todo por la proliferación de lectores de Acrobat), podría ser una práctica peligrosa para las bibliotecas y repositorios similares. Los productos comerciales están patentados y se centran en la comodidad inmediata más que en el acceso a largo plazo.
Una Conclusión
Por lo tanto, no existe ninguna garantía de compatibilidad continuada o de acceso futuro a las obras codificadas en versiones anteriores del software comercial. Para hacer frente a los problemas de conservación y acceso a largo plazo, así como para proporcionar un mayor nivel de funcionalidad estructural, en 1997 un grupo de bibliotecas estadounidenses inició el proyecto Making of America II para definir normas de metadatos estructurales y administrativos para el material de las colecciones especiales de las bibliotecas (Hurley et al. 1999). Estas normas se perfeccionaron en el Comité de Arquitectura y Normas Tecnológicas de la Biblioteca Digital de California (CDL 200la), y desde entonces se han rebautizado como Normas de Codificación y Transmisión de Metadatos (METS). METS fue adoptada por la Federación de Bibliotecas Digitales de EE.UU. y ahora es mantenida por la Biblioteca del Congreso de EE.UU. (loc.gov/standards/mets/). El Grupo de Bibliotecas de Investigación ha anunciado recientemente sus planes de liderar el esfuerzo de desarrollo de METS.
Los metadatos de identificación intentan abordar la proliferación de diferentes versiones y ediciones de las obras digitales.Entre las Líneas En el mundo de la imprenta, el ciclo de publicación solía imponer un proceso editorial y creaba lapsos de tiempo entre la publicación de obras variantes.
Puntualización
Sin embargo, en el caso de una obra digital altamente mutable, estos procesos y lapsos de tiempo a menudo se eliminan, y las variantes de la obra se crean rápidamente y con muy poca reflexión sobre su impacto en lo que solíamos llamar control bibliográfico.
Otros Elementos
Además, el propio entorno digital en red lleva a los distribuidores de información a proporcionar una variedad de formas diferentes de una obra determinada (formas de documentos en HTML, Postscript, Acrobat, XML y Microsoft Word para dar soporte a diferentes capacidades y necesidades de los usuarios; imágenes en miniatura, de tamaño medio y grande para dar soporte a la navegación, visualización y estudio de imágenes).
Es fundamental que cualquier imagen herede metadatos importantes de su linaje, o que los sistemas proporcionen al menos formas de que un investigador pueda rastrear hacia arriba en el linaje para descubrir metadatos que puedan afectar a su uso de la obra. Un primer paso en esta dirección son los esfuerzos de la Organización Nacional de Normas de la Información de EE.UU. para crear una norma de metadatos de imágenes técnicas que incorpore el “historial de cambios” y los “datos de origen” (según la NISO 2002).Si, Pero: Pero nuestra comunidad tiene mucho más trabajo que hacer para proporcionar el tipo de identificación de las formas variantes que los usuarios (especialmente los investigadores) han llegado a esperar de las bibliotecas de materiales analógicos. Y todavía tenemos que resolver el problema de cómo preservar los documentos dinámicos, es decir, los que están esencialmente vivos y cambian a diario.
A medida que los creadores de bibliotecas digitales construyen grandes colecciones de material en formato digital, tenemos que considerar cómo las obras digitales provocarán cambios en las antiguas prácticas que se han desarrollado en torno a las obras analógicas.Entre las Líneas En otro lugar, este autor ha señalado que el arte electrónico probablemente provocará cambios en las prácticas de conservación y preservación y que el creciente volumen de material de imágenes en movimiento en formato digital está empezando a reconfigurar el papel de los archivos cinematográficos y los archiveros.Si, Pero: Pero a un nivel muy pragmático, todos los repositorios de obras digitales deben preocuparse por la persistencia de esas obras en el tiempo. Los metadatos de longevidad son necesarios para conservar el material digital durante largos periodos de tiempo. Aunque guardar los bits puede ser bastante sencillo, guardar las obras digitales no lo es. Las obras digitales son muy frágiles y es necesario tomar medidas proactivas para garantizar su persistencia en el tiempo (para más información sobre este tema, véase el sitio web sobre longevidad digital sunsite.berkeley.edu/Longevity).Entre las Líneas En otro lugar, he esbozado cinco factores clave que plantean desafíos a la longevidad digital (el problema de la visualización, el problema de la codificación, el problema de la interrelación, el problema de la custodia y el problema de la traducción), y he sugerido que el consenso de la comunidad sobre los metadatos puede ser un factor clave para ayudar a que las obras digitales persistan en el tiempo. Recientemente, las principales empresas de servicios bibliográficos de Estados Unidos han iniciado serios esfuerzos para alcanzar un consenso sobre los metadatos de preservación de las obras digitales (OCLC/RLG 2001a, 2001b). La adopción generalizada de este tipo de normas hará que el reto de la persistencia digital sea mucho más asequible. Y a finales de 2001, la Biblioteca del Congreso, con la ayuda del Consejo de Recursos Bibliotecarios y de Información, inició un proceso de planificación para un Programa Nacional de Infraestructura y Preservación de la Información Digital (véase
Filosofías de metadatos y recolección: Warwick vs. MARC
Aunque el acuerdo sobre una variedad de normas de metadatos es un requisito previo necesario para las colecciones digitales interoperables, la implementación de la interoperabilidad también requiere un conjunto de arquitecturas y un enfoque común para hacer que los metadatos estén disponibles para otras colecciones, middleware y usuarios finales.Entre las Líneas En esta sección discutiremos dos enfoques filosóficos de los metadatos, así como los métodos para compartir los metadatos con aplicaciones e individuos fuera de la colección de origen del diseñador.
Las bibliotecas han empleado tradicionalmente el enfoque filosófico de los metadatos MARC/AACR2. Este enfoque emplea un único esquema general para cubrir todos los tipos de obras y todos los grupos de usuarios. A medida que surgen nuevos tipos de obras, se añaden nuevos campos al marco MARC/AACR2, o se modifican las reglas de los campos existentes para dar cabida a estas nuevas obras. Y a medida que surgen comunidades con nuevas necesidades de metadatos, éstas también se incorporan al esquema existente. La filosofía de MARC/AACR2 sostiene que un gran esquema debería servir para todas las necesidades de los usuarios y para todos los tipos de obras. Los críticos de este enfoque señalan que el esquema se ha vuelto tan excesivamente complejo que sólo los especialistas altamente capacitados (catalogadores de bibliotecas) son capaces de asignar metadatos con él, y que el sistema es demasiado lento para adaptarse a los nuevos tipos de obras. También afirman que los grupos de usuarios suelen tener conjuntos de necesidades de metadatos que los controladores de MARC/AACR2 no están dispuestos a acomodar.
En los últimos años, ha surgido una filosofía rival dentro de la comunidad de Dublin Core. Esta filosofía, basada en el marco Warwick, se basa en contenedores y paquetes de metadatos interconectados, cada uno mantenido por una comunidad particular. Según esta filosofía, cada comunidad puede apoyar los paquetes de metadatos que necesita para sus propios usos particulares, sin dejar de interoperar con los paquetes de metadatos de otras comunidades. Bajo esta filosofía, el Dublin Core sirve como un conjunto unificador de metadatos para permitir el descubrimiento en todas las comunidades. E incluso dentro del Dublin Core (DC), ciertas comunidades pueden emplear calificadores que satisfagan sus propias necesidades detalladas, sin dejar de proporcionar metadatos útiles a otras comunidades. (Por ejemplo, la comunidad bibliotecaria podría utilizar calificadores para reflejar los matices de las diferencias entre el título principal, el título alternativo, el título transliterado y el título traducido, mientras que otras comunidades podrían encontrar cualquiera de ellos como parte de una búsqueda bajo el título no calificado). Esta filosofía apoya los paquetes de metadatos que son modulares, superpuestos, extensibles y basados en la comunidad. Sus defensores creen que ayudarán a la puesta en común entre comunidades, al tiempo que proporcionan una funcionalidad completa dentro de cada comunidad. Este enfoque está diseñado para que un conjunto de comunidades en red se interrelacionen entre sí.
Independientemente del enfoque filosófico que se siga, cualquier colección se enfrenta a la cuestión pragmática de cómo poner sus metadatos a disposición de otras colecciones y de programas de búsqueda externos. El modelo tradicional de las bibliotecas era exportar los registros MARC a una utilidad bibliográfica (como OCLC o RLIN) y hacer que todos los usuarios externos buscaran a través de esa utilidad. Aunque esto funciona bien para los registros basados en MARC, cada vez más los usuarios quieren buscar en una base de información mucho más amplia de un mundo no circunscrito a los registros bibliográficos (como páginas y sitios web, documentos PDF, imágenes, bases de datos, etc.).
Una Conclusión
Por lo tanto, la mayoría de las colecciones digitales están empezando a considerar cómo exportar registros reducidos a un espacio donde puedan ser recogidos por los motores de búsqueda de Internet. Para los registros que siguen el enfoque MARC/AACR2, esto significa extraer registros simples (probablemente en formato DC) de los registros MARC complejos y exportarlos. Tanto para el enfoque de Warwick como para el de MARC/AACR2, esto significa desarrollar métodos para la recolección de metadatos que permitan que los motores de búsqueda de Internet encuentren los registros exportados adecuados. Actualmente se están llevando a cabo varios proyectos para probar la recolección de metadatos.
Mejores prácticas
Junto con las normas y arquitecturas, el acuerdo de la comunidad sobre las mejores prácticas es otro ingrediente importante para ayudar a que las colecciones de materiales digitales sean más interoperables y sostenibles. Las mejores prácticas garantizan que los contenidos y los metadatos de las distintas colecciones cumplan unas normas mínimas de conservación y que los usuarios puedan esperar un nivel de calidad de referencia.
Un principio clave de las mejores prácticas es que todo proyecto digital debe tener en cuenta a los usuarios, los usuarios potenciales, los usos y las características reales de las colecciones (véase más sobre colecciones temáticas digitales). Esto significa que la toma de decisiones tanto sobre la conversión digital del material analógico como sobre la asignación de metadatos debe planificarse cuidadosamente al inicio de un proyecto digital. Las mejores prácticas pioneras para la conversión digital desarrolladas por el Comité de Arquitectura Tecnológica y Normas de la Biblioteca Digital de California (CDL 2001b) introdujeron conceptos importantes diseñados para ayudar a la longevidad y sostenibilidad de las colecciones digitales. Estos conceptos incluían la diferenciación entre maestros y derivados, la inclusión de objetivos de escala de grises y reglas en el escaneado, el uso de mediciones objetivas para determinar los ajustes del escáner (en lugar de hacer coincidir la imagen en un monitor cercano con el objeto original), el almacenamiento en formatos comunes y la evitación de la compresión (especialmente la compresión con pérdidas). Este documento también sugería que las colecciones se esforzaran por capturar tantos metadatos como fuera razonablemente posible (incluidos los metadatos sobre el propio proceso de escaneado). La relación entre las mejores prácticas de escaneado y la longevidad de las obras digitales se explica con más detalle en el borrador de puntos de referencia para reproducciones digitales de la Digital Library Federation (DLF 2001, véase).
El proyecto Making of America II introdujo la idea de que los metadatos podían comenzar en una forma bastante cruda y, con el tiempo, pasar a ser tostados y finalmente cocinados. Esta noción de mejora gradual de los metadatos parece haber aplacado los temores de algunos grupos de que los esquemas de metadatos como METS eran demasiado exagerados y complicados para ellos.Entre las Líneas En efecto, esta noción parece haber aumentado el nivel de adopción de esquemas de metadatos más complicados.
Otras cuestiones relacionadas con las normas
Es necesario abordar otras cuestiones relacionadas con las normas para lograr la interoperabilidad y otros servicios bibliotecarios convencionales en nuestras emergentes bibliotecas digitales. Entre ellos se encuentran los archivos abiertos, la recopilación de metadatos, la identificación persistente, la ayuda a los usuarios para encontrar la copia adecuada y la autenticación de usuarios.
Los metadatos almacenados en los sistemas locales a menudo no son visibles para las aplicaciones externas o los usuarios que pueden estar tratando de descubrir los recursos locales. Esto dificulta seriamente la interoperabilidad y la capacidad de un usuario para buscar en múltiples colecciones. La Iniciativa de Archivos Abiertos (openarchives.org) está abordando este problema mediante el desarrollo y la prueba de protocolos de interoperabilidad que permitirán a las aplicaciones recopilar metadatos, incluso los que residen en archivos profundos. El éxito de un proyecto como éste es fundamental para ofrecer a los usuarios un acceso más abierto y/o organizado.
Basado en la experiencia de varios autores, mis opiniones, perspectivas y recomendaciones se expresarán a continuación (o en otros lugares de esta plataforma, respecto a las características en 2026 o antes, y el futuro de esta cuestión):
Otros Elementos
Además, el hecho de que este proyecto se centre en los archivos de impresos electrónicos debería proporcionar a los usuarios un cuerpo de contenido diverso y libre de restricciones onerosas.
La denominación persistente sigue siendo una cuestión importante para la creación de verdaderas bibliotecas digitales. Aunque internet nos ha proporcionado un mayor acceso a las obras, la arquitectura de la Web ha violado las prácticas tradicionales de las bibliotecas de proporcionar información sobre la ubicación relativa de una obra, proporcionando en cambio una dirección de ubicación precisa. Los fallos en el sistema de localización precisa de la Web (la URL) producen el mensaje de error más común que encuentran los usuarios de la Web: 404 – Archivo no encontrado. La mayoría de estos mensajes de error son el resultado del mantenimiento normal de un sitio web (renombrar carpetas o directorios de orden superior, reorganizar la ubicación de los archivos). Los bibliotecarios nunca se plantearían decirle a un usuario que para encontrar el libro que busca debe ir al tercer nivel de las pilas, en la octava fila, a la quinta estantería, al tercer estante, y coger el séptimo libro de la izquierda; saben que una vez que alguien saque el tercer libro de la izquierda, todo el sistema de localización se vendrá abajo.
Puntualización
Sin embargo, este es el tipo de sistema en el que se basan las URL.Entre las Líneas En los últimos años se ha trabajado mucho en la nomenclatura indirecta (en forma de PURLS, URNs y handles).Si, Pero: Pero para replicar el poder que han desarrollado las bibliotecas, necesitamos una nomenclatura verdaderamente persistente. Esto significa algo más que la mera indicación de la ubicación de una obra concreta. Una nomenclatura persistente sofisticada incluiría la capacidad de designar una obra por su nombre y distinguir entre varias instancias de esa obra y sus ubicaciones físicas. Al igual que las bibliotecas convencionales son capaces de manejar versiones y ediciones y dirigir a los usuarios a copias concretas de las mismas, nuestras bibliotecas digitales tendrán que utilizar metadatos de identificación para dirigir a los usuarios a una instanciación adecuada de la obra que buscan.
Desde la aparición de los servicios de indización y resumen, las bibliotecas convencionales han tenido que enfrentarse al problema de responder a la consulta de un usuario con una lista de obras, algunas de las cuales pueden no estar fácilmente disponibles. Las bibliotecas convencionales se han esforzado por informar a los usuarios de que algunas fuentes no se encuentran físicamente en la biblioteca, y también han desarrollado servicios de préstamo interbibliotecario y de entrega de documentos para ayudar a que el material llegue a los usuarios en el momento oportuno.Si, Pero: Pero la reciente proliferación de recursos electrónicos de texto completo con licencia ha complicado enormemente este problema. Por diversas razones, puede ser muy difícil encontrar un documento adecuado para un usuario que tenga licencia de uso: algunos usuarios pueden estar cubiertos por una licencia determinada y otros no; el mismo documento puede ser proporcionado por varios agregadores bajo diferentes licencias; gran parte del contenido en línea es almacenado físicamente por el licenciante (proveedor de contenidos) en lugar de por el licenciatario (biblioteca). Los recientes esfuerzos de estandarización han comenzado a abordar parte de este problema; la Organización Nacional de Estándares de Información de EE.UU. ha formado el Comité Estándar AX de OpenURL (niso.org/commitax.html) para permitir que una consulta lleve información sensible al contexto. Esto ayudará a una biblioteca a autenticar a sus licenciatarios en un sitio de contenido remoto.Si, Pero: Pero aún quedan muchos más problemas por resolver a la hora de hacer llegar a los usuarios las copias adecuadas (sobre todo cuando las licencias de contenidos son complejas y se solapan).
Otra área de estándares y protocolos de importancia crítica que se está desarrollando es la de la autentificación de los usuarios. Dado que los proveedores de contenidos almacenan físicamente cada vez más contenidos con licencia, quieren tener la seguridad de que los usuarios que acceden a ellos están amparados por licencias válidas para hacerlo.
Puntualización
Sin embargo, los métodos convencionales de autenticación de usuarios (como la contraseña o la dirección IP) permitirían a los proveedores de contenidos rastrear lo que lee una persona y elaborar complejos perfiles de los hábitos de los usuarios. Los juristas han advertido de los peligros que esto supone, y va en contra de la importante tradición ética bibliotecaria de la privacidad. Se ha empezado a trabajar en un proyecto que permite a una institución autentificar a los usuarios ante un proveedor de recursos sin revelar las identidades individuales.
Pasar de las colecciones digitales aisladas a las bibliotecas digitales interoperables
Las bibliotecas convencionales tienen tanto componentes funcionales como tradiciones éticas. Las colecciones digitales que se están construyendo actualmente no serán realmente “bibliotecas digitales” hasta que incorporen un número significativo de los componentes de las bibliotecas convencionales y se adhieran a muchas de las importantes tradiciones y valores éticos de las bibliotecas. Y aunque nuestras colecciones digitales han avanzado mucho en estos ámbitos en los últimos siete años, aún les queda un largo camino por recorrer.
Para el componente de interoperabilidad, proyectos como los archivos abiertos, la recolección de metadatos y los metadatos estructurales y administrativos son muy prometedores.Entre las Líneas En cuanto a la gestión de los fondos, los proyectos de preservación digital han comenzado por fin, pero pasará algún tiempo antes de que podamos decir con confianza que podemos preservar la parte de nuestra cultura que está en formato digital.
Otros Elementos
Además, los desarrolladores sólo han empezado a abordar la cuestión de la sostenibilidad económica de las bibliotecas digitales.Entre las Líneas En cuanto a otros componentes, como el servicio a la clientela, apenas han arañado la superficie en un área importante en la que las bibliotecas convencionales se desenvuelven muy bien: la entrega de información a diferentes grupos de usuarios (por nivel de edad, base de conocimientos, necesidad particular, etc.) de forma adecuada a cada grupo. La California Digital Library y la UCLA/ Pacific Bell Initiative for 21st Century Literacies han completado recientemente un proyecto para explorar este problema (newliteracies.gseis.ucla.edu/design).
📬Si este tipo de historias es justo lo que buscas, y quieres recibir actualizaciones y mucho contenido que no creemos encuentres en otro lugar, suscríbete a este substack. Es gratis, y puedes cancelar tu suscripción cuando quieras: Qué piensas de este contenido? Estamos muy interesados en conocer tu opinión sobre este texto, para mejorar nuestras publicaciones. Por favor, comparte tus sugerencias en los comentarios. Revisaremos cada uno, y los tendremos en cuenta para ofrecer una mejor experiencia.Aquellos que construyen colecciones digitales han gastado menos energía tratando de construir tradiciones éticas bibliotecarias en nuestros sistemas, y en muchos casos han confiado en aquellos que están fuera de la comunidad de la biblioteca digital (como la Asociación Americana de Bibliotecas presentando demandas sobre privacidad y libertad de expresión, o el Grupo de Trabajo de Ingeniería de Internet desarrollando protocolos para preservar la privacidad) para trabajar en la defensa de las tradiciones éticas bibliotecarias como la libertad de expresión, la privacidad y la igualdad de acceso. Pero, como ha dejado claro Lawrence Lessig, las decisiones que tomemos en la arquitectura y el diseño de nuestros sistemas limitarán las decisiones sociales que podamos tomar en torno al uso de esos sistemas en el futuro (Lessig 1999). Por ejemplo, algunos de nuestros sistemas de circulación de acceso público en línea sólo guardaban a propósito los datos agregados de los usuarios para que nadie en el futuro pudiera intentar rastrear los hábitos de lectura individuales. Aunque proyectos desde principios del siglo XXI están intentando diseñar tradiciones éticas bibliotecarias en la infraestructura tecnológica, las bibliotecas digitales que estamos construyendo todavía no han abordado muchas de nuestras importantes tradiciones éticas bibliotecarias.
A medida que los diseñadores construyan colecciones digitales, también tendrán que mantener las tradiciones éticas bibliotecarias de igualdad de acceso y diversidad de la información. Ambas están amenazadas por la comercialización de la propiedad intelectual. A medida que vemos la creciente mercantilización de la información y la consolidación de la industria de contenidos en cada vez menos manos, cada vez menos trabajos creativos entran en el dominio público y más requieren un pago para poder verlos. La mercantilización y la consolidación también traen consigo una concentración en las obras “best-seller” y una limitación de la diversidad de obras. Los creadores de colecciones digitales tienen que ir más allá de los contenidos que son populares y ser agresivos a la hora de recopilar contenidos que reflejen una amplia diversidad; en lugar de utilizar el ya conocido enfoque oportunista para convertir los contenidos en formato digital, tendrán que desarrollar políticas de desarrollo de colecciones digitales cuidadosamente planificadas.
Informaciones
Los desarrolladores se verán obligados a colaborar estrechamente con otros, tanto para aprovechar los recursos como para garantizar que los esfuerzos de las distintas organizaciones en conjunto parezcan bibliotecas digitales virtuales para nuestros usuarios.
Informaciones
Los desarrolladores y los académicos también tienen que participar en estos esfuerzos, para garantizar que una amplia gama de contenidos acabe saliendo del mercado y entrando en el dominio público. Tenemos que implicarnos en luchas como el esfuerzo actual de la American Library Association para crear una coalición que proteja los “bienes comunes de la información” en el ciberespacio.
Los creadores de bibliotecas digitales también tendrán que mantener el papel de la biblioteca como guardián de los derechos de los individuos a acceder a una rica variedad de información, y a ver esa información dentro de su contexto. Tendrán que seguir vigilando para asegurarse de que otras formas de “igualdad de acceso a la información” se extiendan al nuevo mundo digital. También harían bien en extender la “carta de derechos de las bibliotecas” al ciberespacio, y se verán obligados a luchar para evitar que el mundo digital aumente la distancia entre “los que tienen” y “los que no tienen”.
Por último, en el camino hacia la construcción de bibliotecas digitales, debemos recordar que las bibliotecas no son meras colecciones de obras. Tienen tanto servicios como tradiciones y valores éticos que son parte fundamental de sus funciones. Las bibliotecas interoperan entre sí para atender las necesidades de información de una variedad de grupos de usuarios diferentes hoy en día, y esperan mantenerse a sí mismas y a sus colecciones para poder servir a los usuarios dentro de 100 años. Defienden el derecho de sus usuarios a acceder a los contenidos y a hacerlo con cierto grado de privacidad o anonimato. Las colecciones digitales que se están construyendo no serán verdaderamente bibliotecas digitales hasta que incorporen un número significativo de estos servicios y tradiciones éticas.
Datos verificados por: Brooks
Recursos
[rtbs name=”informes-jurídicos-y-sectoriales”][rtbs name=”quieres-escribir-tu-libro”]Véase También
Bibliotecas Digitales
Bibliografía
▷ Esperamos que haya sido de utilidad. Si conoces a alguien que pueda estar interesado en este tema, por favor comparte con él/ella este contenido. Es la mejor forma de ayudar al Proyecto Lawi.
Para ilustrar el problema de los metadatos de identificación, veamos una ilustración de formas variantes de imágenes. El objeto original (una oveja) se muestra en la esquina superior izquierda. Hay cuatro fotografías del objeto original, tomadas desde tres ángulos diferentes. Dos de las fotografías (A y D) están tomadas desde el mismo ángulo, pero la fotografía D ha captado una mosca en el costado de la oveja. Las imágenes a la derecha de la fotografía D son formas variantes de esa fotografía después de que se haya procesado la imagen para eliminar la mosca del lado de la oveja, mientras que las imágenes debajo de la fotografía D muestran formas variantes que incluyen la mosca. A lo largo de la figura hay formas variantes que incluyen imágenes de diferentes tamaños (desde miniaturas hasta alta resolución), diferentes ratios de compresión (con y sin pérdidas) y diferentes formatos de codificación de archivos (PICT, TIFF, JFIF). Es posible que algunos usuarios sólo deseen determinadas resoluciones o relaciones de compresión (por ejemplo, un investigador serio puede necesitar una imagen de alta resolución sin comprimir). Todas las imágenes ilustradas en esta figura comparten un conjunto base de metadatos que hacen referencia al objeto inicial de origen (la oveja), y adaptando la idea de Leazer de Familias Bibliográficas de finales del siglo XX, podemos decir que todas las imágenes de esta ilustración forman una “Familia de Imágenes” que comparte un conjunto común de metadatos. Cada instanciación de la imagen en la familia también hereda metadatos de sus padres, y el conocimiento de esa herencia puede ser a menudo crítico para alguien que vea una instanciación particular (por ejemplo, alguien que utilice una de las instancias de la esquina inferior derecha para estudiar las características de la lana debería ser capaz de averiguar que se hizo un procesamiento de imagen en un padre o abuelo de esta imagen [para eliminar la mosca], y que este procesamiento de imagen podría afectar a la mata de la lana). Por lo tanto, es necesario tenerlo en cuenta.
Todavía está por ver si el proyecto Shibboleth (middleware.in-ternet2.edu/shibboleth) será aceptable para los proveedores de recursos y, al mismo tiempo, proporcionará la privacidad y el anonimato que las bibliotecas han asegurado tradicionalmente a los usuarios. El éxito se hace más cuestionable a raíz de la destrucción de edificios en EE.UU. el 11 de septiembre de 2001, ya que el gobierno federal estadounidense ha aumentado la presión para eliminar el acceso anónimo a las bibliotecas.