▷ Sabiduría mensual que puede leer en pocos minutos. Añada nuestra revista gratuita a su bandeja de entrada.

Textos Electrónicos

▷ Regístrate Gratis a Nuestra Revista

Algunos beneficios de registrarse en nuestra revista:

  • El registro te permite consultar todos los contenidos y archivos de Lawi desde nuestra página web y aplicaciones móviles, incluyendo la app de Substack.
  • Registro (suscripción) gratis, en 1 solo paso.
  • Sin publicidad ni ad tracking. Y puedes cancelar cuando quieras.
  • Sin necesidad de recordar contraseñas: con un link ya podrás acceder a todos los contenidos.
  • Valoramos tu tiempo: Recibirás sólo 1 número de la revista al mes, con un resumen de lo último, para que no te pierdas nada importante
  • El contenido de este sitio es obra de 23 autores. Tu registro es una forma de sentirse valorados.

Textos Electrónicos

Este elemento es una expansión del contenido de los cursos y guías de Lawi. Ofrece hechos, comentarios y análisis sobre este tema.

✅ Ciencias Sociales y Humanas » Inicio de la Plataforma Digital » T » Textos Electrónicos

Textos electrónicos: Audiencias y propósitos

Historia

Desde principios del siglo XXI, incluso el académico más reacio tiene al menos una noción indefinida de la capacidad del ordenador para almacenar, manipular y analizar textos en lenguaje natural, mientras que sus colegas menos cautelosos probablemente se encuentren con una recepción comprensiva si se dirigen a su centro de computación local con propuestas de investigación literaria o lingüística – algunas universidades, de hecho, han creado institutos y departamentos cuya tarea especial es facilitar el trabajo de este tipo.

Las afirmaciones sobre la ubicuidad del texto electrónico, como ésta publicada en 1971, pueden parecer exageradas para una época anterior a los ordenadores personales, a los estándares de codificación de caracteres o de texto, y a la Web, y sin embargo han llegado a ser más o menos ciertas. Lo notable de éste y otros escritos sobre textos electrónicos en las humanidades publicados antes de 1995 es lo bien que predijeron los usos del texto electrónico, antes incluso de que mucha gente fuera consciente de que el texto podía ser electrónico. Es importante recordar la introducción de la Web a mediados de la década de 1990 al evaluar las declaraciones de los humanistas informáticos, ya que antes de la llegada de la Web, aunque se escribió mucho sobre los usos y el público del texto electrónico, casi nadie previó una herramienta tan poderosa para la amplia distribución de los textos electrónicos, o que la amplia distribución para un público lector general se convertiría en el uso más exitoso que se haría de los textos electrónicos.

Está bien documentado que la historia del texto electrónico es casi tan larga como la de la propia informática electrónica. Vannevar Bush imaginó, en 1945, vastas bibliotecas disponibles a través de la nueva tecnología. El padre Roberto Busa comenzó su esfuerzo pionero para crear el Index Thomisticus, el índice monumental de las obras de Santo Tomás de Aquino, en 1946. Otros pioneros adoptaron los ordenadores y defendieron su uso en la investigación literaria y lingüística, con los textos electrónicos como primer ingrediente necesario. El mismo estudio temprano citado anteriormente divide el mundo de la informática para las humanidades en varias categorías, como se muestra en su índice:

1 Lexicografía, archivos textuales y elaboración de concordancias

2 Edición textual y estudios de atribución

3 Estudios de vocabulario y aprendizaje de lenguas

4 Análisis estilístico y generación automática de poesía

Esta lista abarca todos los aspectos de la erudición en humanidades, desde el análisis literario y los estudios de atribución de autores, pasando por la edición académica, los estudios retóricos y lingüísticos, hasta la creación de archivos de textos electrónicos. Mientras que la generación automatizada de poesía aún no ha encontrado su público, las demás categorías parecen notablemente premonitorias. La informática de las humanidades incluye ahora medios en otros formatos, como las imágenes digitales, el audio y el vídeo, pero los primeros estudios consideraban el texto electrónico como punto de partida. De hecho, el texto electrónico se ha convertido en algo habitual en la investigación y la publicación en el ámbito de las humanidades. Muchos otros estudios tempranos desde fines de los años 70 describen con entusiasmo el potencial que tienen los ordenadores y el texto electrónico para los estudios literarios, y describen públicos similares.

Estos estudiosos desarrollaron una visión de la importancia de los textos electrónicos para las humanidades, y desarrollaron las normas por las que se crean.

Pormenores

Los humanistas, precisamente por su sofisticada comprensión del texto, tienen un papel central en el desarrollo de los estándares que impulsan la Web, con implicaciones de gran alcance para lo que se puede hacer hoy en día en Internet.

Sin embargo, el tipo de entorno descrito por Wisbey en 1971, con centros informáticos que simpatizaban con las preocupaciones de los humanistas, sólo existía en un puñado de universidades y centros de investigación en aquella época.Entre las Líneas En estos centros informáticos era más probable encontrar científicos y sociólogos que literatos o historiadores.

Más Información

Las universidades podían tener como mucho uno o dos profesores de humanidades interesados en los textos electrónicos, lo que dejaba a los humanistas informáticos en gran medida aislados, con conferencias anuales y revistas especializadas como únicas oportunidades para discutir temas, ideas y desarrollos con colegas de ideas afines.

El escepticismo sobre el uso de los textos electrónicos en la investigación en humanidades tiene también una larga historia, y no sólo entre los tradicionalistas. A pesar de los esfuerzos de los humanistas de la informática, el texto electrónico siguió siendo el dominio de unos pocos especialistas hasta principios de la década de 1990. El tratamiento informático de datos textuales en la investigación literaria e histórica se ha ampliado considerablemente desde los años sesenta.

Puntualización

Sin embargo, a pesar del crecimiento de estas aplicaciones, parece que la investigación textual informatizada no ha tenido una influencia significativa en la investigación de las disciplinas humanísticas hasta principios del siglo XXI y que la investigación literaria no ha estado sujeta al mismo cambio de perspectiva que acompañó a la investigación asistida por ordenador en las disciplinas orientadas a las ciencias sociales, como la historia, hasta entonces. A pesar de la inversión de importantes cantidades de dinero y tiempo en muchos proyectos, el papel del texto electrónico en la investigación literaria seguía siendo sorprendentemente limitado a principios de los años 90.

La literatura enumeró varias razones que apoyan esta afirmación. Lo más importante es que Olsen observa una desconfianza hacia la metodología informática entre los humanistas en general, y cree que la mayoría de las investigaciones que implican la informática se centran demasiado en uno o dos autores. Se describe el potencial de la utilización de ordenadores en grandes colecciones de literatura, y la capacidad de rastrear conceptos y palabras clave importantes a lo largo del tiempo, tanto dentro de las obras de varios autores como entre ellas, junto con tipos de análisis más sofisticados. Señala que al menos en algunas disciplinas, en la época anterior a la World Wide Web, se disponía de una masa crítica de textos primarios, señalando el Thesaurus Linguae Graecae (TLG) para los clásicos y el ARTFL para el francés moderno.

▷ En este Día de 19 Abril (1775): Comienzo de la Revolución Americana
Iniciada este día de 1775 con las batallas de Lexington y Concord, la revolución americana fue un esfuerzo de las 13 colonias británicas de Norteamérica (con ayuda de Francia, España y Holanda) por conseguir su independencia.
Puntualización

Sin embargo, concluye que el potencial se ignora en gran medida. Alison Finch, en 1995, mostró aún más escepticismo en su análisis de los humanistas informáticos, ya que exploró las narrativas heroicas invocadas por los investigadores literarios que utilizan ordenadores, mientras afirmaba que estos estudios carecían de importancia para el campo más amplio de los estudios literarios.

Otros comentaristas, menos conocedores de la tecnología, ven implicaciones más oscuras. Los más conocidos de estos críticos lamentan los cambios provocados por el desarrollo de los medios electrónicos, y temen que los libros, una vez desvinculados de su presencia física, pierdan su significado e importancia histórica.Entre las Líneas En los años 90 se temía en particular que la digitalización de los libros pueda conducir a la “erosión del lenguaje” y a un “aplanamiento de las perspectivas históricas”. No tiene en cuenta, tal literatura, otros posibles resultados, como el de que tanto los lectores generales como los estudiosos tengan un mejor conocimiento de las preocupaciones e ideas de los pueblos y periodos históricos con un mayor acceso a obras que de otro modo sólo estarían disponibles en unas pocas bibliotecas. El desarrollo de las colecciones digitales no requiere la destrucción de los libros; en cambio, puede provocar un mayor interés por su existencia y ofrecer diferentes oportunidades para su estudio mediante la búsqueda estructurada y por palabras clave.

Las críticas más matizadas reconocen las desventajas de la tecnología digital, al tiempo que exploran sus usos y potencialidades. Estamos de acuerdo con la propuesta de que el cambio de la cultura impresa a la digital tiene analogías en escala e importancia con el cambio de la cultura manuscrita a la impresa que comenzó en el Renacimiento.

Otros Elementos

Además, el cambio nos permite considerar de forma más llamativa que nunca las diversas características de las culturas manuscrita, impresa y electrónica. Esto es especialmente importante ahora que las nuevas tecnologías electrónicas hacen posible la producción, exhibición y transmisión de textos en múltiples formas que superan con creces la capacidad más fija de los libros de códice tradicionales.

La mayoría de estos estudios se escribieron antes de la popularización generalizada de internet. Como herramienta, la Web no resuelve todos los problemas que rodean la creación, el almacenamiento, la entrega y la visualización de los textos electrónicos, pero sin duda simplifica muchos de ellos, sobre todo en comparación con las tecnologías más antiguas utilizadas para el almacenamiento y la entrega de textos electrónicos, como ftp, listserv y Gopher. Los primeros adoptantes, entusiastas y críticos consideraban los textos electrónicos como el dominio de los eruditos e investigadores, y utilizaban los textos electrónicos para ayudar en el trabajo tradicional de los humanistas, como se indica en el índice reproducido anteriormente. No previeron la capacidad de la World Wide Web para llegar a un público lector más amplio.

¿Ha cambiado el mundo de los textos electrónicos con la ubicuidad de la World Wide Web, o siguen siendo acertadas estas críticas? Dicho de otro modo, ¿quién es el público de los textos electrónicos hoy en día? Cabe destacar estas categorías:

1 Programas de concordancia y recuperación de textos

2 Análisis literario

3 Análisis lingüístico

4 Estilometría y estudios de atribución

5 Crítica textual y ediciones electrónicas

6 Diccionarios y bases de datos léxicas

En conjunto, esta lista no difiere significativamente de las categorías de usos y usuarios de la literatura de mediados de los años 70. Es posible que la mayor parte del interés actual por los textos electrónicos se centra en el acceso, es decir, en el uso de los ordenadores para almacenar y entregar textos completos.Entre las Líneas En opinión de algunos autores, el acceso es el aspecto menos interesante de los textos electrónicos, ya que deja en gran medida sin explotar su verdadero poder: la capacidad de los textos de ser buscados y manipulados por programas informáticos.

¿Qué es un texto electrónico?

Para responder a esta sencilla pregunta se podría recurrir a la teoría textual y literaria y a su intersección con la tecnología digital, tal y como se comenta en otras partes de este volumen.Entre las Líneas En su lugar, quiero centrarme en consideraciones prácticas: ¿qué formas adoptan los textos electrónicos en las humanidades?

El primer tipo que hay que considerar es la transcripción electrónica de un texto literario, en la que los caracteres, la puntuación y las palabras se representan fielmente en un archivo informático, permitiendo la búsqueda por palabras clave o por contexto. Lo que se entiende por “representación fiel” de un libro impreso es el centro de un largo debate, que también se explora en otras partes de este volumen (véanse los capítulos 16, 17 y 22, para las cuestiones teóricas, y el capítulo 32 para las cuestiones más prácticas). La transcripción en forma de archivo de texto informático es la forma más compacta para el texto electrónico, una consideración importante dadas las graves limitaciones de almacenamiento informático y de ancho de banda que todavía existen para algunas personas.

Otros Elementos

Además, esta forma proporciona una mayor facilidad de manipulación, para la búsqueda, para la edición, y tiene ventajas significativas para las personas con deficiencias visuales. Otra forma básica es una imagen digital de una página física, que permite a los lectores ver una representación del aspecto original, de gran importancia para los estudiosos del texto. Antes parecía poco práctico, dada la cantidad de almacenamiento necesaria para los cientos de archivos de imágenes que se necesitan incluso para un libro.Entre las Líneas En la actualidad, con un almacenamiento cada vez mayor, incluso en los ordenadores de sobremesa, esto es mucho menos problemático (aunque el ancho de banda sigue siendo un problema). Algunas colecciones, como las disponibles en las bibliotecas digitales de la Biblioteca del Congreso, la Universidad de Virginia y la Universidad de Michigan, combinan las dos formas.

Otra categoría es el texto codificado. Por una multitud de razones, muchos académicos y editores creen que los esquemas de codificación, como el desarrollado por la Iniciativa de Codificación de Textos (TEI), proporcionan la mejor y más completa representación del texto en toda su complejidad, permitiendo al creador o editor la oportunidad de codificar las estructuras jerárquicas y la multitud de características que se encuentran en el texto.

▷ Lo último (2024)
Lo último publicado esta semana de abril de 2024:
Observación

Además de la creencia de que el marcado estructural explícito junto con los metadatos robustos permitirán una mayor longevidad de los textos electrónicos, los que eligen el TEI utilizan sus muchos elementos y características para el análisis sofisticado y la reutilización de los textos electrónicos para la publicación electrónica e impresa. Las personas que desarrollan el TEI han utilizado estándares abiertos como SGML y XML, además de proporcionar una amplia documentación para ayudar en el uso del estándar, como forma de fomentar y promover la preservación y el intercambio de textos electrónicos.

Otros, sobre todo los asociados al Proyecto Gutenberg, desconfían de todos los esquemas de codificación, pues creen que la falta de codificación permitirá que los textos electrónicos sobrevivan mejor a los cambios de hardware, sistemas operativos y software de aplicación. Los colaboradores del Proyecto Gutenberg no necesitan ningún programa informático especial ni apenas formación, y prevalece un espíritu de voluntariado. A finales de 2003 contarán con más de 10.000 títulos, pero poco se puede decir de la exactitud de las transcripciones, ya que no existe un control editorial central. La falta de codificación significa que sería imposible, por ejemplo, separar las notas del texto, o determinar rápidamente dónde empiezan y terminan los capítulos, o indicar el resaltado y los cambios de letra dentro del texto. Aun así, el fundador del Proyecto Gutenberg, Michael Hart, ha aprovechado el espíritu de voluntariado que impulsa la mayoría de los proyectos de código abierto.

Las normas de codificación y edición siguen siendo costosas, y cuanta más codificación se añada y más edición se realice, mayor será el nivel de conocimientos sobre el documento original y/o la tecnología de búsqueda y visualización. Proyectos como el de Mujeres Escritoras en Línea de la Universidad de Brown y la Asociación de Ediciones Modelo ofrecen una amplia documentación sobre las normas y prácticas editoriales. Otros proyectos enumerados en el sitio web del Consorcio TEI ofrecen ejemplos de documentación igualmente detallada y normas editoriales exigentes.

Algunos proyectos han evitado este coste adicional convirtiendo las imágenes de las páginas en texto mediante un software de reconocimiento óptico de caracteres (OCR) y permitiendo a los lectores realizar búsquedas por palabras clave en los archivos de texto sin editar ni codificar. Los resultados se muestran como imágenes digitales de la página original, con el texto sin corregir oculto. Aunque las imperfecciones impiden obtener resultados precisos y completos de las búsquedas por palabras clave, sus defensores creen que, con una precisión adecuada del OCR, los resultados seguirán siendo útiles, y con un coste global significativamente menor que el de las transcripciones muy precisas.

Varias personas han perseguido la idea de crear un archivo de obras que contenga manuscritos y ediciones variantes, destinado tanto a investigadores sofisticados como a lectores generales.Entre las Líneas En este tipo de publicación, los investigadores tendrían acceso a todas las versiones manuscritas, lo que les permitiría rastrear el desarrollo de una obra a través de sus variantes, mientras que el público general podría utilizar una lectura preferida creada por los editores y derivada directamente de las fuentes. Este tipo de archivo, propuesto para autores como Yeats, Hardy y otros, sería una bendición para ambos públicos, pero ha demostrado ser muy difícil. Aparte de algunas excepciones notables, como el Proyecto de Cuentos de Canterbury, esta idea rara vez se ha llevado a cabo, lo que indica el enorme compromiso y el difícil trabajo que requiere.

Una categoría muy diferente es el hipertexto. Las obras de este tipo suelen ser originales y no representaciones de obras ya publicadas. El hipertexto parece tener un gran potencial de expresión, ya que permite una multiplicidad de opciones narrativas y convierte al lector en participante activo de la experiencia de lectura. El contenido hipertextual suele estar ligado inextricablemente al software de hipertexto, lo que hace que las producciones en este formato sean aún más efímeras que otros tipos de texto electrónico. Algunos autores de hipertexto, como Michael Joyce y Stuart Mouthrop, reconocen la impermanencia inherente al género y la incorporan a sus hiperficciones, pero este aspecto fundamental de su naturaleza dificultará o imposibilitará que las bibliotecas recopilen hiperficciones a largo plazo. Con el tiempo, aunque el soporte en el que se almacena el hipertexto siga siendo viable, el software en el que se basa dejará de funcionar.

La creación del texto electrónico

Académicos, estudiantes, bibliotecarios, profesionales de la informática y aficionados en general crean y publican textos electrónicos.

Detalles

Las editoriales comerciales, sobre todo las que antes eran conocidas por publicar colecciones de microfilmes, están digitalizando y concediendo licencias de acceso a colecciones ambiciosas de decenas de miles de volúmenes. Algunos proyectos, como la colaboración de la Universidad de Virginia con Chadwyck-Healey para publicar Early American Fiction, y las asociaciones de creación de textos formadas para Early English Books Online y Evans Early American Imprints, son ejemplos de asociaciones entre bibliotecas y editores.

¿Cómo abordan los académicos y estudiantes de humanidades la creación de textos electrónicos? Uno de los ejes parte de un enfoque tradicional de las humanidades, dedicando tiempo y grandes esfuerzos a la creación de obras electrónicas bien estudiadas, documentadas y editadas, como el proyecto Women Writers Online de la Universidad de Brown, el archivo de los escritos de Henrik Ibsen patrocinado por la Biblioteca Nacional de Noruega y albergado por las universidades de Oslo y Bergen, y el archivo de los manuscritos de Sir Isaac Newton en el Imperial College de Londres, hasta esfuerzos menos rigurosos, que dependen de voluntarios y entusiastas, siendo los ejemplos más conocidos el Proyecto Gutenberg y Distributed Proofreaders. Esta diferencia de enfoques es un reflejo de los distintos planteamientos editoriales del siglo pasado, con la misma diferencia entre las ediciones académicas y las ediciones de lectura, cada una de ellas con objetivos y públicos diferentes. Para algunos estudiosos, este último tipo es suficiente para el uso en el aula o la consulta rápida, mientras que para otros, la amplia documentación y las normas editoriales de la primera son de suma importancia.

Basado en la experiencia de varios autores, mis opiniones y recomendaciones se expresarán a continuación:

Curiosamente, el escepticismo puede desempeñar un papel fundamental en ambas actitudes. Por un lado, los entusiastas del Proyecto Gutenberg, sobre todo el director del proyecto Michael Hart, expresan su escepticismo sobre el software y los conocimientos adicionales necesarios para crear y leer textos electrónicos codificados. Sus preocupaciones, forjadas por los dolorosos cambios de hardware y software que comenzaron en la era del mainframe, se basan en la creencia de que el mínimo común denominador de la codificación garantizará el mayor número de lectores y la longevidad de los textos. Otros, igualmente preocupados por la longevidad y las exigencias creadas por los cambios de hardware y software, creen que los sistemas de codificación basados en estándares internacionales como SGML, XML y Unicode permiten la mejor representación de estructuras textuales y sistemas de escritura complejos, y que estos formatos resultarán más útiles para los estudiosos y los lectores en general, además de ser los medios más prometedores para el archivo a largo plazo de estas obras. Cabe señalar que incluso algunos textos del Proyecto Gutenberg están disponibles en formatos de lectura HTML, PDF o Microsoft Ebook, presumiblemente por la funcionalidad añadida o los caracteres disponibles más allá del ASCII simple. Aun así, ambas partes miran a la otra con recelo.

Para crear un texto electrónico no se necesitan equipos de alto coste, sino que se puede conseguir con el más sencillo de los ordenadores y el software de procesamiento de textos. Los equipos de escaneo y los programas de OCR siguen bajando de precio.

Puntualización

Sin embargo, nuestras expectativas de precisión en los textos impresos son altas: generalmente nos decepciona encontrar algún error, y ciertamente nos decepciona si descubrimos un error cada 10 o 20 páginas. Una transcripción precisa requiere destreza y concentración, ya sea al teclear o al corregir, pero la tasa de precisión estándar aceptable utilizada por muchos grandes proyectos de textos electrónicos es del 99,995%, es decir, un error por cada 20.000 caracteres. Dado que una página media tiene entre 1.000 y 2.000 caracteres, esto supone un error cada 10 ó 20 páginas. Los correctores ortográficos, aunque son útiles para detectar algunas faltas de ortografía, no pueden detectar errores tipográficos o de reconocimiento óptico de caracteres (OCR) que dan lugar a palabras correctamente escritas, y tampoco son de gran ayuda con las faltas de ortografía dialectales o creativas que emplean los autores.

Otros Elementos

Además, los correctores ortográficos sólo existen para un número limitado de idiomas, por lo que no suelen ser útiles para el trabajo de corrección de textos electrónicos.

Indicaciones

En cambio, es habitual que los grandes proyectos subcontraten la creación de textos electrónicos a proveedores. Muchos de estos proveedores utilizan una técnica en la que dos o tres mecanógrafos trabajan en el mismo texto. El trabajo de los mecanógrafos se coteja y las discrepancias entre las versiones se utilizan para encontrar errores. Este método produce un alto índice de precisión, ya que la posibilidad de que dos o tres mecanógrafos cometan el mismo error en el mismo punto de un texto es estadísticamente baja.

Uso del texto electrónico

El uso de colecciones en línea, incluso de escritores relativamente oscuros, sigue siendo sorprendentemente alto. Como se ha señalado anteriormente, un grupo que la mayoría de los primeros humanistas informáticos han pasado por alto es el lector general, alguien dispuesto e interesado en leer algo en línea, lo cual es notable teniendo en cuenta las pantallas relativamente primitivas, las interfaces poco sofisticadas y las lentas conexiones disponibles. Estos lectores generales pueden tener muchas razones diferentes para utilizar los textos electrónicos: pueden carecer de acceso a las bibliotecas de investigación; pueden preferir encontrar y utilizar los libros en sus ordenadores, en sus casas u oficinas; pueden vivir en países sin acceso a buenas colecciones en lenguas extranjeras; los propios libros pueden ser bastante raros y estar disponibles físicamente sólo en un puñado de bibliotecas. Sea cual sea la motivación, estos lectores encuentran y utilizan textos electrónicos a través de la Web.

En los últimos veinte años se ha producido un gran cambio en los estudios literarios, ya que los estudiosos revalorizan a los escritores y las obras que las anteriores generaciones de críticos literarios habían pasado por alto. El reto inmediato para cualquier persona interesada en revalorizar un texto poco conocido será encontrar una copia, ya que puede estar disponible sólo en unas pocas bibliotecas. Las colecciones de textos electrónicos pueden ser muy valiosas para conservar las obras de los escritores menos conocidos o considerados menores.

A efectos de investigación, la base de datos resulta cada vez menos útil para los autores que se considerarían, según las medidas tradicionales, como los escritores más o menos importantes. Es más útil para los llamados escritores menores. Esta paradoja se produce por dos razones. Por un lado, las obras poéticas de los escritores “menores” suelen ser difíciles de conseguir, ya que sólo existen en ediciones antiguas, que suelen ser raras y pueden ser bastante caras. Al proporcionar textos electrónicos de esos libros difíciles de adquirir, algunas bases de datos proporcionan a los estudiosos importantes materiales primarios. Por otra parte, la política de alguna Base de Datos es -siempre que sea posible- imprimir a partir de las ediciones recopiladas de los autores, ya que dichas ediciones existen. Cuanto más conocido sea el autor, más probable será que haya ediciones recopiladas La Base de Datos habría hecho mucho mejor en imprimir las primeras ediciones de la mayoría de sus autores o, en todo caso, en tomar sus decisiones sobre las ediciones por motivos académicos y no económicos.Si, Pero: Pero no lo hizo.

Algunos investigadores sólo utilizan la Base de Datos en dos tipos de operaciones: como una amplia concordancia, y como una fuente inicial para textos que no tienen en su biblioteca.

Los obstáculos iniciales para la lectura de obras de escritores menos conocidos, quizá insuperables en el pasado, pueden superarse mucho más fácilmente en este nuevo medio. Hay que señalar que incluso un erudito tan adepto a lo digital como McGann prefiere las fuentes impresas a las versiones electrónicas (o al menos, todavía lo hacía en 1996). Utilizaba la colección en línea para descubrir e investigar, pero recurría a la copia impresa para verificar y citar.

Son muchos los problemas a los que se enfrenta un académico que desea utilizar textos electrónicos para investigar. El problema más inmediato es descubrir lo que está disponible. Tradicionalmente, el investigador consultaba el catálogo de la biblioteca para saber si un título o una edición en particular estaban disponibles en las estanterías. Dado el creciente número de colecciones en línea, es imposible conocer todas las fuentes relevantes para cualquier tema de investigación, e incluso los portales especializados como La Voz del Transbordador se han quedado atrás.Entre las Líneas En la actualidad, para la mayoría de los proyectos en línea, los investigadores deben recordar que un determinado sitio web tiene obras de Charles Dickens o Margaret Oliphant para encontrar ediciones electrónicas de estos autores, ya que no se pueden encontrar ni en los catálogos en línea ni utilizando herramientas de búsqueda como Google. Las bibliotecas también podrían tener registros de textos electrónicos en sus catálogos en línea y enlazar directamente con las ediciones electrónicas.

Puntualización

Sin embargo, pocas bibliotecas han incluido registros para todos los títulos disponibles en, por ejemplo, la base de datos de poesía inglesa de Chadwyck-Healey, aunque hayan adquirido la base de datos de texto completo para sus comunidades. Esta situación se agrava en el caso de los textos de libre acceso, ya que el trabajo de descubrir y evaluar los textos electrónicos, y luego crear y mantener los enlaces con ellos, es abrumador.

Existe un gran interés por mejorar esta situación. Las bibliotecas están empezando a incluir registros de textos electrónicos en sus catálogos en línea. Otros avances, como la Iniciativa de Archivos Abiertos, podrían permitir descubrir la existencia de textos electrónicos mucho más fácilmente que en la actualidad. Se están desarrollando métodos de búsqueda en colecciones almacenadas y mantenidas en diferentes instituciones, lo que significa que alguien interesado en la historia americana del siglo XIX podría realizar una búsqueda que se transmitiría a los numerosos sitios con colecciones de este periodo, con resultados recogidos y presentados en una única interfaz.

Otro problema es la división artificial que existe entre las colecciones disponibles en editoriales comerciales y las creadas localmente. Por lo general, estas dos categorías de materiales utilizan interfaces y sistemas de búsqueda diferentes. Esta distinción es completamente irrelevante para los investigadores y estudiantes, pero los sistemas e interfaces que permiten buscar en ambas categorías de materiales de forma simultánea y sin problemas, aunque están disponibles, son todavía escasos, debido a las complejidades de la autenticación y la autorización.

También existe otro tipo de división. Con el creciente número de colecciones disponibles en las editoriales comerciales, la brecha entre los que tienen y los que no tienen en este ámbito es cada vez mayor.Entre las Líneas En una reciente conferencia sobre la literatura norteamericana del siglo XIX, se observó que los estudiantes de posgrado de las universidades de investigación tenían acceso a una amplia gama de colecciones de textos electrónicos publicados comercialmente, mientras que muchos de sus colegas, recién graduados con primeros trabajos en instituciones más pequeñas, no lo tenían. Es posible que estos académicos no titulares ya no necesiten viajar a las instituciones para ver los documentos originales, pero seguirán necesitando apoyo para viajar a las instituciones que tienen acceso a las colecciones autorizadas de textos electrónicos.

Puntualización

Sin embargo, hay esperanza para estos académicos, ya que las bibliotecas y los museos digitalizan una mayor parte de sus colecciones y las ponen a disposición del público.

Un problema mucho más complejo es la limitada gama de textos electrónicos disponibles. A cualquier investigador o lector dispuesto a utilizar textos electrónicos le espera una loca colcha de retazos y, como señala McGann, puede que no se piense mucho en la selección de las ediciones adecuadas. La situación se asemeja a una carrera de fondo, ya que editores, bibliotecas y particulares tratan de publicar colecciones importantes. El número de textos disponibles de forma gratuita, desde proyectos como Making of America, pasando por el proyecto Wright American Fiction, hasta el Centro de Textos Electrónicos de la Universidad de Virginia, o el American Memory de la Biblioteca del Congreso, está creciendo a un ritmo fenomenal.

La Base de Datos de Poesía Inglesa, publicada por primera vez en 1992 y uno de los primeros esfuerzos, utilizó la Nueva Bibliografía de Cambridge de la Literatura Inglesa, publicada por primera vez en 1966 basada en una edición anterior de la década de 1940, como base para su inclusión. Las colecciones mencionadas se basan en bibliografías iniciadas en la década de 1930. Las colecciones de literatura antigua, como la Early English Books Online, pueden afirmar que cubren de forma exhaustiva todas las publicaciones conocidas de Gran Bretaña antes de 1700, pero como estas colecciones en línea incluyen publicaciones más cercanas a la actualidad, son menos inclusivas, dado el crecimiento exponencial de las publicaciones. Por ello, las grandes colecciones como la English Poetry Database tienen que emplear criterios de selección. Los críticos han debatido estas colecciones tradicionales, conocidas informalmente como el “canon”, y han defendido una inclusión más amplia de mujeres o autores de géneros populares. Estas colecciones electrónicas, aunque muy amplias e inclusivas, reflejan los valores y criterios de selección de hace cincuenta años o más.

Algunas bibliotecas están desarrollando sus propias colecciones digitales, y no es una coincidencia. Se podría ver ver en los estudios literarios dos movimientos: una vuelta al “centro bibliográfico” y una “vuelta a la historia”. Los imperativos que impulsan a las bibliotecas y los museos hacia una mayor informatización no son los mismos que los que han propiciado la ya conocida “vuelta a la historia” en los estudios literarios y de humanidades.

Puntualización

Sin embargo, se ha producido una convergencia entre ambos, y ahora los dos movimientos -la informatización de los archivos y la re-historización de la erudición- se estimulan mutuamente hacia nuevas empresas.

Incluso con este fenomenal crecimiento, uno se da cuenta inmediatamente de lo inadecuado que resulta utilizar estos fondos para una investigación exhaustiva.

Detalles

Los académicos todavía no pueden asumir que sus campos tienen una colección adecuada de textos electrónicos disponibles, ni pueden asumir que esas colecciones que existen reflejarán el pensamiento actual sobre la inclusión. McGann afirmó en 1996, algo que sigue siendo cierto, que “la Red no ha acumulado los cuerpos de contenido que necesitamos si queremos hacer nuestro trabajo” (p. 382). El tamaño de la colección de una biblioteca de investigación se cifra en millones de volúmenes. El tamaño de las colecciones colectivas de textos electrónicos disponibles tanto en editoriales comerciales como en sitios web de libre acceso probablemente supere los 200.000, pero no por mucho.

Detalles

Los académicos, los estudiantes y los bibliotecarios están aprendiendo que las colecciones tendrán que crecer considerablemente para poder satisfacer de forma fiable las necesidades de una amplia gama de humanistas.

Estas colecciones y ediciones fueron elegidas en gran parte porque son de dominio público y están libres de restricciones de derechos de autor. Los editores comerciales mencionados anteriormente comenzaron como editores de microfilmes, y sus colecciones de microfilmes se formaron siguiendo el mismo principio.

Informaciones

Los derechos de autor son la fuerza oculta detrás de la mayoría de las colecciones de textos electrónicos. Muy pocas colecciones de textos electrónicos, incluso las de los editores comerciales, contienen publicaciones sujetas a derechos de autor. Esto tiene dos efectos principales en las colecciones electrónicas.Entre las Líneas En primer lugar, significa que la mayoría de las colecciones digitales están formadas por autores que vivieron y publicaron hasta el siglo XX; las obras de los escritores posteriores a esa época pueden estar aún bajo derechos de autor y, por tanto, ser más difíciles y quizás costosas de copiar y reeditar.Entre las Líneas En segundo lugar, generalmente se excluyen las nuevas ediciones de estos escritores anteriores al siglo XX, y los proyectos y editores seleccionan las que son de dominio público.

▷ Noticias internacionales de hoy (abril, 2024) por nuestros amigos de la vanguardia:
Detalles

Por último, las obras contemporáneas de crítica literaria, biografía y teoría, que podrían aportar el contexto y la interpretación necesarios a la literatura primaria, también quedan excluidas en gran medida. Todavía no se han aprovechado las posibilidades inherentes al medio para proporcionar un contexto rico para el estudio de los textos literarios primarios y los documentos históricos.

El efecto de los derechos de autor hace que los investigadores y estudiantes interesados en la escritura del siglo XX y contemporánea no puedan utilizar los textos electrónicos. Una rápida comprobación de la Bibliografía MLA en línea muestra que el número de artículos publicados después de 1962 que tratan de autores del siglo XX es casi el doble que el de todos los demás siglos combinados, que abarcan del 1200 al 1900. Dado que la mayoría de los investigadores y estudiantes se interesan por los escritores y su obra después de 1900, no es de extrañar que consideren que el texto electrónico es en gran medida irrelevante para sus estudios.

Además, faltan muchos de los indicadores tradicionalmente utilizados por los estudiosos para determinar el mérito de cualquier texto electrónico. Puede que no haya un editor reconocible, ni un redactor, ni un prefacio o una declaración de principios editoriales, lo que puede hacer que los estudiosos rehúyan. Se les deja a su aire para que juzguen el valor de muchos recursos. Por otra parte, en este terreno desconocido, puede haber una tendencia a confiar en la tecnología en ausencia de tales marcadores. Las colecciones de textos electrónicos no reciben reseñas con tanta frecuencia como las que se publican comercialmente, quizás por algunas de estas mismas razones, aunque es posible que reciban más uso. Incluso en esas reseñas, se observa una confianza acrítica por parte de los revisores. Por ejemplo, en la página web del Victorian Women Writers Project (VWWP) se afirma que “se dedica a transcribir con gran precisión” los textos. Me divierte y me alarma ver esa frase citada textualmente en reseñas y sitios web que enlazan con el VWWP sin ninguna prueba de su exactitud.

Detalles

Los académicos que utilizan estas colecciones suelen apreciar el esfuerzo que supone la creación de estos recursos en línea y son reacios a criticarlos, pero uno intuye que estos recursos no lograrán una mayor aceptación hasta que no sean revisados de forma más rigurosa y sistemática.

Es difícil encontrar artículos académicos que citen colecciones de textos electrónicos como fuentes, o que discutan la metodología de creación o uso de textos electrónicos, fuera de las revistas para humanistas informáticos.

Pormenores

Los humanistas han tardado en aceptar los textos electrónicos para la investigación seria, por las razones explicadas anteriormente, en particular su disponibilidad dispersa, y la inadecuada documentación de las fuentes y las prácticas editoriales utilizadas en su creación.

La “vasta concordancia”, con la capacidad de buscar en miles de obras, conduce a obras tanto conocidas como desconocidas que contienen el término.Entre las Líneas En cualquier caso, es raro encontrarlos citados en artículos o libros académicos, por lo que su uso e importancia pasan desapercibidos y no se comprueban.

Detalles

Los académicos necesitan escuchar más a sus compañeros sobre el uso de estos recursos en sus investigaciones.

Los textos electrónicos también ocupan un lugar importante en la enseñanza en el aula. Julia Flanders señala una encuesta realizada por Women Writers Online en la que la mayoría de los profesores respondieron que era más probable que utilizaran herramientas electrónicas en su enseñanza que en su investigación. Se aplicarían los mismos problemas descritos anteriormente, pero ella postula que para los estudiantes, el desconocimiento es una oportunidad más que un obstáculo, ya que les da la oportunidad de interactuar directamente con los textos independientemente de la información contextual y la interpretación previa. La forma de interacción que ofrecen los textos electrónicos, con la oportunidad de explorar rápidamente las palabras y los términos de un gran conjunto de obras, es muy diferente a la que ofrecen los textos impresos. Este enfoque de los estudios literarios, estrechamente relacionado con la filología tradicional desarrollada en el siglo XIX, es más común en los estudios clásicos, y puede explicar el éxito de la adopción de los ordenadores y los recursos digitales entre los clasicistas y medievalistas en comparación con los que estudian y enseñan períodos posteriores.

Una suposición que subyace a gran parte de las críticas de Olsen y Finch señaladas anteriormente es que el ordenador ayudará de algún modo a la crítica literaria. Desde el padre Busa hasta la creación de la Web, el análisis asistido por ordenador era todo el objetivo de los textos electrónicos, ya que no había una forma sencilla de compartir las obras. Los libros más recientes se han centrado en los métodos necesarios para crear y publicar textos electrónicos, dejando de lado cualquier debate sobre su uso eventual.

Sin embargo, Hockey y otros autores señalan las deficiencias de las herramientas disponibles como otra limitación para una mayor aceptación de los textos electrónicos por parte de los académicos. Los primeros textos electrónicos, como la colección de textos WordCruncher, se publicaron en CD-ROM junto con herramientas para su uso. Si bien este tipo de paquetes conlleva multitud de problemas, ciertamente facilitaba la entrada al uso. Hoy en día, muchas colecciones de textos electrónicos contienen herramientas para la navegación sencilla y la búsqueda por palabras clave, pero poco más. Se necesitan herramientas complejas, pero estas herramientas también deben ser fáciles de usar para el principiante, lo que explica en parte por qué existen pocas. Al igual que muchos investigadores, he encontrado el ordenador como una herramienta fascinante y frustrante a la vez. Esta fascinación y frustración, al menos en mi caso, parece provenir de una fuente común: deberíamos ser capaces de hacer mucho más con el ordenador en nuestra investigación sobre textos literarios de lo que realmente hacemos.

En cierto sentido, aunque la Web ha impulsado el desarrollo y la distribución de textos electrónicos en cantidades impensables antes de ella, las herramientas disponibles para utilizar estos textos son de menor funcionalidad que las disponibles a través de los medios de publicación anteriores, como los CD-ROM. Esto se debe quizás a la falta de consenso sobre los usos de los textos electrónicos, así como a la dificultad de crear herramientas de análisis de textos generalizadas para su uso en una amplia gama de colecciones. La aceptación de análisis automatizados más sofisticados seguirá siendo limitada hasta que se disponga de herramientas más sofisticadas. Hasta entonces, las actividades más habituales serán las búsquedas de palabras clave bastante sencillas y la recuperación y el descubrimiento de textos. Estos tipos de investigación pueden ser potentes e importantes para muchos estudiosos, pero no empiezan a aprovechar el potencial de la informática para las humanidades.

Aun así, y a pesar de sus deficiencias, estas colecciones están encontrando público. Hay indicio de que los académicos no son el único público del texto electrónico. Al final, el lector general, los estudiantes y los profesores de primaria y secundaria, sobre todo los de los países en desarrollo que no tienen acceso a buenas bibliotecas, pueden ser el público más amplio y ávido de estas obras.

Los textos electrónicos permiten a los humanistas acceder a obras que antes eran difíciles de encontrar, tanto en lo que se refiere a la localización de obras completas, con Internet como biblioteca interconectada distribuida, como en el acceso a los términos y palabras clave dentro de las propias obras, como primer paso del análisis. A medida que crezcan las colecciones fiables y precisas, y que los humanistas lleguen a comprender su alcance y sus limitaciones, el uso de los textos electrónicos será reconocido como un primer paso estándar en la investigación de las humanidades. A medida que las herramientas para el uso de los textos electrónicos mejoren, los humanistas integrarán los textos electrónicos de forma más profunda y amplia en sus pasos de investigación posteriores. Hasta entonces, los textos electrónicos seguirán siendo una biblioteca con gran potencial.

Datos verificados por: Brooks

Recursos

[rtbs name=”informes-jurídicos-y-sectoriales”][rtbs name=”quieres-escribir-tu-libro”]

Véase También

Comunicación, Derecho de Tecnología de la Información, Educación y Comunicación, Informática, Informática aplicada, Informática y tratamiento de datos, Publicidad, Sistema de comunicación, Tecnología, Telecomunicación

Bibliografía

▷ Esperamos que haya sido de utilidad. Si conoce a alguien que pueda estar interesado en este tema, por favor comparta con él/ella este contenido. Es la mejor forma de ayudar al Proyecto Lawi.

0 comentarios en «Textos Electrónicos»

  1. El Centro de Textos Electrónicos de la Universidad de Virginia informa de que sus colecciones reciben millones de usos cada año. Making of America, de la Universidad de Michigan, señala un uso similar. El Victorian Women Writers Project (VWWP), que contiene unas 200 obras de escritoras británicas del siglo XIX menos conocidas, recibe más de 500.000 usos al año. Las obras más populares de la colección del VWWP incluyen libros como el estudio English Laws for Women de Caroline Norton, los relatos góticos Hauntings de Vernon Lee y los escritos de viajes de Isabella Bird. Estas escritoras son más conocidas que la mayoría de las demás de la colección. No obstante, la obra más utilizada de la colección es Tulipanes encantados y otros versos para niños, de Maud y Eliza Keary, que recibe miles de usos al mes.

    Responder
  2. Mientras que los primeros críticos, como Robert Coover, creían (con cierta esperanza) que el hipertexto conduciría al “fin de los libros”, otros, como Tim Parks, desestiman el género por considerarlo una “exageración”.

    Responder
  3. Algunas colecciones de textos electrónicos extremadamente grandes, con decenas de miles de volúmenes y millones de páginas, como las colecciones Making of America y American Memory, se basan en esta idea, de la que fue pionero John P. Wilkin, denominada “rough OCR” u “dirty OCR”.

    Responder
  4. En un artículo tomado de una importante revista académica casi al azar (Knowles 2001), el autor investiga el uso de la palabra “patriota” a lo largo del siglo XVII. Cita autores conocidos como Milton, Dryden, Bacon, Jonson, Sir Winston Churchill, así como autores menos conocidos. Las colecciones de textos electrónicos como la English Poetry Database de Chadwyck-Healey o la Early English Books Online de ProQuest serían perfectamente adecuadas para este propósito.

    Responder
  5. Los editores comerciales están digitalizando grandes colecciones de microfilmes, como Pollard y Redgrave, y Wing (Early English Books, publicado por Bell y Howell/UMI), y Evans (Early American Imprints, por Readex), y Primary Source Media ha anunciado recientemente su intención de digitalizar la enorme colección Eighteenth Century.

    Responder

Foro de la Comunidad: ¿Estás satisfecho con tu experiencia? Por favor, sugiere ideas para ampliar o mejorar el contenido, o cómo ha sido tu experiencia:

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Descubre más desde Plataforma de Derecho y Ciencias Sociales

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo