Historia de la Lexicografía
Este elemento es una expansión del contenido de los cursos y guías de Lawi. Ofrece hechos, comentarios y análisis sobre este tema. [aioseo_breadcrumbs]
Diccionarios y la Historia de la Lexicografía
Naturaleza del texto del diccionario
Un diccionario tiene fundamentalmente la misma estructura que una guía telefónica, los archivos médicos de un hospital o de un médico generalista, o el catálogo de una biblioteca. Cada unidad de estas colecciones es un registro que contiene una serie de campos, potencialmente iguales para cada registro (algunos campos están en blanco) y colocados en el mismo orden, siendo la característica esencial de esta base de datos relacional su recursividad.
– registro de la guía telefónica: nombre, dirección, número de teléfono
– ficha médica: nombre, datos personales, historial médico, notas de evolución, consultas, informes de laboratorio, etc.
– registro del catálogo de la biblioteca: título, autor, lugar y fecha de publicación, materia, número de ISBN, existencias, etc.
– entrada de diccionario: palabra clave, pronunciación, parte de la oración, definición, ejemplos, etimología, etc.
Ejemplo de dos entradas de diccionario (fuente: Dictionnaire universel francophone):
dictionnaire n. m. Obra que recoge y describe, en cierto orden, un conjunto particular de elementos del léxico (sentido 4). Dictionnaire médical, étymologique. – Dictionnaire de la langue ou dictionnaire de langue, qui décrit le sens, les valeurs, les emplois, etc. des mots d’une langue. El diccionario de la Academia Francesa. – El diccionario bilingüe, que ofrece los equivalentes de las palabras y expresiones de un idioma en otro idioma. Un diccionario francés – vietnamita. – Diccionario enciclopédico que, además de las descripciones de las palabras, ofrece desarrollos enciclopédicos relacionados con los objetos designados por las palabras. Sin (se puede repasar algunas de estas cuestiones en la presente plataforma online de ciencias sociales y humanidades). Fam. dico.
informatique n. f. y adj. Técnica de tratamiento automático de la información mediante calculadores y ordenadores. Informática de gestión. adj. Relativo a esta técnica. Tratamiento por medios informáticos.
Encycl. La informática apareció con el desarrollo de los calculadores electrónicos de gran capacidad, los ordenadores (el término informática data de 1962). La rapidez de acceso y tratamiento de la información, la automatización del funcionamiento de los ordenadores y la sistemática de las resoluciones han abierto un amplio campo de aplicaciones para la informática: la investigación científica (por ejemplo, el control de la trayectoria de los vehículos). (p. ej., control de la trayectoria de un satélite); industria (concepción asistida por ordenador, control y mando de máquinas, procesos); gestión de empresas (operaciones administrativas, simulación, investigación operativa); enseñanza programada; documentación, bancos de información; informática individual. La conexión de varios ordenadores aumenta la capacidad de su tratamiento, la telemática asegura la transmisión (V. telemática, ordenador, red).
La recursividad de los campos informativos de las dos entradas del diccionario anteriores se indica mediante la tipografía, la posición y la abreviatura: (1) palabra principal en negrita; (2) parte de la oración abreviada convencionalmente; (3) definición; (4) ejemplos de uso en cursiva. Los campos 1, 3 y 4 se dan completos debido a la naturaleza idiosincrásica de las unidades léxicas; el campo 2 se da de forma abreviada porque sus valores pertenecen a una pequeña clase finita. La tipografía, la posición, la abreviatura y la elipsis (ninguno de los cuatro campos se nombra explícitamente) son las características de recursividad y economía del diccionario (el diccionario es también un producto comercial). Los campos ocasionales tienden a ser nombrados: “Syn.” para los sinónimos; “Encycl.” para la información enciclopédica (la información normal, sistemática y sin etiqueta es lingüística); “V.” para las referencias cruzadas a términos relacionados.
Incluso las entradas de diccionario más sencillas, como las citadas anteriormente, suelen ser estructuralmente complejas.
Observación
Además de las principales ecuaciones binarias – (a) dictionnaire = sustantivo masculino; (b) dictionnaire [significa] “Ouvrage qui recense et décrit, dans un certain ordre, un ensemble particulier d’éléments du lexique”; (c) [la palabra] dictionnaire [suele aparecer en expresiones como] Dictionnaire médical (dominio de la experiencia), [dictionnaire] étymologique (dominio de la lengua) – también las hay ternarias: dictionnaire > [ejemplificado en] Dictionnaire bilingue > [que significa] “[dictionnaire] qui donne les équivalents des mots et expressions d’une langue dans une autre langue. ” (Las cópulas implícitas y otros términos se explicitan aquí y se encierran entre corchetes).
La idiosincrasia es característica del léxico y también del diccionario, que en la gran mayoría de sus realizaciones está compuesto por seres humanos (falibles). Al igual que el tratamiento de las unidades léxicas variará enormemente según la parte de la oración, la frecuencia de uso, la monosemia o polisemia, el registro y otras variables, la redacción del diccionario tenderá a variar según el momento (principio, mitad o final del alfabeto, o de la redacción del diccionario, incluso el día de la semana) y el escritor (el escritor de entradas A y el escritor de entradas B son seres humanos individuales y no clones o máquinas).
Dejando de lado la cuestión de la idiosincrasia y la variabilidad de las unidades léxicas y de la escritura del diccionario (esta última, sin embargo, es un obstáculo importante para la informatización del Trésor de la langue française – véase más adelante), el diccionario bien ordenado requiere tres tipos de competencia sofisticada por parte del usuario: (1) la competencia lingüística, obviamente; (2) la competencia de diccionario, un tipo particular de competencia textual, que permite, por ejemplo, encontrar una palabra que empieza por m abriendo el diccionario más o menos por la mitad, saber que adj. significa adjetivo/adjetivo (y mediante la competencia lingüística saber qué es un adjetivo), etc.; (3) la competencia pragmática para dar sentido a las referencias al mundo exterior: Le dictionnaire de l’Académie française, “calculateurs électroniques”, etc.
La exigencia de diferentes tipos de competencia del usuario, combinada con el uso frecuente de elipsis, puede dar lugar a casos de ambigüedad que ponen a prueba las facultades analíticas del lector del diccionario y dejan sin poder al analizador del ordenador. El usuario del diccionario también tiene que lidiar con la variabilidad de los delimitadores e indicadores de sinonimia (paréntesis, corchetes, signo de igualdad, etiqueta de sinónimo, mayúsculas).
En resumen, el diccionario, en teoría una base de datos relacional sistemática, con registros ordenados y campos recurrentes, puede ser en la práctica humana tan variable como el léxico que se propone describir.
Pormenores
Las aplicaciones exitosas del ordenador a los diccionarios creados por el hombre suelen ser, pues, modestas en sus ambiciones.
Informaciones
Los diccionarios informatizados (diccionarios automáticos) tienden a ser procrastinados en su tratamiento de la lengua, o se limitan a áreas relativamente simples del léxico, como la terminología.
Pre-Internet
La lexicografía moderna no esperó a la invención del ordenador, ni siquiera a la de las máquinas de calcular del siglo XVII de Leibniz y Pascal, para aplicar los métodos informáticos a los diccionarios.Entre las Líneas En 1539, el padre de la lexicografía moderna, Robert Estienne, impresor del rey, librero, humanista y lexicógrafo, publicó su Dictionaire francois-latin (1539), una “copia en espejo” de su Dictionarium latinogallicum del año anterior. Cada palabra y expresión francesa contenida en las glosas y equivalentes del diccionario latino-francés tenía su propia palabra o sub-palabra en el franco-latino; cada palabra o expresión latina contenida en las palabras y ejemplos del latín-francés aparecía como un equivalente del francés correspondiente en el franco-latino.
Avanzando cuatro siglos y varias décadas, encontramos las primeras aplicaciones del ordenador a la lexicografía en los años 60 y 70.Entre las Líneas En los años 60, el Centre pour un Trésor de la langue française de Nancy empezó a teclear obras literarias y tratados técnicos representativos para obtener material de partida para su diccionario impreso, el Dictionnaire de la langue du XIXe et du XXe siècle, comúnmente conocido como el Trésor de la langue française, o TLF. A finales de la década de 1970, aparecieron en Inglaterra dos diccionarios de lectura mecánica, el Oxford Advanced Learners’ Dictionary y el Longman Dictionary of Contemporary English; este último utilizaba el ordenador no sólo para imprimir el diccionario en papel, sino también para ayudar en su redacción (Meijs 1992: 143-5).
El primer diccionario que se informatizó fue el Thresor de la langue françoyse de Jean Nicot, de 1606. El texto se tecleó en Nancy y Toronto entre 1979 y 1984, se indexó en la Universidad de Toronto con el programa de concordancia de mainframe COGS, se publicó en forma de microficha de concordancia en 1985, se indexó como base de datos interactiva independiente con WordCruncher en 1988 y se puso en la World Wide Web en 1994 (véanse las secciones sobre la era de la WWW y sobre el cambio tecnológico, más adelante). No deja de ser interesante observar que a principios de los años 80 los organismos de financiación (o financiamiento) esperaban que los proyectos de concordancia emprendieran la lematización de las formas textuales. Había que argumentar para demostrar lo absurdo de intentar lematizar un texto ya parcialmente lematizado: las palabras de cabecera del diccionario son lemas. El proyecto Nicot tenía inicialmente la ambición de etiquetar campos de información (Wooldridge 1982), hasta que rápidamente se hizo evidente que tales campos, aunque presentes y analizables por el cerebro humano, son imposibles de delimitar sistemáticamente en un diccionario primitivo complejo como el Thresor de Nicot, donde la posición, la tipografía y la abreviatura son variables, y la polivalencia funcional es común. El reto no es despreciable en los diccionarios modernos, donde el etiquetado explícito de los campos es la norma. Otros diccionarios antiguos han sido reconvertidos digitalmente, en particular el Dictionary of the English Language de Samuel Johnson, publicado en CD-ROM en 1996.
En la década de 1980 surgieron empresas de lexicografía asistida por ordenador a gran escala. El proyecto COBUILD (Collins and Birmingham University International Language Database) comenzó en 1980, con la intención de crear un corpus de inglés contemporáneo para la redacción de un diccionario y una gramática totalmente nuevos. La joven disciplina de la lingüística de corpus y el proyecto COBUILD se alimentaron mutuamente en este innovador entorno lexicográfico (Sinclair 1987; Renouf 1994). El Proyecto del Nuevo Diccionario Inglés de Oxford se formó para producir la segunda edición del DEO con la ayuda de la tecnología informática. El proyecto tuvo un alcance internacional: se concibió y dirigió en Inglaterra, el papel del ordenador se definió e implementó en Canadá y el texto se tecleó en los Estados Unidos de América. La segunda edición apareció en papel en 1989 y en CD-ROM en 1992.
Mientras que el primer etiquetado electrónico de los diccionarios se limitaba a los códigos tipográficos para la impresión del producto final, pronto se hizo necesario añadir etiquetas de información para que no sólo se pudiera visualizar correctamente el texto en pantalla o en papel, sino que también se pudiera buscar y referenciar por campos. El diccionario fue sólo uno de los tipos de texto cuya estructura fue analizada por la Iniciativa de Codificación de Textos (TEI) (Ide et al. 1992).
La última década del siglo XX fue testigo de la proliferación de diccionarios electrónicos distribuidos en CD-ROM. Por ejemplo, la edición de 1993 del Random House Unabridged Dictionary venía tanto en versión impresa como en CD-ROM, vendiéndose los dos juntos por el precio de uno. Como cabría esperar de un regalo, la funcionalidad del CD-ROM de Random House es rudimentaria.
Indicaciones
En cambio, la versión en CD-ROM del Petit Robert, publicada en 1996, ofrece muchas ventajas sobre la edición impresa: además de la búsqueda básica de palabras y sus entradas, el usuario puede buscar anagramas (el término de búsqueda dome produce dome y mode), homófonos (saint produce sain, saint, sein, seing), etimologías por lengua (familias: africanas, amerindias, árabes, etc., o modismos específicos: Bantú, hotentote, somalí, etc.), citas por autor, obra o personaje, además de búsquedas en el texto completo del diccionario (entradas completas) o en los campos particulares de ejemplos de uso o sinónimos y antónimos.
A menudo, el acceso al texto completo que permite la versión electrónica de un diccionario hace más completa una serie de entradas. Por ejemplo, para tomar el caso del Petit Robert, el sabotaje, aplicado al trabajo, a las organizaciones o a la maquinaria, en la entrada de la palabra, se utiliza en un sentido figurado importante -y común- en una cita relativa al orador. “Sabotage de la prononciation de notre belle langue par les speakers de la radio”.
Informaciones
Los diccionarios suelen ser más conservadores en el tratamiento de una palabra en su propia entrada que en otras.
Hay que mencionar brevemente las herramientas lexicográficas asistidas por ordenador para el usuario cotidiano, siendo las principales los correctores ortográficos de los procesadores de texto y los tesauros.
La lexicografía en la era de Internet
Como muchas otras prácticas humanas, la lexicografía -y en particular la lexicografía- se ha transformado con la Web. La Web funciona en virtud de las palabras; la Web, como el diccionario, es una “red de palabras”. Se leen las palabras en un libro, se buscan las palabras clave en un diccionario, se navega por la Web mediante palabras clave. Los millones de documentos publicados en la Web constituyen, mediante la estructuración de las palabras clave de los buscadores, un vasto diccionario, un diccionario enciclopédico de conceptos y palabras.
Informaciones
Los diccionarios convencionales, ya sean de papel o electrónicos, palidecen en comparación, aunque muchos de estos últimos quedan atrapados en la red de palabras online.
Una de las primeras demostraciones de la web como superdiccionario o metadiccionario se encuentra en Wooldridge et al. (1999). Una búsqueda en la web de la palabra francesa canadiense enfirouaper (término de búsqueda: enfirou*) recogió apariciones del verbo y sus derivados, tanto usados como comentados; los documentos eran de todo tipo: políticos y personales, informes periodísticos y manifiestos, poesía y prosa, diálogos y diccionarios. Las ocurrencias de la palabra en uso mostraron que el tratamiento en diccionarios y glosarios es estrecho y anticuado (véase sabotaje más arriba). Aplicando los principios de creación y análisis de corpus aprendidos en el proyecto COBUILD, el proyecto WebCorp de la Universidad de Liverpool utiliza motores de búsqueda web estándar como Google y AltaVista para recopilar resultados de la web y formatearlos en concordancias KWIC fácilmente analizables. Por ejemplo, expresiones como a un ave le falta un rosario, a dos puerros le falta una cena de cosecha o a dos sábanas le falta un rollo de pantano, encontradas en las novelas de Reginald Hill, son realizaciones individuales del patrón comúnmente utilizado “uno/dos/tres/un/varios X le faltan a un Y” (siendo X partes constituyentes del conjunto Y), que puede expresarse en Google o AltaVista mediante variantes del término de búsqueda “uno * le falta a”. Dado que WebCorp está, al menos en el momento de escribir este artículo, disponible gratuitamente en la red, los corpus lingüísticos se han convertido en una herramienta lexicográfica para el público en general.
Los metasitios son una buena fuente de información sobre los diccionarios en línea. Para el francés, dos buenos son Leximagne – l’Empereur des pages dico de Robert Peckham y ClicNet de Carole Netter: Dictionnaires. Este último ofrece enlaces para las siguientes categorías (traduzco): Diccionarios multilingües; Diccionarios y enciclopedias de lengua francesa; Gramática, morfología, ortografía y lingüística; Diccionarios históricos; Diccionarios de arquitectura, artes visuales, jerga, derecho, economía y finanzas, gastronomía y dietética, historia, humor, juegos, diccionarios multiculturales, literatura, medios de comunicación, música, naturaleza y medio ambiente, ciencia (para un examen del concepto, véase que es la ciencia y que es una ciencia física), ciencias políticas, servicios, ciencias sociales y humanidades, deportes, técnicas, turismo, vocabularios varios; glosarios de Internet; listas de discusión; columnas léxicas; otros servidores.
La mayoría de los diccionarios en línea tienen un alcance bastante modesto y se publican como texto directo, al igual que un diccionario impreso.
Puntualización
Sin embargo, algunos pueden consultarse de forma interactiva como bases de datos relacionales y pueden ofrecer otras funciones. Por eso es interesante comparar los de los dos principales diccionarios en línea de inglés y francés, el OED y el TLF.
Basado en la experiencia de varios autores, mis opiniones, perspectivas y recomendaciones se expresarán a continuación (o en otros lugares de esta plataforma, respecto a las características en 2026 o antes, y el futuro de esta cuestión):
– A finales de los años noventa, el Proyecto OED de la Universidad de Waterloo puso a disposición de los usuarios una primera versión en línea de la segunda edición del OED; en el año 2000 se lanzó una edición de acceso más general, el OED Online, en el sitio web principal del OED. Ambas versiones son accesibles sólo por suscripción y permiten los siguientes tipos de búsqueda “lookup” (como en la versión impresa), “entire entry” = búsqueda de texto completo, “etymology”, “label” (= etiqueta de campo). La tecnología de las redes electrónicas también ha contribuido de forma significativa al programa de lectura de la OED: en lugar de los paquetes de fichas de papel procedentes de todo el mundo que entregaba el Servicio de Correos al Scriptorium de Oxford en la época de James Murray, ahora los lectores pueden enviar palabras, referencias y detalles a través de la web. El sitio web del OED ofrece una historia detallada del diccionario, lo que añade un valor académico poco frecuente en los sitios de diccionarios en línea.
– La versión completa del TLFI (Trésor de la langue française informatisé), publicada en la web en 2002, es gratuita y, de forma algo ambiciosa, permite al usuario limitar las consultas a uno o varios de los 29 campos, Entre ellos, “entrée” (toda la entrada), “exemple” (con subcategorías de varios tipos de ejemplos), “auteur d’exemple” (ejemplos por autor), “date d’exemple” (por fecha), “code grammatical”, “définition”, “domaine technique”, “synonyme/antonyme. ” El TLF impreso en 16 volúmenes adolecía de un alto grado de variación en la escritura (véase la primera sección, más arriba), lo que hacía del etiquetado de campo una tarea extremadamente difícil y obligaba al equipo del Institut National de la Langue Française (INaLF) a adoptar en parte un enfoque probabilístico en la creación de la versión electrónica (Henry 1996).
Una característica de la Web es el hipervínculo, que facilita, entre otras cosas, la asociación entre el texto y la nota a pie de página (vínculo intratextual), la que existe entre la referencia bibliográfica y la biblioteca (vínculo intertextual), o la que existe entre una palabra A encontrada dentro de la entrada del diccionario para la palabra B y la entrada de la palabra A (por ejemplo, “anaptixis: epéntesis de una vocal” > epéntesis). El Dictionnaire universel francophone en ligne (DUF), un importante recurso lingüístico gratuito para los hablantes y estudiantes de todas las variedades de francés y el equivalente en línea del diccionario impreso de lengua general que se encuentra en la mayoría de los hogares, tiene hipervínculos para cada palabra contenida en sus entradas, lo que permite al usuario referirse a la entrada de cualquier palabra con un solo clic (por ejemplo, “sabotaje n. m. 1. TECH Acción de sabotear (un pieu, une traverse, etc.)” > nom, masculin, technique, technologie, technologique, action, de, saboter, un, pieu, traverse, et caetera).
Además de los diccionarios de la lengua general contemporánea, existe un gran número de diccionarios marcados o especializados.Entre las Líneas En el ámbito de los diccionarios antiguos, hay varios que van del siglo XVI a principios del XX, accesibles libremente en forma de base de datos en la sección Dictionnaires d’autrefois del sitio del proyecto ARTFL (American and French Research on the Treasury of the French Language) de la Universidad de Chicago: Estienne, Nicot, Bayle, Académie française (también en un servidor del INaLF en Nancy). Las bases de datos interactivas de varios de estos y otros están en un servidor de la Universidad de Toronto. La terminología, antes reservada a los especialistas de pago, está ahora disponible gratuitamente en la web. Por ejemplo, un Glossaire typographique et linguistique o una Terminología de la Mastocitosis Pediátrica;, un término de mastocitosis pediátrica como anafilaxia aparece en decenas de miles de páginas web (69.700 visitas con Google el 28 de septiembre de 2002).
📬Si este tipo de historias es justo lo que buscas, y quieres recibir actualizaciones y mucho contenido que no creemos encuentres en otro lugar, suscríbete a este substack. Es gratis, y puedes cancelar tu suscripción cuando quieras: Qué piensas de este contenido? Estamos muy interesados en conocer tu opinión sobre este texto, para mejorar nuestras publicaciones. Por favor, comparte tus sugerencias en los comentarios. Revisaremos cada uno, y los tendremos en cuenta para ofrecer una mejor experiencia.La lexicografía web ofrece una serie de herramientas, entre las que destaca la traducción automática (p. ej., Babelfish), destinada a traducir lo esencial de un documento web a un idioma que entienda el usuario.
Además de los diccionarios de equipos profesionales, como el OED, el TLF o el DUF, y de los léxicos especializados accesibles en la web, también existen diccionarios y glosarios elaborados por aficionados y particulares. Si se quiere, por ejemplo, explorar la jerga dublinesa que aparece en la Trilogía de Barrytown de Roddy Doyle, la fuente de información más fácil de encontrar en Internet son los O’Byrne Files.
Una última palabra debe reservarse para la lexicografía recreativa. Los juegos de palabras de salón, radio, televisión, libros y prensa proliferan en la Red. El sitio del OED propone “La palabra del día”; COBUILD tiene “La expresión del día”, “El juego de las definiciones” y “La competición de Cobuild”. Muchos sitios ofrecen “Hangman” o “Le Jeu du pendu”.
Pormenores
Hay varios tipos de “Crucigrama” o “Mots croisés”, “Anagramas” y “Anagrammes”; el “Scrabble” en línea tiene sitios de juegos interactivos y sitios de cajas de herramientas (diccionario).
Datos verificados por: Brooks
Recursos
[rtbs name=”informes-jurídicos-y-sectoriales”][rtbs name=”quieres-escribir-tu-libro”]Véase También
Bibliografía
Diccionarios, Lexicografía, Lexicología, Lingüística
▷ Esperamos que haya sido de utilidad. Si conoces a alguien que pueda estar interesado en este tema, por favor comparte con él/ella este contenido. Es la mejor forma de ayudar al Proyecto Lawi.
Los siguientes ejemplos están tomados de la entrada de GAGNER en Lexis:
(a) Gagner quelque chose (moyen de subsistance, récompense), l’acquérir par son travail
(b) Gagner son biftek (pop.) [= gagner tout juste sa vie]
(c) Gagner le Pérou (= des sommes énormes)
(d) Gagner le maquis (syn. PRENDRE)
(e) C’est toujours ça de gagné (fam.) [= c’est toujours ça de pris]
(f) Il ne gagne pas lourd (= peu)
(g) Je suis sorti par ce froid, j’ai gagné un bon rhume (syn. plus usuels: ATTRAPER, PRENDRE, fam. CHIPER)
Cada uno de los siete ítems contiene una ecuación de sinonimia, que se refiere a la totalidad o a una parte del primer término: el objeto del verbo en (a) y (c), el calificador adverbial en (f), el verbo en (d) y (g), la expresión completa en (b) y (e). La competencia lingüística es necesaria para equiparar quelque chose y l’ (a), ne … pas lourd con peu (f), la forma conjugada ai gagné con los infinitivos attraper, prendre y chiper (g).
Austermühl (2001) ofrece una buena descripción de las ventajas e inconvenientes de la traducción automática en la web. Meijs (1992) ofrece una buena descripción del período comprendido entre 1960 y principios de los años 90, el de la lexicografía asistida por ordenador y el de los diccionarios en CD-ROM; Knowles (1990) ofrece una descripción más detallada.