El Lenguaje en las Ciencias de la Información
Este elemento es una expansión del contenido de los cursos y guías de Lawi. Ofrece hechos, comentarios y análisis sobre este tema. [aioseo_breadcrumbs]
Elementos del Lenguaje en las Ciencias de la Información
Lenguajes de marcado
La actual comunicación global de personas y aplicaciones de software a través de Internet se ve facilitada por el uso de lenguajes de marcado. Esta entrada presenta los principios y los diferentes tipos de marcado, así como la historia de los lenguajes de marcado actuales. La base de los lenguajes de marcado modernos es el Lenguaje de Marcado Generalizado Estándar (SGML) o su forma restringida Lenguaje de Marcado Extensible (XML).Entre las Líneas En esta entrada se describen las técnicas de marcado utilizadas en SGML y XML, se dan ejemplos de su uso y se describen brevemente algunas aplicaciones representativas de SGML y XML en distintos ámbitos. Un factor importante del éxito de XML ha sido la posibilidad de reutilizar vocabularios de marcado y combinar vocabularios procedentes de diferentes fuentes. Esta entrada describe los conceptos y métodos que facilitan la reutilización de nombres de vocabularios definidos anteriormente.
Lenguaje de marcas extensible (XML)
XML, el Lenguaje de Marcado Extensible, es una sintaxis para etiquetar, o marcar, información textual. Es un estándar, establecido por el Consorcio de la World Wide Web (W3C), que muchos utilizan al compartir o trabajar con información estructurada. XML no se utiliza por sí mismo, sino como herramienta para crear otros lenguajes de marcado de datos específicos. Una de las ventajas de utilizar XML es que permite a estos lenguajes distinguir el contenido que se marca de su presentación, lo que permite una mayor flexibilidad y reutilización de los datos. La comunidad bibliotecaria ha adoptado el XML y lo utiliza como base para muchos de sus lenguajes de marcado de datos específicos. Tal vez el mayor punto fuerte de XML es que es muy fácil empezar a trabajar con él y, sin embargo, junto con muchas otras normas y tecnologías relacionadas con XML, también puede utilizarse para desarrollar aplicaciones complejas.
Procesamiento del lenguaje natural para la recuperación de información
El procesamiento del lenguaje natural (PLN) es el enfoque informático del análisis de textos que se basa tanto en un conjunto de teorías como en un conjunto de tecnologías. Aunque la PNL es un área de investigación y aplicación relativamente reciente, en comparación con otros enfoques de la tecnología de la información, hasta la fecha se han producido suficientes éxitos que sugieren que las tecnologías de acceso a la información basadas en la PNL seguirán siendo un área importante de investigación y desarrollo en los sistemas de información ahora y en el futuro.
Redes neuronales artificiales y procesamiento del lenguaje natural
Esta entrada ofrece una visión general de los trabajos realizados hasta la fecha sobre el procesamiento del lenguaje natural (PLN) mediante redes neuronales artificiales (RNA). Consta de tres partes principales: la primera ofrece una breve introducción a las RNA, la segunda esboza algunos de los principales problemas de la PNL basada en RNA y la tercera estudia áreas de aplicación específicas. Cada parte cita una selección representativa de la literatura de investigación que a su vez contiene referencias a otras lecturas.
Basado en la experiencia de varios autores, mis opiniones, perspectivas y recomendaciones se expresarán a continuación (o en otros lugares de esta plataforma, respecto a las características en 2026 o antes, y el futuro de esta cuestión):
El Sistema de Lenguaje Médico Unificado
El Sistema de Lenguaje Médico Unificado (UMLS, por sus siglas en inglés) es un esfuerzo de investigación y desarrollo a largo plazo de la Biblioteca Nacional de Medicina, cuyo objetivo es ayudar a los usuarios a encontrar información de múltiples fuentes sin tener que entender los entresijos de cada una de ellas. El UMLS, que consta de tres fuentes principales de conocimiento, un metatesauro, una red semántica y un conjunto de herramientas de procesamiento léxico, se produce y publica dos veces al año. Los esfuerzos recientes se han dirigido a ampliar la cobertura en genética y en vocabularios clínicos diseñados para su uso en sistemas de registros médicos. RxNorm, que se elabora y publica mensualmente, con actualizaciones semanales, es una consecuencia del UMLS, centrada en la terminología de los medicamentos.
📬Si este tipo de historias es justo lo que buscas, y quieres recibir actualizaciones y mucho contenido que no creemos encuentres en otro lugar, suscríbete a este substack. Es gratis, y puedes cancelar tu suscripción cuando quieras: Qué piensas de este contenido? Estamos muy interesados en conocer tu opinión sobre este texto, para mejorar nuestras publicaciones. Por favor, comparte tus sugerencias en los comentarios. Revisaremos cada uno, y los tendremos en cuenta para ofrecer una mejor experiencia.Datos verificados por: Brooks y Mix
Recursos
Véase También
Lenguas, Lenguajes, Lingüística, Lingüística computacional,
▷ Esperamos que haya sido de utilidad. Si conoces a alguien que pueda estar interesado en este tema, por favor comparte con él/ella este contenido. Es la mejor forma de ayudar al Proyecto Lawi.