▷ Sabiduría semanal que puedes leer en pocos minutos. Añade nuestra revista gratuita a tu bandeja de entrada. Lee gratis nuestras revistas de Derecho empresarial, Emprender, Carreras, Liderazgo, Dinero, Startups, Políticas, Ecología, Ciencias sociales, Humanidades, Marketing digital, Ensayos, y Sectores e industrias.

Aprendizaje No Supervisado

▷ Lee Gratis Nuestras Revistas

Aprendizaje No Supervisado

Este elemento es una ampliación de los cursos y guías de Lawi. Ofrece hechos, comentarios y análisis sobre este tema. [aioseo_breadcrumbs]

En Aprendizaje Automático

Sería un error pensar que el Aprendizaje Automático siempre requiere ejemplos con etiquetas de clase. Lejos de eso. Se puede obtener información útil incluso de ejemplos cuyas clases no se conocen. Esto se llama a veces aprendizaje no supervisado, en contraste con el término aprendizaje supervisado que se utiliza cuando se habla de inducción a partir de ejemplos preclasificados.

Mientras que el aprendizaje supervisado se centra en la inducción de los clasificadores, el aprendizaje no supervisado está interesado en descubrir propiedades útiles de los datos disponibles. Tal vez la tarea más popular sea la de buscar grupos (llamados clusters) de ejemplos similares. Los centroides de estos grupos pueden ser utilizados como centros gausianos para los clasificadores Bayesianos o RBF, como predictores de valores de atributos desconocidos, e incluso como herramientas de visualización de datos multidimensionales.

Detalles

Por último, pero no menos importante, las técnicas utilizadas en el aprendizaje no supervisado pueden utilizarse para crear atributos de nivel superior a partir de los ya existentes.

El texto describe algunas técnicas prácticas para el aprendizaje no supervisado, explicando los algoritmos básicos, sus comportamientos en circunstancias prácticas y los beneficios que ofrecen.

Observaciones históricas

Los problemas del análisis de conglomerados se han estudiado desde el decenio de 1960. El algoritmo k-means fue descrito por McQueen y la agregación jerárquica por Murty y Krishna. La idea de fusionar y dividir cúmulos (no necesariamente los obtenidos por k-means) fue estudiada por Ball y Hall. La técnica de SOFM, mapas de características auto-organizativas, fue desarrollada por Kohonen.

Visión General

En algunas tareas de aprendizaje por máquina, tenemos que tratar con vectores de ejemplo que no tienen etiquetas de clase. Aún así, el conocimiento útil puede ser inducido para ellos por las técnicas de aprendizaje no supervisado.

La tarea más simple en el aprendizaje no supervisado es el análisis de conglomerados. El objetivo es encontrar una forma de dividir naturalmente el conjunto de la formación en grupos de ejemplos similares. Cada ejemplo debe ser más similar a los ejemplos de su grupo que a los ejemplos de cualquier otro grupo.

Una de las técnicas de análisis de conglomerados más sencillas se conoce con el nombre de K-medias (en inglés, k-means), que es un método de agrupamiento, que tiene como objetivo la partición de un conjunto de n observaciones en k grupos en el que cada observación pertenece al grupo cuyo valor medio es más cercano. Es un método utilizado en minería de datos.

Una vez creada una agrupación inicial, el algoritmo acepta un ejemplo a la vez y evalúa su distancia del centroide de su propia agrupación, así como las distancias de los centros de las otras agrupaciones. Si el ejemplo parece encontrarse en un cúmulo equivocado, se transfiere a uno mejor. La técnica converge en un número finito de pasos.

La calidad de los conglomerados descubiertos por k-means es sensible a la inicialización y al valor especificado por el usuario de k. A veces hay que considerar métodos para mejorar esta calidad mediante la fusión y división subsiguientes y mediante inicializaciones alternativas. También son útiles las implementaciones jerárquicas de k-means.

En algunos dominios, las formas de los grupos de datos hacen imposible que k-means los encuentre. Por ejemplo, el ingeniero puede dar preferencia a alguna otra técnica de agrupación, como la agregación jerárquica que crea las agrupaciones de forma ascendente, fusionando siempre las agrupaciones con la menor distancia mutua.

En el caso de la agregación jerárquica, no es práctico identificar la distancia entre dos conglomerados con la distancia entre sus centros.Entre las Líneas En su lugar, utilizamos la distancia mínima entre [x,y] donde x pertenece a un cúmulo y y al otro.

Uno de los problemas a los que se enfrenta el algoritmo de k-medios es la cuestión de cómo definir los vectores de código iniciales. Una forma de abordar esta cuestión es mediante la técnica de mapas de características auto-organizadas.

Como ventaja adicional, los mapas de características auto-organizadas son capaces de convertir un espacio de características de alta dimensión en solo dos atributos. También pueden utilizarse para las necesidades de visualización de datos.

Análisis de clusters

La tarea fundamental en el aprendizaje no supervisado es el análisis de clusters (también se pueden llamar conglomerados o grupos). Aquí, la entrada es un conjunto de ejemplos, cada uno de ellos descrito por un vector de valores de atributos, pero sin etiquetas de clase. La salida es un conjunto de dos o más grupos de ejemplos.

¿Cómo deberían ser los grupos?

Los cúmulos no deben superponerse entre sí: cada ejemplo debe pertenecer a un solo y único cúmulo. Dentro de un mismo cúmulo, los ejemplos deben estar relativamente cerca unos de otros, ciertamente mucho más cerca que los ejemplos de los otros cúmulos.
Una pregunta importante será cuántos grupos contienen los datos.Entre las Líneas En la Fig. 14.1, observamos que el observador humano discierne tres o cuatro cúmulos.

Puntualización

Sin embargo, el alcance de las opciones existentes no se limita a estas dos posibilidades.Entre las Líneas En un extremo, se puede pensar que todo el conjunto de formación forma un gran cúmulo; en el otro, cada ejemplo puede considerarse que representa su propio cúmulo de un solo ejemplo.

Más Información

Las implementaciones prácticas a menudo sortean el problema pidiendo al usuario que suministre el número de agrupaciones mediante un parámetro de entrada.

Puntualización

Sin embargo, a veces se espera que el software de aprendizaje automático determine el número automáticamente.

Problemas con la medición de distancias

Los algoritmos para el análisis de conglomerados suelen necesitar un mecanismo para evaluar la distancia entre un ejemplo y un conglomerado. Si el cúmulo se describe por su centroide, la distancia euclidiana entre los dos vectores parece ofrecer una buena manera de hacerlo, suponiendo que seamos conscientes de las situaciones en las que esto puede ser engañoso. Esta última afirmación requiere una explicación.

La distancia euclidiana puede ser inconveniente en el caso de atributos discretos, pero ya sabemos cómo tratarlos. Más importante aún, no debemos olvidar que cada atributo es probable que represente una cantidad diferente, lo que hace que el uso de la distancia geométrica sea bastante arbitrario: una diferencia de 4 años en la edad es difícil de comparar con una diferencia de 4 pies en la altura. También el problema de la escala juega su papel: si reemplazamos los pies por millas, las distancias cambiarán considerablemente.
En el contexto del análisis de conglomerados, sin embargo, estos problemas tienden a ser menos serios que en los clasificadores de k-NN. La mayoría de las veces, los ingenieros sortean las dificultades normalizando todos los valores de los atributos en el intervalo unitario, x i ∈ [0, 1].

▷ Lo último (en 2026)
▷ Si te gustó este texto o correo, considera compartirlo con tus amigos. Si te lo reenviaron por correo, considera suscribirte a nuestras publicaciones por email de Derecho empresarialEmprenderDineroMarketing digital y SEO, Ensayos, PolíticasEcologíaCarrerasLiderazgoInversiones y startups, Ciencias socialesDerecho globalHumanidades, Startups, y Sectores económicos, para recibir ediciones futuras.

Una fórmula más general para las distancias

Si los ejemplos se describen mediante una mezcla de atributos numéricos y discretos, podemos confiar en la suma de las distancias al cuadrado a lo largo de los atributos correspondientes.

La reducción del tamaño de las redes de RBF y de los clasificadores bayesianos

El análisis de clusters puede ayudar a técnicas como los aprendices bayesianos y las redes con función de base radial. Estos paradigmas (sistema de creencias, reglas o principios) funcionan con centros.

Puntualización

Sin embargo, en dominios con millones de ejemplos, esto llevaría a clasificadores poco prácticos. El ingeniero prefiere entonces dividir el conjunto de formación en N agrupaciones, e identificar los centros gausianos con los centros de las agrupaciones.

Basado en la experiencia de varios autores, mis opiniones, perspectivas y recomendaciones se expresarán a continuación (o en otros lugares de esta plataforma, respecto a las características en 2026 o antes, y el futuro de esta cuestión):

Un clasificador simple

Por último, el conocimiento de los grupos de datos puede ser útil en el aprendizaje supervisado. Es bastante común que todos (o casi todos) los ejemplos de un cúmulo pertenezcan a la misma clase.Entre las Líneas En ese caso, el desarrollador de un software de aprendizaje supervisado puede decidir primero identificar los clústeres y luego etiquetar cada uno de ellos con su clase dominante.

Datos verificados por: LI

Aprendizaje no supervisado

Recursos

[rtbs name=”informes-jurídicos-y-sectoriales”][rtbs name=”quieres-escribir-tu-libro”]

Véase También

Algoritmo expectación-maximización
Análisis de grupos
Análisis multivariante
Mapa autoorganizado
Meta aprendizaje (Ciencias de la Computación)
Redes de funciones de base radial
Clasificadores bayesianos, teoría de aprendizaje computacional, árboles de decisión, algoritmos genéticos, clasificadores lineales y polinómicos, clasificador del vecino más cercano, redes neuronales, evaluación del rendimiento, aprendizaje de refuerzo, aprendizaje estadístico, clases variables en el tiempo, representación desequilibrada, inteligencia artificial, datos de aprendizaje automático, minería de aprendizaje profundo, aprendizaje no supervisado

📬Si este tipo de historias es justo lo que buscas, y quieres recibir actualizaciones y mucho contenido que no creemos encuentres en otro lugar, suscríbete a este substack. Es gratis, y puedes cancelar tu suscripción cuando quieras:

Qué piensas de este contenido? Estamos muy interesados en conocer tu opinión sobre este texto, para mejorar nuestras publicaciones. Por favor, comparte tus sugerencias en los comentarios. Revisaremos cada uno, y los tendremos en cuenta para ofrecer una mejor experiencia.

Aprendizaje profundo
Dinámica de sistemas
Inteligencia artificial
Inteligencia computacional
Internet de las cosas
Sistema dinámico
Minería de datos
Reconocimiento de patrones
Reglas de asociación
Robot autónomo
Sistema complejo
Representación del conocimiento
Equidad (aprendizaje automático)
Análisis predictivo – Técnicas estadísticas que analizan los hechos para hacer predicciones sobre eventos desconocidos
El aprendizaje de las máquinas cuánticas
Aplicaciones del aprendizaje a máquina en bioinformática
Seq2seq
Equidad (aprendizaje automático)

Ciencias de la computación, minería de datos, Descubrimiento de conocimientos, Grandes datos, Análisis de datos, inteligencia computacional, Inteligencia artificial, Visión por computadora, Cibernética, Aprendizaje, Aprendizaje Profundo, Algoritmos de clasificación, Estadística computacional, Neurociencia computacional, Investigación de mercado, Segmentación de mercado, Psicología matemática, Métodos económicos matemáticos, Métodos económicos cuantitativos

▷ Esperamos que haya sido de utilidad. Si conoces a alguien que pueda estar interesado en este tema, por favor comparte con él/ella este contenido. Es la mejor forma de ayudar al Proyecto Lawi.
▷ Lee Gratis Nuestras Publicaciones
,Si este contenido te interesa, considera recibir gratis nuestras publicaciones por email de Derecho empresarial, Emprender, Dinero, Políticas, Ecología, Carreras, Liderazgo, Ciencias sociales, Derecho global, Marketing digital y SEO, Inversiones y startups, Ensayos, Humanidades, y Sectores económicos, en Substack.

Foro de la Comunidad: ¿Estás satisfecho con tu experiencia? Por favor, sugiere ideas para ampliar o mejorar el contenido, o cómo ha sido tu experiencia:

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

▷ Recibe gratis nuestras revistas de Derecho empresarial, Emprender, Carreras, Dinero, Políticas, Ecología, Liderazgo, Marketing digital, Startups, Ensayos, Ciencias sociales, Derecho global, Humanidades, y Sectores económicos, en Substack. Cancela cuando quieras.

Descubre más desde Plataforma de Derecho y Ciencias Sociales

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo