Evaluación del Desempeño
Esta entrada se ocupa de la cuestión de cómo comparar la idoneidad de las técnicas alternativas de aprendizaje automático para la inducción en un dominio determinado. Dividir el conjunto de ejemplos preclasificados al azar en dos subconjuntos (uno para la inducción, el otro para la prueba) puede no ser lo mejor, especialmente si el conjunto de formación es pequeño; la división aleatoria puede entonces dar lugar a subconjuntos que no representen adecuadamente el dominio dado. Para obtener resultados más fiables, es necesario repetir las ejecuciones aleatorias. En el presente texto se abordan ambas cuestiones, explicando criterios alternativos para cuantificar el rendimiento (véase una definición en el diccionario y más detalles, en la plataforma general, sobre rendimientos) de los clasificadores y luego se examinan algunas estrategias utilizadas comúnmente en la evaluación experimental de los algoritmos de aprendizaje por máquina.