El árbol de decisión es la herramienta más poderosa y popular para la clasificación y predicción. (Tal vez sea de interés más investigación sobre el concepto). Un árbol de decisión es un diagrama de flujo como una estructura de árbol, donde cada nodo interno denota una prueba sobre un atributo, cada rama representa un resultado de la prueba, y cada nodo de hoja (nodo terminal) tiene una etiqueta de clase. Un árbol puede “aprenderse” dividiendo el conjunto de fuentes en subconjuntos basándose en una prueba de valor de atributo. Este proceso se repite en cada subconjunto derivado de una manera recursiva llamada partición recursiva. La recursión se completa cuando el subconjunto de un nodo tiene el mismo valor de la variable objetivo, o cuando la división ya no añade valor a las predicciones. La construcción del clasificador de árbol de decisión no requiere ningún conocimiento de dominio o parametrización, y por lo tanto es apropiado para el descubrimiento de conocimiento exploratorio. Los árboles de decisión pueden manejar (gestionar) datos de gran tamaño. En general, el clasificador de árboles de decisión tiene una buena precisión. (Tal vez sea de interés más investigación sobre el concepto). La inducción de árboles de decisión es un enfoque inductivo típico para aprender conocimientos sobre clasificación. (Tal vez sea de interés más investigación sobre el concepto). Los árboles de decisión clasifican las instancias clasificándolas desde la raíz del árbol hasta algún nodo de hoja, lo que proporciona la clasificación de la instancia. Una instancia se clasifica comenzando en el nodo raíz del árbol, probando el atributo especificado por este nodo, luego bajando por la rama del árbol correspondiente al valor del atributo como se muestra en la figura de arriba, este proceso se repite para el subárbol arraigado en el nuevo nodo.