Programación de Proyectos
La gestión de proyectos no es sólo programar. Los diagramas de flechas permiten evaluar el impacto de un deslizamiento en un proyecto más fácilmente que con los diagramas de Gantt.
Plataforma de Derecho y Ciencias Sociales
Comprender en profundidad cómo funciona el mundo de hoy para navegar por el mundo de mañana.
La gestión de proyectos no es sólo programar. Los diagramas de flechas permiten evaluar el impacto de un deslizamiento en un proyecto más fácilmente que con los diagramas de Gantt.
En esta entrada se ofrece un breve resumen del campo de la minería de datos. Los temas tratados son la explosión de datos, el proceso de descubrimiento de conocimientos, las aplicaciones de la minería de datos, los datos etiquetados y no etiquetados, el aprendizaje supervisado: clasificación y predicción numérica, y el aprendizaje no supervisado: reglas de asociación y agrupación.
Un importante caso especial de clasificación de texto surge cuando los documentos son páginas web. La clasificación automática de páginas web se conoce como clasificación de hipertexto. Se ilustran las diferencias entre la clasificación estándar de texto y la clasificación de hipertexto y se discuten los temas relacionados con esta última.
En este texto se examina un tipo particular de tarea de clasificación, en la que los objetos son documentos de texto. Se describe un método de procesamiento de los documentos para su uso por los algoritmos de clasificación dados anteriormente en esta materia utilizando una representación de bolsa de palabras.
Los datos para la extracción de datos se presentan en muchas formas: desde archivos informáticos tecleados por operadores humanos, información comercial en SQL o algún otro formato estándar de base de datos, información registrada automáticamente por equipos como dispositivos de registro de fallas, hasta corrientes de datos binarios transmitidos desde satélites. Este texto introduce la formulación estándar para la entrada de datos en los algoritmos de minería de datos que se asumirán a lo largo de este libro. A continuación, se distingue entre los diferentes tipos de variables y se examinan cuestiones relativas a la preparación de los datos antes de su utilización, en particular la presencia de valores de datos que faltan y el ruido.