Atributos
Sigla: 
CI-0148
Créditos: 
4
Horas: 
5
Clasificación: 
Curso propio
Énfasis y ciclo: 
I o II ciclo, 4.º año (énfasis de CC, IS e ITI)
Descripción: 

El aprendizaje automático es el área de la inteligencia artificial que se ocupa de los sistemas computacionales que modifican y mejoran su rendimiento mediante la experiencia. En esta área, el aprendizaje significa cualquier cambio en un sistema computacional que permite que se desempeñe mejor en el futuro. En el curso se presentan los principales algoritmos de aprendizaje automático y se cubren conceptos como optimización de hiperparámetros, descenso de gradiente y los aspectos matemáticos de los algoritmos.  El curso refuerza conceptos como preparación y procesamiento de datos para construir un sistema capaz de aprender y generalizar e introduce los conceptos elementales de aprendizaje profundo y algunas de sus aplicaciones. Su enfoque es teórico-práctico.

Objetivo general: 

El objetivo general del curso es que la persona estudiante desarrolle habilidades para afinar y evaluar algoritmos de aprendizaje automático y profundo, mediante estrategias teóricas y aplicadas, con el fin de resolver problemas de predicción.

Objetivos específicos: 

En el curso, cada estudiante desarrollará habilidades para lo siguiente:

 

  1. Caracterizar y evaluar algoritmos de aprendizaje automático y profundo según la tarea que realizan, para identificar el algoritmo más adecuado para resolver un problema específico, mediante estrategias declarativas y actividades prácticas.
  2. Afinar los hiperparámetros de los algoritmos de aprendizaje automático y profundo, con el fin de evaluar y mejorar el rendimiento de los modelos obtenidos, mediante actividades prácticas.
  3. Analizar el impacto de la alta dimensionalidad de los datos en el contexto de la construcción de modelos de predicción, con el fin de diseñar soluciones que la reduzcan y mejoren el rendimiento del modelo de predicción, mediante actividades prácticas.
  4. Desarrollar modelos basados en arquitecturas de aprendizaje profundo, con el fin de resolver tareas  de clasificación, predicción y generación, mediante estrategias declarativas y actividades prácticas.
Contenidos: 

Los ejes temáticos del curso y los objetivos a los que obedecen se detallan en la tabla siguiente.

 

Objetivo específico

Eje temático

Desglose

1

Conceptos introductorios de aprendizaje automático

- Historia y fundamentos de aprendizaje automático.

- Características de problemas solucionables mediante aprendizaje automático.

- Ventajas y desventajas del aprendizaje automático para resolución de problemas complejos.

- Etapas que preceden la construcción de un modelo de aprendizaje automático.

1

Tipos de aprendizaje automático

- Presentación de diferentes tipos de aprendizaje y sus características: supervisado, no supervisado, semisupervisado y reforzado.

- Conceptos de aprendizaje por lotes y aprendizaje en línea.

- Comparación entre aprendizaje basado en instancias y basado en modelos.

1, 2

Aprendizaje supervisado: Regresión regularizada y árboles de decisión

- Regresión lineal simple: conceptos básicos y métricas de desempeño, por ejemplo: error cuadrado medio, raíz del error cuadrado medio, R2 ajustado. Optimización de parámetros (ejemplificar con el método de mínimos cuadrados ordinarios).

- Regresión regularizada: algoritmos como LASSO, Ridge y Elastic Net. Afinamiento de hiperparámetros. Comparación con mínimos cuadrados ordinarios.

- Árboles de decisión para clasificación y regresión: construcción, selección de atributos y poda. Métricas de desempeño, mejora de desempeño por afinamiento de hiperparámetros.

- Clasificadores basados en votación suave y dura.

1, 2

Aprendizaje supervisado: Métodos de kernel

- Máquinas de soporte vectorial: Conceptos esenciales y proyección a un plano de dimensionalidad alta para separación lineal mediante funciones de kernel.

- Funciones de kernel (lineal, polinomial y radial) para transformación de datos.

- Aplicación para regresión: máquinas de soporte de regresión

1, 2

Aprendizaje supervisado: Métodos conjuntos y aumentados

- Bosques aleatorios como conjuntos de árboles de decisión – la evolución de los árboles de clasificación y regresión. Algoritmo e hiperparámetros. Importancia de variables en bosques aleatorios.

- Clasificadores de conjuntos y métodos de evaluación (bolseo y pegado, error fuera de la bolsa).

- Aprendizaje aumentado: aumento en gradiente y aumento adaptativo.

2, 3

Reducción de la dimensionalidad

- Alta dimensionalidad y problemas que conlleva.

- Extracción de variables: métodos basados en proyección y proyección en un hiperplano, cálculo de componentes principales. Métodos no lineales para la reducción del espacio dimensional.

- Selección de variables: métodos empotrados, filtro, envoltura y algoritmos que los implementan.

- Diferencias entre selección de variables y extracción de variables.

1, 2

Aprendizaje no supervisado

- Introducción a métodos de agrupamiento usando k-medias como caso de ejemplo. Definición de k o número de clúster óptimo (estadística de brecha, silueta, método del codo).

2, 4

Fundamentos de aprendizaje profundo

- El perceptrón, la evolución hacia el perceptrón multicapa para resolución de problemas no linealmente separables.

- La arquitectura elemental del perceptrón multicapa (retropropagación, función de activación y optimizadores).

- Uso de perceptrón multicapa para clasificación y regresión. Limitaciones.

- Gradiente del descenso (GD), cómo funciona el GD, la tasa de aprendizaje y el GD, tipos de GD.

2, 3, 4

Arquitecturas alternativas de aprendizaje profundo

- Arquitecturas para la tarea del análisis de imágenes (el caso de las redes neuronales convolucionales y sus capas de convolución, agrupación máxima y aplanamiento).

- Análisis de datos secuenciales con redes neuronales recurrentes. El problema del gradiente que desaparece. Arquitecturas basadas en redes neuronales recurrentes para el análisis de datos secuenciales largos.

- Arquitecturas profundas generativas. Cómo generar una variable aleatoria a partir de una distribución desconocida. Por ejemplo, redes neuronales generativas adversariales. 

- Aprendizaje no supervisado con arquitecturas profundas, el caso del auto codificador.

 

Metodología

Este curso tiene un enfoque teórico-práctico, por lo que se recomienda que las clases combinen actividades magistrales con ejercicios y trabajos en grupo. Se busca que cada estudiante desarrolle habilidades teóricas para conocer y manejar los conceptos en distintos niveles de profundidad. Para ciertos conceptos, se espera también que el estudiante pueda poner en práctica estos conceptos a través de proyectos.

 

Evaluación

Para ser compatibles con el enfoque teórico-práctico, se evaluarán los aspectos teóricos y prácticos del curso mediante la realización de tareas cortas, quices, exámenes, proyectos y tareas programadas.

 

Bibliografía: 

Watt, J., Borhani, R., & Katsaggelos, A. (2020). Machine learning refined: foundations, algorithms, and applications. Cambridge University Press.

Bonaccorso, G. (2018). Mastering machine learning algorithms: expert techniques to implement popular machine learning algorithms and fine-tune your models. Packt Publishing Ltd.

Krohn, J., Beyleveld, G., & Bassens, A. (2019). Deep Learning Illustrated: A Visual, Interactive Guide to Artificial Intelligence. Addison-Wesley Professional.

Alpaydin, E. (2020). Introduction to machine learning. MIT press.

Shalev-Shwartz, S., & Ben-David, S. (2014). Understanding machine learning: From theory to algorithms. Cambridge university press.

Goodfellow, I., Bengio, Y., Courville, A., & Bengio, Y. (2016). Deep learning (Vol. 1, No. 2). Cambridge: MIT press.

Géron, A. (2019). Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow: Concepts, tools, and techniques to build intelligent systems. O'Reilly Media.

Raschka, S., & Mirjalili, V. (2019). Python machine learning: Machine learning and deep learning with Python, scikit-learn, and TensorFlow 2. Packt Publishing Ltd.

Müller, A. C., & Guido, S. (2016). Introduction to machine learning with Python: a guide for data scientists. " O'Reilly Media, Inc.".

LIberación de responsabilidad: 

Este no es un documento oficial. Documentos oficiales se entregan en la secretaría de la escuela.