Big Data: Desarrollo de Aplicaciones de Machine Learning e Inteligencia Artificial con Python y Spark

  • Abilways
  • }
Big Data: Desarrollo de Aplicaciones de Machine Learning e Inteligencia Artificial con Python y Spark
28
Abr

El Big Data y la Inteligencia Artificial están transformando la forma en la que las organizaciones analizan datos y desarrollan soluciones avanzadas. La capacidad de diseñar, entrenar y desplegar modelos de Machine Learning en entornos distribuidos es hoy una competencia clave.

En esta formación aprenderás a desarrollar aplicaciones de Machine Learning e Inteligencia Artificial con Python y Apache Spark, utilizando bibliotecas como Scikit-learn, TensorFlow o PyTorch, y aplicando conceptos clave como programación paralela, Data Science y MLOps.

Objetivos de la formación en desarrollo de aplicaciones de Machine Learning e IA con Big Data

Al final de esta formación será capaz de:

  • Desarrollar aplicaciones de Machine Learning y de IA (Inteligencia Artificial) con Spark y Python
  • Utilizar programación paralela en un clúster
  • Desarrollar y optimizar algoritmos estándar de Machine Learning y de IA
  • Utilizar bibliotecas Python para Machine Learning y la IA
  • Describir el ciclo de vida de un proyecto de Data Science

Público objetivo de la formación en Big Data y Machine Learning

Cualquier persona que desee adquirir competencias en el desarrollo de aplicaciones de Machine Learning y de IA (Inteligencia Artificial).

Requisitos previos de la formación en Big Data e IA

Tener conocimientos de matemáticas algebraicas para poder interpretar los algoritmos a implementar y conocer el lenguaje Python (se realizarán recordatorios durante la formación).

Programa de la formación en Big Data, Machine Learning e Inteligencia Artificial

Día 1 – Visión general del Big Data, del Machine Learning y de la IA

  • Introducción al Big Data y a la IA (Inteligencia Artificial): ¿de qué se trata?
  • Perspectivas ofrecidas por el Big Data y la IA
  • Los actores del Big Data y de la IA
  • Ejemplos prácticos
  • Las tecnologías implicadas
  • Las diferentes profesiones
  • Aspectos económicos (OPEX, CAPEX, TIR) del Cloud vs On-Premise
  • Demostración de aplicaciones

Revisiones sobre Data Science

  • Las bases del lenguaje Python
  • Modelización de las problemáticas mediante vectores y matrices
  • Probabilidades, estadística, estadística descriptiva y explicativa
  • Entropía, ganancia de información
  • Compromiso sesgo-complejidad
  • La maldición de la dimensión
  • Matriz de confusión
  • Gestionar los valores faltantes (MCAR / MAR / MNAR)
  • Validación cruzada
  • Curva de aprendizaje
  • Fundamentos de la limpieza de datos
  • Reducción de la dimensión mediante selección o transformación de variables
  • Métricas de rendimiento de un modelo: R², Accuracy, Precisión, Recall, F1-score, AUC, P-valor

Ejemplos de ejercicios prácticos (a título indicativo)

  • Carga, exploración, análisis, limpieza y primeras modelizaciones sobre un conjunto de datos

Día 2 – Machine Learning e IA: algoritmos

  • Los conceptos de Machine Learning y de IA
  • Datos supervisados y no supervisados: diferencias
  • Bibliotecas utilizadas: Scikit-learn, TensorFlow, PyTorch, Keras
  • Regresión
  • Modelos lineales
  • Clasificación
  • Naive Bayes
  • K-NN
  • K-Means clustering

Ejemplos de ejercicios prácticos (a título indicativo)

Implementación de los algoritmos estudiados según la finalidad buscada (regresión, clasificación, imputación de valores faltantes) utilizando las bibliotecas Scikit-learn y Keras

Día 3 – Machine Learning e IA: algoritmos (continuación)

  • DBScan
  • Árboles de decisión y de regresión
  • Support Vector Machines (SVM)
  • Redes neuronales y aprendizaje profundo (Deep Learning)
  • Redes convolucionales y redes recurrentes

Ejemplos de ejercicios prácticos (a título indicativo)

Modelizaciones avanzadas (DL, CNN, RNN) con optimización de las arquitecturas y de los hiperparámetros

Día 4 – Desarrollar con Spark

  • Introducción a Apache Spark
  • Machine Learning con Apache Spark MLlib

Ejemplos de ejercicios prácticos (a título indicativo)

  • Ejercicios de aplicación con Spark MLlib, Streaming, SQL y GraphFrames
  • Implementación de MLFlow para comparar modelos

Día 5 – Herramientas de visualización de datos (Dataviz)

  • Definición de Dataviz
  • Los actores de la Dataviz
  • Principios de la Dataviz
  • Bibliotecas Python de Dataviz
  • Tableau Desktop / Public
  • Microsoft Power BI

MLOps y arquitecturas serverless

  • Introducción a MLOps y a las arquitecturas serverless
  • Los enfoques DevOps y GitOps
  • Bases de la contenedorización y de la automatización
  • Las arquitecturas serverless
  • Desarrollo e implementación de aplicaciones MLOps en producción (demostración)
  • Monitorización y mejora continua de las aplicaciones MLOps (demostración)

Ejemplos de ejercicios prácticos (a título indicativo)

  • Uso de Tableau o MS Power BI
  • Uso de bibliotecas Python (Matplotlib, Seaborn)
  • Creación y ejecución de un pipeline MLOps con serving y monitorización del modelo

Nota: El contenido de este programa puede ser objeto de adaptación en función de los niveles, requisitos previos y necesidades de los participantes.

  • Tratamiento de datos en tiempo real con Apache Spark Streaming
  • Consultas SQL con Apache Spark SQL
  • Modelización de redes sociales con grafos utilizando Apache Spark GraphFrames
  • Demostración de trabajo colaborativo con MLFlow
5 días

Metodología de la formación en Big Data y Machine Learning

Formación impartida de forma presencial o a distancia (blended learning, e-learning, clase virtual, presencial a distancia).

El formador alterna entre método:

  • Demostrativo
  • Interrogativo
  • Activo (a través de ejercicios prácticos y/o simulaciones)

Recursos y medios

  • Ordenadores Mac o PC
  • Conexión a Internet de alta velocidad (fibra)
  • Pizarra blanca o paperboard
  • Videoproyector o pantalla táctil interactiva
  • Entornos de formación instalados en los puestos de trabajo o online
  • Materiales del curso y ejercicios

Evaluación de los aprendizajes

  • Durante la formación: a través de estudios de caso o ejercicios prácticos
  • Al final de la formación: a través de un cuestionario de autoevaluación

Esta formación es bonificable a través de FUNDAE para todas las empresas que cuenten con trabajadores en régimen general de la Seguridad Social y dispongan de crédito formativo. SKOLAE Formación gestiona todo el proceso administrativo necesario para que tu empresa pueda recuperar el importe invertido en la formación, siempre que se cumplan los requisitos legales y de comunicación establecidos por FUNDAE.

Profesional especializado en Big Data, Machine Learning e Inteligencia Artificial, con experiencia en el desarrollo de aplicaciones de Data Science utilizando Python y Apache Spark en entornos distribuidos.

Cuenta con trayectoria en el diseño, entrenamiento y optimización de modelos mediante bibliotecas como Scikit-learn, TensorFlow, PyTorch y Keras, así como en la implementación de soluciones de Machine Learning en producción mediante enfoques MLOps y arquitecturas serverless.

Ha participado en proyectos vinculados al tratamiento de grandes volúmenes de datos, programación paralela en clústeres, desarrollo de pipelines de datos y despliegue de modelos en entornos empresariales, combinando conocimientos técnicos con una visión aplicada al negocio.

Combina experiencia técnica con enfoque pedagógico, facilitando la comprensión de conceptos complejos como algoritmos de Machine Learning, Deep Learning o procesamiento distribuido mediante ejemplos prácticos, ejercicios guiados y casos reales.

Objetivos

Objetivos de la formación en desarrollo de aplicaciones de Machine Learning e IA con Big Data

Al final de esta formación será capaz de:

  • Desarrollar aplicaciones de Machine Learning y de IA (Inteligencia Artificial) con Spark y Python
  • Utilizar programación paralela en un clúster
  • Desarrollar y optimizar algoritmos estándar de Machine Learning y de IA
  • Utilizar bibliotecas Python para Machine Learning y la IA
  • Describir el ciclo de vida de un proyecto de Data Science

Público objetivo de la formación en Big Data y Machine Learning

Cualquier persona que desee adquirir competencias en el desarrollo de aplicaciones de Machine Learning y de IA (Inteligencia Artificial).

Requisitos previos de la formación en Big Data e IA

Tener conocimientos de matemáticas algebraicas para poder interpretar los algoritmos a implementar y conocer el lenguaje Python (se realizarán recordatorios durante la formación).

Duración

5 días

Programa

Programa de la formación en Big Data, Machine Learning e Inteligencia Artificial

Día 1 – Visión general del Big Data, del Machine Learning y de la IA

  • Introducción al Big Data y a la IA (Inteligencia Artificial): ¿de qué se trata?
  • Perspectivas ofrecidas por el Big Data y la IA
  • Los actores del Big Data y de la IA
  • Ejemplos prácticos
  • Las tecnologías implicadas
  • Las diferentes profesiones
  • Aspectos económicos (OPEX, CAPEX, TIR) del Cloud vs On-Premise
  • Demostración de aplicaciones

Revisiones sobre Data Science

  • Las bases del lenguaje Python
  • Modelización de las problemáticas mediante vectores y matrices
  • Probabilidades, estadística, estadística descriptiva y explicativa
  • Entropía, ganancia de información
  • Compromiso sesgo-complejidad
  • La maldición de la dimensión
  • Matriz de confusión
  • Gestionar los valores faltantes (MCAR / MAR / MNAR)
  • Validación cruzada
  • Curva de aprendizaje
  • Fundamentos de la limpieza de datos
  • Reducción de la dimensión mediante selección o transformación de variables
  • Métricas de rendimiento de un modelo: R², Accuracy, Precisión, Recall, F1-score, AUC, P-valor

Ejemplos de ejercicios prácticos (a título indicativo)

  • Carga, exploración, análisis, limpieza y primeras modelizaciones sobre un conjunto de datos

Día 2 – Machine Learning e IA: algoritmos

  • Los conceptos de Machine Learning y de IA
  • Datos supervisados y no supervisados: diferencias
  • Bibliotecas utilizadas: Scikit-learn, TensorFlow, PyTorch, Keras
  • Regresión
  • Modelos lineales
  • Clasificación
  • Naive Bayes
  • K-NN
  • K-Means clustering

Ejemplos de ejercicios prácticos (a título indicativo)

Implementación de los algoritmos estudiados según la finalidad buscada (regresión, clasificación, imputación de valores faltantes) utilizando las bibliotecas Scikit-learn y Keras

Día 3 – Machine Learning e IA: algoritmos (continuación)

  • DBScan
  • Árboles de decisión y de regresión
  • Support Vector Machines (SVM)
  • Redes neuronales y aprendizaje profundo (Deep Learning)
  • Redes convolucionales y redes recurrentes

Ejemplos de ejercicios prácticos (a título indicativo)

Modelizaciones avanzadas (DL, CNN, RNN) con optimización de las arquitecturas y de los hiperparámetros

Día 4 – Desarrollar con Spark

  • Introducción a Apache Spark
  • Machine Learning con Apache Spark MLlib

Ejemplos de ejercicios prácticos (a título indicativo)

  • Ejercicios de aplicación con Spark MLlib, Streaming, SQL y GraphFrames
  • Implementación de MLFlow para comparar modelos

Día 5 – Herramientas de visualización de datos (Dataviz)

  • Definición de Dataviz
  • Los actores de la Dataviz
  • Principios de la Dataviz
  • Bibliotecas Python de Dataviz
  • Tableau Desktop / Public
  • Microsoft Power BI

MLOps y arquitecturas serverless

  • Introducción a MLOps y a las arquitecturas serverless
  • Los enfoques DevOps y GitOps
  • Bases de la contenedorización y de la automatización
  • Las arquitecturas serverless
  • Desarrollo e implementación de aplicaciones MLOps en producción (demostración)
  • Monitorización y mejora continua de las aplicaciones MLOps (demostración)

Ejemplos de ejercicios prácticos (a título indicativo)

  • Uso de Tableau o MS Power BI
  • Uso de bibliotecas Python (Matplotlib, Seaborn)
  • Creación y ejecución de un pipeline MLOps con serving y monitorización del modelo

Nota: El contenido de este programa puede ser objeto de adaptación en función de los niveles, requisitos previos y necesidades de los participantes.

Metodología

Metodología de la formación en Big Data y Machine Learning

Formación impartida de forma presencial o a distancia (blended learning, e-learning, clase virtual, presencial a distancia).

El formador alterna entre método:

  • Demostrativo
  • Interrogativo
  • Activo (a través de ejercicios prácticos y/o simulaciones)

Recursos y medios

  • Ordenadores Mac o PC
  • Conexión a Internet de alta velocidad (fibra)
  • Pizarra blanca o paperboard
  • Videoproyector o pantalla táctil interactiva
  • Entornos de formación instalados en los puestos de trabajo o online
  • Materiales del curso y ejercicios

Evaluación de los aprendizajes

  • Durante la formación: a través de estudios de caso o ejercicios prácticos
  • Al final de la formación: a través de un cuestionario de autoevaluación

Bonificación Fundae

Esta formación es bonificable a través de FUNDAE para todas las empresas que cuenten con trabajadores en régimen general de la Seguridad Social y dispongan de crédito formativo. SKOLAE Formación gestiona todo el proceso administrativo necesario para que tu empresa pueda recuperar el importe invertido en la formación, siempre que se cumplan los requisitos legales y de comunicación establecidos por FUNDAE.

Formador

Profesional especializado en Big Data, Machine Learning e Inteligencia Artificial, con experiencia en el desarrollo de aplicaciones de Data Science utilizando Python y Apache Spark en entornos distribuidos.

Cuenta con trayectoria en el diseño, entrenamiento y optimización de modelos mediante bibliotecas como Scikit-learn, TensorFlow, PyTorch y Keras, así como en la implementación de soluciones de Machine Learning en producción mediante enfoques MLOps y arquitecturas serverless.

Ha participado en proyectos vinculados al tratamiento de grandes volúmenes de datos, programación paralela en clústeres, desarrollo de pipelines de datos y despliegue de modelos en entornos empresariales, combinando conocimientos técnicos con una visión aplicada al negocio.

Combina experiencia técnica con enfoque pedagógico, facilitando la comprensión de conceptos complejos como algoritmos de Machine Learning, Deep Learning o procesamiento distribuido mediante ejemplos prácticos, ejercicios guiados y casos reales.

¿Te gustó esta formación? Suscríbete a nuestra Newsletter pinchando aquí. También te animamos a seguirnos en LinkedInInstagram y Facebook y así estarás al día de todas nuestras novedades.

No disponible

¿Quieres hacer esta formación en tu empresa?

¡Pídenos una propuesta!