Abilways
Categorías }

Big Data: Desarrollo de Aplicaciones de Machine Learning e Inteligencia Artificial con Python y Spark

Abr

El Big Data y la Inteligencia Artificial están transformando la forma en la que las organizaciones analizan datos y desarrollan soluciones avanzadas. La capacidad de diseñar, entrenar y desplegar modelos de Machine Learning en entornos distribuidos es hoy una competencia clave.

En esta formación aprenderás a desarrollar aplicaciones de Machine Learning e Inteligencia Artificial con Python y Apache Spark, utilizando bibliotecas como Scikit-learn, TensorFlow o PyTorch, y aplicando conceptos clave como programación paralela, Data Science y MLOps.

Objetivos

Objetivos de la formación en desarrollo de aplicaciones de Machine Learning e IA con Big Data

Al final de esta formación será capaz de:

Desarrollar aplicaciones de Machine Learning y de IA (Inteligencia Artificial) con Spark y Python
Utilizar programación paralela en un clúster
Desarrollar y optimizar algoritmos estándar de Machine Learning y de IA
Utilizar bibliotecas Python para Machine Learning y la IA
Describir el ciclo de vida de un proyecto de Data Science

Público objetivo de la formación en Big Data y Machine Learning

Cualquier persona que desee adquirir competencias en el desarrollo de aplicaciones de Machine Learning y de IA (Inteligencia Artificial).

Requisitos previos de la formación en Big Data e IA

Tener conocimientos de matemáticas algebraicas para poder interpretar los algoritmos a implementar y conocer el lenguaje Python (se realizarán recordatorios durante la formación).

Programa

Programa de la formación en Big Data, Machine Learning e Inteligencia Artificial

Día 1 – Visión general del Big Data, del Machine Learning y de la IA

Introducción al Big Data y a la IA (Inteligencia Artificial): ¿de qué se trata?
Perspectivas ofrecidas por el Big Data y la IA
Los actores del Big Data y de la IA
Ejemplos prácticos
Las tecnologías implicadas
Las diferentes profesiones
Aspectos económicos (OPEX, CAPEX, TIR) del Cloud vs On-Premise
Demostración de aplicaciones

Revisiones sobre Data Science

Las bases del lenguaje Python
Modelización de las problemáticas mediante vectores y matrices
Probabilidades, estadística, estadística descriptiva y explicativa
Entropía, ganancia de información
Compromiso sesgo-complejidad
La maldición de la dimensión
Matriz de confusión
Gestionar los valores faltantes (MCAR / MAR / MNAR)
Validación cruzada
Curva de aprendizaje
Fundamentos de la limpieza de datos
Reducción de la dimensión mediante selección o transformación de variables
Métricas de rendimiento de un modelo: R², Accuracy, Precisión, Recall, F1-score, AUC, P-valor

Ejemplos de ejercicios prácticos (a título indicativo)

Carga, exploración, análisis, limpieza y primeras modelizaciones sobre un conjunto de datos

Día 2 – Machine Learning e IA: algoritmos

Los conceptos de Machine Learning y de IA
Datos supervisados y no supervisados: diferencias
Bibliotecas utilizadas: Scikit-learn, TensorFlow, PyTorch, Keras
Regresión
Modelos lineales
Clasificación
Naive Bayes
K-NN
K-Means clustering

Ejemplos de ejercicios prácticos (a título indicativo)

Implementación de los algoritmos estudiados según la finalidad buscada (regresión, clasificación, imputación de valores faltantes) utilizando las bibliotecas Scikit-learn y Keras

Día 3 – Machine Learning e IA: algoritmos (continuación)

DBScan
Árboles de decisión y de regresión
Support Vector Machines (SVM)
Redes neuronales y aprendizaje profundo (Deep Learning)
Redes convolucionales y redes recurrentes

Ejemplos de ejercicios prácticos (a título indicativo)

Modelizaciones avanzadas (DL, CNN, RNN) con optimización de las arquitecturas y de los hiperparámetros

Día 4 – Desarrollar con Spark

Introducción a Apache Spark
Machine Learning con Apache Spark MLlib

Ejemplos de ejercicios prácticos (a título indicativo)

Ejercicios de aplicación con Spark MLlib, Streaming, SQL y GraphFrames
Implementación de MLFlow para comparar modelos

Día 5 – Herramientas de visualización de datos (Dataviz)

Definición de Dataviz
Los actores de la Dataviz
Principios de la Dataviz
Bibliotecas Python de Dataviz
Tableau Desktop / Public
Microsoft Power BI

MLOps y arquitecturas serverless

Introducción a MLOps y a las arquitecturas serverless
Los enfoques DevOps y GitOps
Bases de la contenedorización y de la automatización
Las arquitecturas serverless
Desarrollo e implementación de aplicaciones MLOps en producción (demostración)
Monitorización y mejora continua de las aplicaciones MLOps (demostración)

Ejemplos de ejercicios prácticos (a título indicativo)

Uso de Tableau o MS Power BI
Uso de bibliotecas Python (Matplotlib, Seaborn)
Creación y ejecución de un pipeline MLOps con serving y monitorización del modelo

Nota: El contenido de este programa puede ser objeto de adaptación en función de los niveles, requisitos previos y necesidades de los participantes.

Tratamiento de datos en tiempo real con Apache Spark Streaming
Consultas SQL con Apache Spark SQL
Modelización de redes sociales con grafos utilizando Apache Spark GraphFrames
Demostración de trabajo colaborativo con MLFlow

Duración

5 días

Metodología

Metodología de la formación en Big Data y Machine Learning

Formación impartida de forma presencial o a distancia (blended learning, e-learning, clase virtual, presencial a distancia).

El formador alterna entre método:

Demostrativo
Interrogativo
Activo (a través de ejercicios prácticos y/o simulaciones)

Recursos y medios

Ordenadores Mac o PC
Conexión a Internet de alta velocidad (fibra)
Pizarra blanca o paperboard
Videoproyector o pantalla táctil interactiva
Entornos de formación instalados en los puestos de trabajo o online
Materiales del curso y ejercicios

Evaluación de los aprendizajes

Durante la formación: a través de estudios de caso o ejercicios prácticos
Al final de la formación: a través de un cuestionario de autoevaluación

Bonificación Fundae

Esta formación es bonificable a través de FUNDAE para todas las empresas que cuenten con trabajadores en régimen general de la Seguridad Social y dispongan de crédito formativo. SKOLAE Formación gestiona todo el proceso administrativo necesario para que tu empresa pueda recuperar el importe invertido en la formación, siempre que se cumplan los requisitos legales y de comunicación establecidos por FUNDAE.

Formador

Profesional especializado en Big Data, Machine Learning e Inteligencia Artificial, con experiencia en el desarrollo de aplicaciones de Data Science utilizando Python y Apache Spark en entornos distribuidos.

Cuenta con trayectoria en el diseño, entrenamiento y optimización de modelos mediante bibliotecas como Scikit-learn, TensorFlow, PyTorch y Keras, así como en la implementación de soluciones de Machine Learning en producción mediante enfoques MLOps y arquitecturas serverless.

Ha participado en proyectos vinculados al tratamiento de grandes volúmenes de datos, programación paralela en clústeres, desarrollo de pipelines de datos y despliegue de modelos en entornos empresariales, combinando conocimientos técnicos con una visión aplicada al negocio.

Combina experiencia técnica con enfoque pedagógico, facilitando la comprensión de conceptos complejos como algoritmos de Machine Learning, Deep Learning o procesamiento distribuido mediante ejemplos prácticos, ejercicios guiados y casos reales.

Objetivos

Objetivos de la formación en desarrollo de aplicaciones de Machine Learning e IA con Big Data

Al final de esta formación será capaz de:

Desarrollar aplicaciones de Machine Learning y de IA (Inteligencia Artificial) con Spark y Python
Utilizar programación paralela en un clúster
Desarrollar y optimizar algoritmos estándar de Machine Learning y de IA
Utilizar bibliotecas Python para Machine Learning y la IA
Describir el ciclo de vida de un proyecto de Data Science

Público objetivo de la formación en Big Data y Machine Learning

Cualquier persona que desee adquirir competencias en el desarrollo de aplicaciones de Machine Learning y de IA (Inteligencia Artificial).

Requisitos previos de la formación en Big Data e IA

Tener conocimientos de matemáticas algebraicas para poder interpretar los algoritmos a implementar y conocer el lenguaje Python (se realizarán recordatorios durante la formación).

Duración

5 días

Programa

Programa de la formación en Big Data, Machine Learning e Inteligencia Artificial

Día 1 – Visión general del Big Data, del Machine Learning y de la IA

Introducción al Big Data y a la IA (Inteligencia Artificial): ¿de qué se trata?
Perspectivas ofrecidas por el Big Data y la IA
Los actores del Big Data y de la IA
Ejemplos prácticos
Las tecnologías implicadas
Las diferentes profesiones
Aspectos económicos (OPEX, CAPEX, TIR) del Cloud vs On-Premise
Demostración de aplicaciones

Revisiones sobre Data Science

Las bases del lenguaje Python
Modelización de las problemáticas mediante vectores y matrices
Probabilidades, estadística, estadística descriptiva y explicativa
Entropía, ganancia de información
Compromiso sesgo-complejidad
La maldición de la dimensión
Matriz de confusión
Gestionar los valores faltantes (MCAR / MAR / MNAR)
Validación cruzada
Curva de aprendizaje
Fundamentos de la limpieza de datos
Reducción de la dimensión mediante selección o transformación de variables
Métricas de rendimiento de un modelo: R², Accuracy, Precisión, Recall, F1-score, AUC, P-valor

Ejemplos de ejercicios prácticos (a título indicativo)

Carga, exploración, análisis, limpieza y primeras modelizaciones sobre un conjunto de datos

Día 2 – Machine Learning e IA: algoritmos

Los conceptos de Machine Learning y de IA
Datos supervisados y no supervisados: diferencias
Bibliotecas utilizadas: Scikit-learn, TensorFlow, PyTorch, Keras
Regresión
Modelos lineales
Clasificación
Naive Bayes
K-NN
K-Means clustering

Ejemplos de ejercicios prácticos (a título indicativo)

Implementación de los algoritmos estudiados según la finalidad buscada (regresión, clasificación, imputación de valores faltantes) utilizando las bibliotecas Scikit-learn y Keras

Día 3 – Machine Learning e IA: algoritmos (continuación)

DBScan
Árboles de decisión y de regresión
Support Vector Machines (SVM)
Redes neuronales y aprendizaje profundo (Deep Learning)
Redes convolucionales y redes recurrentes

Ejemplos de ejercicios prácticos (a título indicativo)

Modelizaciones avanzadas (DL, CNN, RNN) con optimización de las arquitecturas y de los hiperparámetros

Día 4 – Desarrollar con Spark

Introducción a Apache Spark
Machine Learning con Apache Spark MLlib

Ejemplos de ejercicios prácticos (a título indicativo)

Ejercicios de aplicación con Spark MLlib, Streaming, SQL y GraphFrames
Implementación de MLFlow para comparar modelos

Día 5 – Herramientas de visualización de datos (Dataviz)

Definición de Dataviz
Los actores de la Dataviz
Principios de la Dataviz
Bibliotecas Python de Dataviz
Tableau Desktop / Public
Microsoft Power BI

MLOps y arquitecturas serverless

Introducción a MLOps y a las arquitecturas serverless
Los enfoques DevOps y GitOps
Bases de la contenedorización y de la automatización
Las arquitecturas serverless
Desarrollo e implementación de aplicaciones MLOps en producción (demostración)
Monitorización y mejora continua de las aplicaciones MLOps (demostración)

Ejemplos de ejercicios prácticos (a título indicativo)

Uso de Tableau o MS Power BI
Uso de bibliotecas Python (Matplotlib, Seaborn)
Creación y ejecución de un pipeline MLOps con serving y monitorización del modelo

Nota: El contenido de este programa puede ser objeto de adaptación en función de los niveles, requisitos previos y necesidades de los participantes.

Metodología

Metodología de la formación en Big Data y Machine Learning

Formación impartida de forma presencial o a distancia (blended learning, e-learning, clase virtual, presencial a distancia).

El formador alterna entre método:

Demostrativo
Interrogativo
Activo (a través de ejercicios prácticos y/o simulaciones)

Recursos y medios

Ordenadores Mac o PC
Conexión a Internet de alta velocidad (fibra)
Pizarra blanca o paperboard
Videoproyector o pantalla táctil interactiva
Entornos de formación instalados en los puestos de trabajo o online
Materiales del curso y ejercicios

Evaluación de los aprendizajes

Durante la formación: a través de estudios de caso o ejercicios prácticos
Al final de la formación: a través de un cuestionario de autoevaluación

Bonificación Fundae

Formador

¿Te gustó esta formación? Suscríbete a nuestra Newsletter pinchando aquí. También te animamos a seguirnos en LinkedIn, Instagram y Facebook y así estarás al día de todas nuestras novedades.

No disponible

¿Quieres hacer esta formación en tu empresa?

¡Pídenos una propuesta!

Big Data: Desarrollo de Aplicaciones de Machine Learning e Inteligencia Artificial con Python y Spark

Objetivos de la formación en desarrollo de aplicaciones de Machine Learning e IA con Big Data

Público objetivo de la formación en Big Data y Machine Learning

Requisitos previos de la formación en Big Data e IA

Programa de la formación en Big Data, Machine Learning e Inteligencia Artificial

Día 1 – Visión general del Big Data, del Machine Learning y de la IA

Revisiones sobre Data Science

Ejemplos de ejercicios prácticos (a título indicativo)

Día 2 – Machine Learning e IA: algoritmos

Ejemplos de ejercicios prácticos (a título indicativo)

Día 3 – Machine Learning e IA: algoritmos (continuación)

Ejemplos de ejercicios prácticos (a título indicativo)

Día 4 – Desarrollar con Spark

Ejemplos de ejercicios prácticos (a título indicativo)

Día 5 – Herramientas de visualización de datos (Dataviz)

MLOps y arquitecturas serverless

Ejemplos de ejercicios prácticos (a título indicativo)

Metodología de la formación en Big Data y Machine Learning

Recursos y medios

Evaluación de los aprendizajes

Objetivos

Objetivos de la formación en desarrollo de aplicaciones de Machine Learning e IA con Big Data

Público objetivo de la formación en Big Data y Machine Learning

Requisitos previos de la formación en Big Data e IA

Duración

Programa

Programa de la formación en Big Data, Machine Learning e Inteligencia Artificial

Día 1 – Visión general del Big Data, del Machine Learning y de la IA

Revisiones sobre Data Science

Ejemplos de ejercicios prácticos (a título indicativo)

Día 2 – Machine Learning e IA: algoritmos

Ejemplos de ejercicios prácticos (a título indicativo)

Día 3 – Machine Learning e IA: algoritmos (continuación)

Ejemplos de ejercicios prácticos (a título indicativo)

Día 4 – Desarrollar con Spark

Ejemplos de ejercicios prácticos (a título indicativo)

Día 5 – Herramientas de visualización de datos (Dataviz)

MLOps y arquitecturas serverless

Ejemplos de ejercicios prácticos (a título indicativo)

Metodología

Metodología de la formación en Big Data y Machine Learning

Recursos y medios

Evaluación de los aprendizajes

Bonificación Fundae

Formador

Cursos relacionados