Casos de Éxito | Blog | Newsletter | Contacto
Big Data: Desarrollo de Aplicaciones de Machine Learning e Inteligencia Artificial con Python y Spark
- Home
- Formaciones
- Inteligencia Artificial
- Big Data Machine Learning Python Spark
-
Abilways
- }
El Big Data y la Inteligencia Artificial están transformando la forma en la que las organizaciones analizan datos y desarrollan soluciones avanzadas. La capacidad de diseñar, entrenar y desplegar modelos de Machine Learning en entornos distribuidos es hoy una competencia clave.
En esta formación aprenderás a desarrollar aplicaciones de Machine Learning e Inteligencia Artificial con Python y Apache Spark, utilizando bibliotecas como Scikit-learn, TensorFlow o PyTorch, y aplicando conceptos clave como programación paralela, Data Science y MLOps.
Objetivos de la formación en desarrollo de aplicaciones de Machine Learning e IA con Big Data
Al final de esta formación será capaz de:
- Desarrollar aplicaciones de Machine Learning y de IA (Inteligencia Artificial) con Spark y Python
- Utilizar programación paralela en un clúster
- Desarrollar y optimizar algoritmos estándar de Machine Learning y de IA
- Utilizar bibliotecas Python para Machine Learning y la IA
- Describir el ciclo de vida de un proyecto de Data Science
Público objetivo de la formación en Big Data y Machine Learning
Cualquier persona que desee adquirir competencias en el desarrollo de aplicaciones de Machine Learning y de IA (Inteligencia Artificial).
Requisitos previos de la formación en Big Data e IA
Tener conocimientos de matemáticas algebraicas para poder interpretar los algoritmos a implementar y conocer el lenguaje Python (se realizarán recordatorios durante la formación).
Programa de la formación en Big Data, Machine Learning e Inteligencia Artificial
Día 1 – Visión general del Big Data, del Machine Learning y de la IA
- Introducción al Big Data y a la IA (Inteligencia Artificial): ¿de qué se trata?
- Perspectivas ofrecidas por el Big Data y la IA
- Los actores del Big Data y de la IA
- Ejemplos prácticos
- Las tecnologías implicadas
- Las diferentes profesiones
- Aspectos económicos (OPEX, CAPEX, TIR) del Cloud vs On-Premise
- Demostración de aplicaciones
Revisiones sobre Data Science
- Las bases del lenguaje Python
- Modelización de las problemáticas mediante vectores y matrices
- Probabilidades, estadística, estadística descriptiva y explicativa
- Entropía, ganancia de información
- Compromiso sesgo-complejidad
- La maldición de la dimensión
- Matriz de confusión
- Gestionar los valores faltantes (MCAR / MAR / MNAR)
- Validación cruzada
- Curva de aprendizaje
- Fundamentos de la limpieza de datos
- Reducción de la dimensión mediante selección o transformación de variables
- Métricas de rendimiento de un modelo: R², Accuracy, Precisión, Recall, F1-score, AUC, P-valor
Ejemplos de ejercicios prácticos (a título indicativo)
- Carga, exploración, análisis, limpieza y primeras modelizaciones sobre un conjunto de datos
Día 2 – Machine Learning e IA: algoritmos
- Los conceptos de Machine Learning y de IA
- Datos supervisados y no supervisados: diferencias
- Bibliotecas utilizadas: Scikit-learn, TensorFlow, PyTorch, Keras
- Regresión
- Modelos lineales
- Clasificación
- Naive Bayes
- K-NN
- K-Means clustering
Ejemplos de ejercicios prácticos (a título indicativo)
Implementación de los algoritmos estudiados según la finalidad buscada (regresión, clasificación, imputación de valores faltantes) utilizando las bibliotecas Scikit-learn y Keras
Día 3 – Machine Learning e IA: algoritmos (continuación)
- DBScan
- Árboles de decisión y de regresión
- Support Vector Machines (SVM)
- Redes neuronales y aprendizaje profundo (Deep Learning)
- Redes convolucionales y redes recurrentes
Ejemplos de ejercicios prácticos (a título indicativo)
Modelizaciones avanzadas (DL, CNN, RNN) con optimización de las arquitecturas y de los hiperparámetros
Día 4 – Desarrollar con Spark
- Introducción a Apache Spark
- Machine Learning con Apache Spark MLlib
Ejemplos de ejercicios prácticos (a título indicativo)
- Ejercicios de aplicación con Spark MLlib, Streaming, SQL y GraphFrames
- Implementación de MLFlow para comparar modelos
Día 5 – Herramientas de visualización de datos (Dataviz)
- Definición de Dataviz
- Los actores de la Dataviz
- Principios de la Dataviz
- Bibliotecas Python de Dataviz
- Tableau Desktop / Public
- Microsoft Power BI
MLOps y arquitecturas serverless
- Introducción a MLOps y a las arquitecturas serverless
- Los enfoques DevOps y GitOps
- Bases de la contenedorización y de la automatización
- Las arquitecturas serverless
- Desarrollo e implementación de aplicaciones MLOps en producción (demostración)
- Monitorización y mejora continua de las aplicaciones MLOps (demostración)
Ejemplos de ejercicios prácticos (a título indicativo)
- Uso de Tableau o MS Power BI
- Uso de bibliotecas Python (Matplotlib, Seaborn)
- Creación y ejecución de un pipeline MLOps con serving y monitorización del modelo
Nota: El contenido de este programa puede ser objeto de adaptación en función de los niveles, requisitos previos y necesidades de los participantes.
- Tratamiento de datos en tiempo real con Apache Spark Streaming
- Consultas SQL con Apache Spark SQL
- Modelización de redes sociales con grafos utilizando Apache Spark GraphFrames
- Demostración de trabajo colaborativo con MLFlow
Metodología de la formación en Big Data y Machine Learning
Formación impartida de forma presencial o a distancia (blended learning, e-learning, clase virtual, presencial a distancia).
El formador alterna entre método:
- Demostrativo
- Interrogativo
- Activo (a través de ejercicios prácticos y/o simulaciones)
Recursos y medios
- Ordenadores Mac o PC
- Conexión a Internet de alta velocidad (fibra)
- Pizarra blanca o paperboard
- Videoproyector o pantalla táctil interactiva
- Entornos de formación instalados en los puestos de trabajo o online
- Materiales del curso y ejercicios
Evaluación de los aprendizajes
- Durante la formación: a través de estudios de caso o ejercicios prácticos
- Al final de la formación: a través de un cuestionario de autoevaluación
Esta formación es bonificable a través de FUNDAE para todas las empresas que cuenten con trabajadores en régimen general de la Seguridad Social y dispongan de crédito formativo. SKOLAE Formación gestiona todo el proceso administrativo necesario para que tu empresa pueda recuperar el importe invertido en la formación, siempre que se cumplan los requisitos legales y de comunicación establecidos por FUNDAE.
Profesional especializado en Big Data, Machine Learning e Inteligencia Artificial, con experiencia en el desarrollo de aplicaciones de Data Science utilizando Python y Apache Spark en entornos distribuidos.
Cuenta con trayectoria en el diseño, entrenamiento y optimización de modelos mediante bibliotecas como Scikit-learn, TensorFlow, PyTorch y Keras, así como en la implementación de soluciones de Machine Learning en producción mediante enfoques MLOps y arquitecturas serverless.
Ha participado en proyectos vinculados al tratamiento de grandes volúmenes de datos, programación paralela en clústeres, desarrollo de pipelines de datos y despliegue de modelos en entornos empresariales, combinando conocimientos técnicos con una visión aplicada al negocio.
Combina experiencia técnica con enfoque pedagógico, facilitando la comprensión de conceptos complejos como algoritmos de Machine Learning, Deep Learning o procesamiento distribuido mediante ejemplos prácticos, ejercicios guiados y casos reales.
Objetivos
Objetivos de la formación en desarrollo de aplicaciones de Machine Learning e IA con Big Data
Al final de esta formación será capaz de:
- Desarrollar aplicaciones de Machine Learning y de IA (Inteligencia Artificial) con Spark y Python
- Utilizar programación paralela en un clúster
- Desarrollar y optimizar algoritmos estándar de Machine Learning y de IA
- Utilizar bibliotecas Python para Machine Learning y la IA
- Describir el ciclo de vida de un proyecto de Data Science
Público objetivo de la formación en Big Data y Machine Learning
Cualquier persona que desee adquirir competencias en el desarrollo de aplicaciones de Machine Learning y de IA (Inteligencia Artificial).
Requisitos previos de la formación en Big Data e IA
Tener conocimientos de matemáticas algebraicas para poder interpretar los algoritmos a implementar y conocer el lenguaje Python (se realizarán recordatorios durante la formación).
Duración
Programa
Programa de la formación en Big Data, Machine Learning e Inteligencia Artificial
Día 1 – Visión general del Big Data, del Machine Learning y de la IA
- Introducción al Big Data y a la IA (Inteligencia Artificial): ¿de qué se trata?
- Perspectivas ofrecidas por el Big Data y la IA
- Los actores del Big Data y de la IA
- Ejemplos prácticos
- Las tecnologías implicadas
- Las diferentes profesiones
- Aspectos económicos (OPEX, CAPEX, TIR) del Cloud vs On-Premise
- Demostración de aplicaciones
Revisiones sobre Data Science
- Las bases del lenguaje Python
- Modelización de las problemáticas mediante vectores y matrices
- Probabilidades, estadística, estadística descriptiva y explicativa
- Entropía, ganancia de información
- Compromiso sesgo-complejidad
- La maldición de la dimensión
- Matriz de confusión
- Gestionar los valores faltantes (MCAR / MAR / MNAR)
- Validación cruzada
- Curva de aprendizaje
- Fundamentos de la limpieza de datos
- Reducción de la dimensión mediante selección o transformación de variables
- Métricas de rendimiento de un modelo: R², Accuracy, Precisión, Recall, F1-score, AUC, P-valor
Ejemplos de ejercicios prácticos (a título indicativo)
- Carga, exploración, análisis, limpieza y primeras modelizaciones sobre un conjunto de datos
Día 2 – Machine Learning e IA: algoritmos
- Los conceptos de Machine Learning y de IA
- Datos supervisados y no supervisados: diferencias
- Bibliotecas utilizadas: Scikit-learn, TensorFlow, PyTorch, Keras
- Regresión
- Modelos lineales
- Clasificación
- Naive Bayes
- K-NN
- K-Means clustering
Ejemplos de ejercicios prácticos (a título indicativo)
Implementación de los algoritmos estudiados según la finalidad buscada (regresión, clasificación, imputación de valores faltantes) utilizando las bibliotecas Scikit-learn y Keras
Día 3 – Machine Learning e IA: algoritmos (continuación)
- DBScan
- Árboles de decisión y de regresión
- Support Vector Machines (SVM)
- Redes neuronales y aprendizaje profundo (Deep Learning)
- Redes convolucionales y redes recurrentes
Ejemplos de ejercicios prácticos (a título indicativo)
Modelizaciones avanzadas (DL, CNN, RNN) con optimización de las arquitecturas y de los hiperparámetros
Día 4 – Desarrollar con Spark
- Introducción a Apache Spark
- Machine Learning con Apache Spark MLlib
Ejemplos de ejercicios prácticos (a título indicativo)
- Ejercicios de aplicación con Spark MLlib, Streaming, SQL y GraphFrames
- Implementación de MLFlow para comparar modelos
Día 5 – Herramientas de visualización de datos (Dataviz)
- Definición de Dataviz
- Los actores de la Dataviz
- Principios de la Dataviz
- Bibliotecas Python de Dataviz
- Tableau Desktop / Public
- Microsoft Power BI
MLOps y arquitecturas serverless
- Introducción a MLOps y a las arquitecturas serverless
- Los enfoques DevOps y GitOps
- Bases de la contenedorización y de la automatización
- Las arquitecturas serverless
- Desarrollo e implementación de aplicaciones MLOps en producción (demostración)
- Monitorización y mejora continua de las aplicaciones MLOps (demostración)
Ejemplos de ejercicios prácticos (a título indicativo)
- Uso de Tableau o MS Power BI
- Uso de bibliotecas Python (Matplotlib, Seaborn)
- Creación y ejecución de un pipeline MLOps con serving y monitorización del modelo
Nota: El contenido de este programa puede ser objeto de adaptación en función de los niveles, requisitos previos y necesidades de los participantes.
Metodología
Metodología de la formación en Big Data y Machine Learning
Formación impartida de forma presencial o a distancia (blended learning, e-learning, clase virtual, presencial a distancia).
El formador alterna entre método:
- Demostrativo
- Interrogativo
- Activo (a través de ejercicios prácticos y/o simulaciones)
Recursos y medios
- Ordenadores Mac o PC
- Conexión a Internet de alta velocidad (fibra)
- Pizarra blanca o paperboard
- Videoproyector o pantalla táctil interactiva
- Entornos de formación instalados en los puestos de trabajo o online
- Materiales del curso y ejercicios
Evaluación de los aprendizajes
- Durante la formación: a través de estudios de caso o ejercicios prácticos
- Al final de la formación: a través de un cuestionario de autoevaluación
Bonificación Fundae
Esta formación es bonificable a través de FUNDAE para todas las empresas que cuenten con trabajadores en régimen general de la Seguridad Social y dispongan de crédito formativo. SKOLAE Formación gestiona todo el proceso administrativo necesario para que tu empresa pueda recuperar el importe invertido en la formación, siempre que se cumplan los requisitos legales y de comunicación establecidos por FUNDAE.
Formador
Profesional especializado en Big Data, Machine Learning e Inteligencia Artificial, con experiencia en el desarrollo de aplicaciones de Data Science utilizando Python y Apache Spark en entornos distribuidos.
Cuenta con trayectoria en el diseño, entrenamiento y optimización de modelos mediante bibliotecas como Scikit-learn, TensorFlow, PyTorch y Keras, así como en la implementación de soluciones de Machine Learning en producción mediante enfoques MLOps y arquitecturas serverless.
Ha participado en proyectos vinculados al tratamiento de grandes volúmenes de datos, programación paralela en clústeres, desarrollo de pipelines de datos y despliegue de modelos en entornos empresariales, combinando conocimientos técnicos con una visión aplicada al negocio.
Combina experiencia técnica con enfoque pedagógico, facilitando la comprensión de conceptos complejos como algoritmos de Machine Learning, Deep Learning o procesamiento distribuido mediante ejemplos prácticos, ejercicios guiados y casos reales.








