Ruta operacional
27 minutos de lectura
- Computación y sistemas - Autómatas y modelos de cómputo - Máquinas de Turing
- Autómatas finitos deterministas y no deterministas (DFA / NFA)
- Autómatas con pila (PDA) y lenguajes libres de contexto
- Gramáticas formales y jerarquía de Chomsky
- Computabilidad y decidibilidad
- Complejidad computacional
- Reducciones y completitud
- Computación aproximada y aleatorizada
- Lógica y especificación formal de cómputo
- Computación cuántica como modelo alternativo
- Límites físicos del cómputo
 
- Arquitectura de computadores - Modelos de arquitectura (von Neumann, Harvard)
- CPU y microarquitectura
- Jerarquía de memoria
- Conjuntos de instrucciones (ISA)
- Paralelismo a nivel de instrucción
- Arquitecturas multinúcleo y multiprocesador
- Aceleradores de propósito específico
- Interconexiones y buses del sistema
- Entrada / Salida (I/O) y controladores
- Gestión de energía y rendimiento térmico
 
- Sistemas operativos (procesos, hilos, memoria, planificación) - Diseño del núcleo (kernel)
- Procesos
- Hilos (threads)
- Planificación (CPU scheduling)
- Gestión de memoria
- Sincronización y concurrencia
- Comunicación entre procesos (IPC)
- Sistema de archivos y VFS (Virtual File System)
- Gestión de E/S y controladores
- Seguridad y aislamiento
- Syscalls y modos de ejecución
- Contabilidad, monitoreo y métricas
 
- Virtualización y contenedorización - Conceptos de virtualización
- Hipervisores
- Virtualización de hardware vs virtualización a nivel de SO
- Contenedores
- Namespaces y cgroups
- Construcción y gestión de imágenes
- Redes virtuales y SDN (Software-Defined Networking)
- Orquestación de contenedores
- Seguridad y aislamiento multi-tenant
- Observabilidad y debugging en entornos virtualizados
 
- Almacenamiento distribuido y sistemas de archivos - Modelos de almacenamiento
- Sistemas de archivos locales
- Sistemas de archivos distribuidos
- Almacenamiento en bloques, archivos y objetos
- Replicación y durabilidad
- Particionado y sharding
- Consistencia y coherencia
- Metadatos y consenso
- Recuperación ante fallos y journaling
- Caching y jerarquización de almacenamiento (tiering)
- Rendimiento y latencia en I/O
 
- Redes y protocolos - Fundamentos de redes (modelo OSI y TCP/IP)
- Direccionamiento y ruteo
- Capa de enlace de datos
- Capa de red
- Capa de transporte
- Capa de aplicación
- Control de congestión y calidad de servicio (QoS)
- Seguridad de red
- Redes definidas por software (SDN) y virtualización de red
- Observabilidad y troubleshooting de red
- Redes de baja latencia
- SDN (Software Defined Networking)
- Redes distribuidas
- Redes tolerantes a fallo / entornos hostiles
- Transporte moderno
 
- Modelos cliente-servidor y peer-to-peer - Arquitectura cliente-servidor tradicional
- Stateless vs stateful
- Microservicios y servicios desacoplados
- Comunicación síncrona vs asíncrona
- Pub/Sub y colas de mensajes
- Peer-to-peer
- Coordinación y descubrimiento de servicios
- Patrones de resiliencia
- Versionado y compatibilidad de interfaces
 
- Consistencia y tolerancia a fallos - Teorema CAP y trade-offs
- Modelos de consistencia
- Relojes y ordenamiento de eventos
- Consenso y replicación
- Alta disponibilidad y failover
- Tolerancia a fallos bizantinos
- Estrategias de recuperación
- Diseño de sistemas idempotentes
 
- Algoritmos distribuidos - Modelos de comunicación
- Difusión y broadcast
- Elección de líder
- Sincronización de relojes
- Exclusión mutua distribuida
- Consenso y commit distribuido
- Detección de fallos
- Toma de snapshots globales
- Hashing consistente y particionamiento de carga
- Algoritmos tolerantes a bizantinos
 
- Computación paralela y vectorizada - Modelos de paralelismo
- Paralelismo a nivel de datos (SIMD / SIMT)
- Paralelismo a nivel de tareas (MIMD)
- Memoria compartida vs memoria distribuida
- Sincronización y coordinación
- Paralelismo en GPU
- Rendimiento y escalabilidad
- Patrones paralelos comunes
- Herramientas y entornos de programación paralela
- Problemas típicos de concurrencia y rendimiento
 
- Computación en la nube y edge computing - Modelos de servicio (IaaS, PaaS, SaaS, FaaS)
- Modelos de despliegue (nube pública, privada, híbrida, multicloud)
- Infraestructura como código e infraestructura declarativa
- Automatización, orquestación y autoescalado
- Observabilidad en nubes distribuidas
- Serverless y FaaS
- Edge computing
- Seguridad, cumplimiento y gobernanza
- Gestión de costos y optimización
- Fiabilidad y continuidad operativa
 
- Sistemas embebidos y RTOS - Fundamentos de sistemas embebidos
- Sistemas de tiempo real
- RTOS comunes y arquitectura
- Confiabilidad y seguridad funcional
- Integración con sistemas mayores
 
- Balanceo de carga y redes de distribución de contenido (CDN) - Balanceadores de carga (L4 / L7)
- Estrategias de distribución de tráfico
- Health checks y failover
- Anycast y enrutamiento geográfico
- CDNs (Content Delivery Networks)
- Optimización de entrega de contenido
- Mitigación de ataques y protección DDoS
- Observabilidad y control de tráfico
- Service mesh y proxys inteligentes
 
- Modelos de escalabilidad - Escalamiento vertical vs horizontal
- Elasticidad y autoescalado
- Desacoplamiento mediante colas y eventos
- Sharding y particionado de datos
- Replicación geográfica y multi-región
- Caching en múltiples niveles
- Aislamiento de recursos y multitenancy
- Diseño sin punto único de falla
- Backpressure y control de flujo
- Observabilidad y autosanación
- Optimización costo / rendimiento
- Evolución arquitectónica a escala
 
 
- Práctica del desarrollador - Linux, entornos y automatización - Fundamentos de sistemas tipo Unix
- Comandos esenciales de línea de comando
- Gestión de paquetes y entornos del sistema
- Servicios del sistema, tareas programadas y demonios
- Variables de entorno y configuración
- Supervisión de procesos y recursos
- Redes y puertos
- Seguridad y control de acceso
- Automatización y scripting en la línea de comando
- Personalización del entorno de trabajo
- Diagnóstico de rendimiento
- Auditoría del sistema y logs
 
- Fundamentos de lenguajes de programación - Compiladores, interpretes y construcción de lenguajes
- Diseño de lenguajes
- Sintaxis y estructuras básicas
- Tipos de datos y abstracción de datos
- Control de flujo (condicionales, bucles, manejo de ramificaciones)
- Funciones, cierres y paso de datos
- Paradigmas funcionales
- Programación orientada a objetos (clases, interfaces, herencia, composición)
- Organización en módulos y paquetes
- Tipado estático y anotaciones de tipo
- Manejo de errores y excepciones
- Gestión estructurada de recursos (por ejemplo, scopes y contextos controlados)
- Iteradores, generadores y secuencias consumibles
- Metaprogramación y reflexión
- Serialización y deserialización de estructuras
- Estilo, convenciones y mantenibilidad del código
 
- Herramientas y productividad técnica - Entornos aislados y gestión de dependencias
- Control de versiones de configuraciones y datos
- Plantillas de proyectos y generación de esqueletos de servicio
- Ejecutores de tareas y automatización repetible (scripts, makefiles, job runners)
- Documentación viva y navegable (documentación generada y verificada automáticamente)
- Creación de herramientas de línea de comando para flujos internos
- Integración y configuración avanzada del entorno de desarrollo (editores, IDEs)
- Perfilado y depuración interactiva
- Chequeo estático de tipos y análisis estático
- Formateo automático y validaciones previas al commit
- Plantillas de integración continua y entrega continua
- Entornos de desarrollo reproducibles y remotos
 
- Control de versiones y colaboración - Fundamentos de control de versiones distribuido
- Estrategias de ramificación (por ejemplo, trunk-based, release branches)
- Rebase, merge, cherry-pick y manejo de trabajo en paralelo
- Resolución de conflictos
- Convenciones de commits y gestión semántica de versiones
- Versionado semántico y etiquetado de lanzamientos
- Gestión de submódulos, monorepos y multi-repos
- Hooks y automatización del flujo de trabajo
- Integración con revisión de código e integración continua
- Políticas de revisión y ramas protegidas
- Auditoría del historial y trazabilidad de cambios
 
 
- Diseño y software - Diseño y arquitectura de software - Principios de diseño orientado a mantenibilidad
- Principios como evitar repetición innecesaria y mantener la simplicidad
- Patrones de diseño (creacionales, estructurales y de comportamiento)
- Arquitectura en capas
- Arquitectura limpia
- Arquitectura hexagonal y separación de puertos/adaptadores
- Diseño guiado por el dominio (Domain-Driven Design)
- Monolitos modulares y microservicios
- Arquitecturas dirigidas por eventos
- Versionado de interfaces y ciclos de vida de APIs
- Documentación técnica orientada a desarrolladores y mantenimiento
- Modularización y empaquetado de componentes reutilizables
 
- Algoritmos y estructuras de datos - Complejidad temporal y espacial (notación asintótica)
- Análisis de eficiencia algorítmica
- Estructuras lineales (listas, pilas, colas, colas dobles)
- Árboles, montículos, tries y estructuras jerárquicas
- Grafos
- Hashing y tablas hash
- Algoritmos de ordenamiento y búsqueda
- Recursividad y divide y vencerás
- Programación dinámica y memoización
- Algoritmos de concurrencia y sincronización
- Estructuras de datos inmutables o persistentes
- Algoritmos probabilísticos y aproximados
 
- Procesos de ingeniería de software - Requisitos de software
- Análisis, especificación y trazabilidad de requisitos
- Diseño de software
- Construcción y estándares de codificación
- Verificación y validación
- Mantenimiento evolutivo y correctivo
- Gestión de la configuración
- Ingeniería de calidad de software
- Procesos de desarrollo
- Métricas de productividad y calidad del software
- Herramientas de soporte al ciclo de vida del software
- Mejora continua de procesos y madurez operativa
 
 
- Backend y servicios - Frameworks web y diseño de APIs - Tipos y arquitecturas web
- Comunicación bidireccional y tiempo real (por ejemplo, sockets y streaming)
- Middleware, interceptores y filtros
- Validación y serialización de datos de entrada y salida
- Autenticación y autorización a nivel de servicio
- Limitación de tasa, paginación y control de abuso
- Versionado de APIs
- Especificaciones y documentación de APIs (por ejemplo, contratos máquina-legibles)
 
- Bases de datos y persistencia - Lenguajes de consulta estructurados
- Modelado relacional
- Normalización y desnormalización
- Transacciones, atomicidad y aislamiento
- Índices, vistas y disparadores
- Procedimientos almacenados y lógica en base de datos
- Mapeo objeto-relacional y capas de acceso a datos
- Migraciones estructuradas y controladas de esquema
- Pools de conexiones y eficiencia de acceso concurrente
- Almacenamiento no relacional
- Motores de búsqueda y consulta de texto libre
- Almacenamiento analítico y sistemas orientados a consultas de negocio
- Replicación, particionamiento y alta disponibilidad
- Integridad referencial y consistencia eventual
 
- Integraciones y comunicación entre servicios - Mensajería asíncrona y colas de mensajes
- RPC eficiente y contratos binarios
- Webhooks, notificaciones y callbacks externos
- Integración con servicios de terceros
- Estrategias de reintento y colas de mensajes muertos
- Serialización binaria y formatos compactos
- Arquitecturas basadas en eventos y event sourcing
- Modelos de publicación/suscripción
- Streaming de datos en tiempo real y captura de cambios
 
- Arquitecturas distribuidas y microservicios - Patrones de microservicios
- Descubrimiento de servicios y enrutamiento
- Versionamiento y despliegue incremental
- Fault tolerance y resiliencia operativa
- Observabilidad distribuida y trazabilidad
- Gobernanza de contratos y compatibilidad
- Multi-tenancy y aislamiento de tráfico
 
 
- Frontend, interfaces gráficas y usabilidad - Fundamentos de experiencia y flujo- Interacción humano–computador
- Flujos de usuario
- Estados de la interfaz
 
- Interacción y comunicación con la persona usuaria- Arquitectura visual
- Patrones de interacción
- Microinteracciones y percepción
- Notificaciones y gestión de atención
- Descubribilidad y búsqueda
- Contenido en la interfaz
- Onboarding y aprendizaje continuo
 
- Capa de presentación y composición de UI- Renderizado y composición de interfaz
- Gestión de estado local de UI
- Estabilidad visual
 
- Arquitectura de la aplicación frontend- Modelado de componentes
- Gestión de estado compartido
- Gestión de navegación y flujo
- Integración con el sistema de diseño
- DSL de interfaz y plantillas
 
- Datos, red y sincronización- Consumo de APIs
- Sincronización con backend
- Tiempo real y concurrencia
- Modo offline y resiliencia de red
- Escalabilidad con datos en vivo
 
- Rendimiento y experiencia percibida- Costos de renderizado
- Entrega y carga inicial
- Interactividad percibida
- Presupuestos de performance
 
- Accesibilidad, confianza y ética- Accesibilidad e inclusión
- Internacionalización y localización
- Seguridad y confianza
- Cumplimiento y datos sensibles
- Ética de interacción
 
- Sistema de diseño y gobernanza de experiencia- Sistema de diseño
- Mantenibilidad y deuda de experiencia
- Gobernanza del diseño
- Estándares y guías de interfaz
 
- Calidad y validación- Testing
- Pruebas de experiencia y usabilidad
- Versionado y mantenibilidad de cambios
 
- Colaboración y multiusuario- Presencia en tiempo real (quién está viendo/editando)
- Resolución de conflictos de edición simultánea
- Historial compartido y atribución por persona / rol
 
- Operación y evolución del frontend- Observabilidad y métricas
- Mejora guiada por evidencia
- Pipelines de entrega
 
 
- Fundamentos de experiencia y flujo
- Computación científica y HPC - Fundamentos de análisis numérico - Aritmética de punto flotante y error numérico
- Condicionamiento numérico y número de condición
- Estabilidad algorítmica y estabilidad numérica
- Consistencia, convergencia y orden de métodos numéricos
- Propagación y acumulación de errores de redondeo
- Escalamiento y no dimensionalización de ecuaciones físicas
- Sensibilidad y análisis de perturbaciones
- Caos numérico y dependencia en condiciones iniciales
 
- Métodos numéricos fundamentales - Interpolación y aproximación polinómica
- Ajuste de curvas y regresión numérica
- Derivación numérica
- Integración numérica
- Resolución numérica de ecuaciones no lineales
- Optimización numérica determinista
- Optimización numérica estocástica
- Métodos de Monte Carlo y muestreo aleatorio
- Cuadratura adaptativa y métodos compuestos
- Minimización de energía y métodos variacionales
 
- Álgebra lineal numérica avanzada - Descomposición LU, Cholesky, QR, SVD
- Resolución directa de sistemas lineales
- Métodos iterativos para sistemas lineales
- Gradiente conjugado y variantes
- GMRES, BiCGSTAB y Krylov generales
- Problemas de autovalores y autovectores
- Descomposiciones espectrales y modos propios
- Matrices dispersas y formatos de almacenamiento disperso
- Precondicionadores y mejora de convergencia
- Métodos multigrid y multiescala
- Factorizaciones de rango bajo
 
- Métodos para ecuaciones diferenciales ordinarias (EDO) - Métodos explícitos de paso único
- Métodos implícitos de paso único
- Métodos multistep
- Métodos Runge-Kutta clásicos y de alto orden
- Métodos adaptativos con control de paso
- Sistemas rígidos y métodos para rigidez
- Conservación de invariantes y métodos geométricos
- Métodos linealizados y métodos de disparo
- Solución de problemas de contorno
 
- Métodos para ecuaciones diferenciales parciales (EDP) - Discretización por diferencias finitas
- Discretización por elementos finitos
- Discretización por volúmenes finitos
- Métodos espectrales y pseudoespectrales
- Métodos de contorno e integrales de frontera
- Esquemas conservativos y leyes de conservación
- Estabilidad numérica y condición CFL
- Métodos implícitos vs explícitos en EDP
- Refinamiento de malla adaptativo (AMR)
- Métodos de partículas y SPH (Smoothed Particle Hydrodynamics)
- Métodos de frontera inmersa
- Tratamiento numérico de discontinuidades y shocks
 
- Simulación científica por dominio físico - Dinámica de fluidos computacional (CFD)
- Mecánica de sólidos y análisis estructural
- Fractura, plasticidad y mecánica del daño
- Electromagnetismo computacional
- Física de plasmas y magnetohidrodinámica
- Astrofísica computacional y relatividad numérica
- Dinámica molecular clásica
- Dinámica molecular ab initio
- Física estadística y simulación de Monte Carlo
- Modelos climáticos y geo-simulación
- Sismología y propagación de ondas
- Biofísica computacional y dinámica de proteínas
- Simulación de reactores nucleares y transporte de radiación
 
- Programación científica - Lenguajes y ecosistemas dominantes (Fortran moderno, C/C++, Julia)
- Bibliotecas numéricas de bajo nivel (BLAS, LAPACK)
- Bibliotecas científicas de más alto nivel (FFTW, PETSc, Trilinos)
- Programación con precisión controlada
- Programación vectorial explícita y extensiones SIMD
- Uso de plantillas y metaprogramación para rendimiento
- Modelos de cómputo distribuido científico (MPI)
- Directivas paralelas (OpenMP, OpenACC)
- Modelos de cómputo acelerado (CUDA, HIP, OpenCL)
- Lenguajes y DSLs específicos de dominio
- Envolturas científicas en Python y bindings nativos
- Entornos interactivos de exploración científica
 
- Arquitecturas HPC y rendimiento extremo - Supercomputadores y clústeres HPC
- Topologías de interconexión de alto rendimiento
- Redes de baja latencia y alto ancho de banda
- Tecnologías de interconexión (InfiniBand, Omni-Path)
- Jerarquías de memoria en HPC (HBM, NUMA, NVRAM)
- Arquitecturas manycore y vector engines
- Escalamiento fuerte y escalamiento débil
- Modelos de equilibrio cómputo/memoria (roofline model)
- Cómputo exascale y arquitecturas exascale
- Eficiencia energética y cómputo verde
- Heterogeneidad CPU/GPU/FPGA en nodos de cómputo
- Reducción de movimiento de datos como limitante físico
 
- Administración y operación de clústeres HPC - Gestión de recursos compartidos multiusuario
- Planificadores y colas de trabajo por lotes
- Sistemas de colas (SLURM, PBS, LSF)
- Gestión de módulos y entornos de compilación
- Gestión de dependencias científicas y toolchains
- Sistemas de archivos paralelos (Lustre, GPFS, BeeGFS)
- Políticas de prioridad y fairness
- Contabilidad y uso de horas de cómputo
- Monitoreo y telemetría de clúster
- Seguridad y aislamiento de usuarios en HPC
- Mantenimiento predictivo y gestión de fallos de nodo
- Planificación de capacidad y escalamiento físico
 
- Optimización de rendimiento científico - Perfilado y trazado de rendimiento
- Análisis de hotspots y kernels críticos
- Vectorización automática y manual
- Afinidad de CPU y pinning de hilos
- Optimización de caché y localidad de datos
- Bloqueo y tiling de bucles
- Reducción de costo de comunicación
- Solapamiento comunicación / cómputo
- Minimización de sincronizaciones globales
- Escalabilidad paralela y eficiencia
- Portabilidad de rendimiento entre arquitecturas
- Auto-tuning y generación de kernels óptimos
 
- Computación heterogénea y aceleradores - GPU de propósito general
- Aceleradores matriciales especializados
- FPGA para cómputo científico
- Offloading selectivo de kernels
- Modelos de memoria unificada y memory pooling
- Balanceo dinámico CPU/GPU
- Co-scheduling de múltiples aceleradores
- Estrategias NUMA-aware en nodos heterogéneos
- Codiseño hardware-software
 
- Métodos estocásticos y muestreo masivo - Monte Carlo clásico
- Monte Carlo de cadenas de Markov (MCMC)
- Muestreo de Importancia y reponderación
- Cuasi-Monte Carlo y secuencias de baja discrepancia
- Rare-event sampling y métodos de eventos raros
- Análisis de incertidumbre y propagación de errores estadísticos
- Inferencia bayesiana computacional de gran escala
- Simulación de ensambles y métodos de replicas
 
- Optimización matemática de gran escala - Programación lineal
- Programación cuadrática
- Métodos de punto interior
- Optimización no lineal sin restricciones
- Optimización con restricciones
- Métodos de descenso de gradiente a gran escala
- Métodos quasi-Newton y BFGS limitado
- Descomposición por bloques y coordenadas alternadas
- Métodos distribuidos y consenso
- Control óptimo numérico
- Problemas inversos y ajuste de parámetros físicos
 
- Ciencia de datos a gran escala en HPC - Preprocesamiento masivo de datos científicos
- Limpieza y normalización de datos experimentales
- Reducción de dimensionalidad y compresión
- Análisis de series temporales de alta resolución
- Pipelines de análisis batch y streaming científicos
- Visualización científica de alto rendimiento
- Gestión de datasets masivos y movimiento de datos
- Indexación eficiente de resultados de simulación
- Exploración interactiva en entornos de supercómputo
 
- Aprendizaje automático acelerado en HPC - Entrenamiento distribuido de modelos profundos
- Paralelismo de datos
- Paralelismo de modelo
- Paralelismo de pipeline
- Técnicas mixtas de paralelismo
- Compiladores de grafos y optimizadores de kernels
- Modelos informados por física (physics-informed ML)
- Surrogates y emuladores de simulaciones costosas
- Inferencia optimizada de baja latencia
- AutoML y búsqueda de arquitecturas en HPC
 
- Verificación, validación y reproducibilidad científica - Verificación numérica de solvers
- Validación física frente a datos experimentales
- Comparación cruzada entre códigos independientes
- Benchmarks y suites de referencia comunitarias
- Control de versiones de simulaciones y parámetros
- Gestión de semillas aleatorias y estados iniciales
- Bitácoras experimentales y trazabilidad completa
- Publicación de datasets reproducibles
- Replicación de resultados publicados
 
- Metodologías de desarrollo de software científico - Diseño modular y orientado a componentes físicos
- Separación entre física, discretización y solver
- Testing automatizado para kernels numéricos
- Validación continua y pipelines de CI científicos
- Refactorización dirigida por rendimiento
- Documentación técnica y manuales de usuario científico
- Notebooks reproducibles y cuadernos ejecutables
- Automatización de campañas de simulación
- Gestión de configuraciones y barridos de parámetros
- Portabilidad entre supercómputo on-premise y entornos de investigación
 
- Computación de precisión mixta y aproximada - Precisión simple, doble y extendida
- Precisión mixta en solvers iterativos
- Reducción de precisión en kernels críticos
- Cómputo aproximado y tolerante a error
- Estrategias de reescalado numérico
- Propagación controlada de error
- Aritmética estocástica y detección de inestabilidades
 
- Resiliencia y tolerancia a fallos en HPC - Checkpointing y reinicio
- Checkpointing incremental y diferencial
- Algoritmos tolerantes a fallos (ABFT)
- Replicación activa de tareas críticas
- Detección y corrección de bit flips
- Recuperación tras caídas parciales de nodo
- Elasticidad bajo fallos a escala masiva
- Reconfiguración dinámica de trabajos a mitad de ejecución
 
- Computación científica en tiempo real y alta fidelidad - Simulación en línea para control experimental
- Gemelos digitales de sistemas físicos complejos
- Control predictivo basado en simulación
- Fusión de datos experimentales en vivo con modelos numéricos
- Procesamiento en el borde de instrumentos científicos
- Reducción automática de datos bajo latencia estricta
- Sistemas de alerta temprana basados en simulación
 
- Ética, gestión y política científica en HPC - Priorización de acceso a recursos de supercómputo
- Cuotas de uso y gobernanza de clústeres compartidos
- Transparencia y trazabilidad de resultados numéricos
- Reproducibilidad como criterio de publicación científica
- Sostenibilidad energética del supercómputo
- Huella de carbono del entrenamiento masivo de modelos
- Manejo responsable de datos sensibles y confidenciales
- Transferencia tecnológica hacia la industria
 
 
- Datos y ML - Fundamentos matemáticos y computacionales - Álgebra lineal para datos y modelos
- Cálculo diferencial e introducción a optimización continua
- Optimización convexa y dualidad (Lagrange, KKT)
- Métodos de optimización numérica (gradiente, Newton, quasi-Newton, Adam)
- Probabilidad básica y variables aleatorias
- Inferencia estadística elemental (muestreo, estimación, sesgo/varianza)
- Teoría de la información (entropía, divergencia)
 
- Fundamentos de datos y análisis cuantitativo - Tipos y formatos de datos (estructurados, semiestructurados, no estructurados)
- Manipulación y transformación de datos
- Limpieza, imputación, normalización y validación
- Versionado de datos, linaje y reproducibilidad de datasets
- Series temporales básicas: agregaciones, ventanas de tiempo, estacionalidad
- Métricas de negocio y definición de KPI
- Segmentación, cohortes y comportamiento de usuarios
- Analítica de producto y telemetría de uso
- Análisis geoespacial y datos con localización
- Análisis de riesgo, fraude y anomalías
- Análisis exploratorio de datos (EDA)
- Visualización, storytelling con datos y comunicación ejecutiva
 
- Estadística, inferencia y causalidad - Estimadores, sesgo y varianza
- Intervalos de confianza y tests de hipótesis
- Comparación de grupos (t-test, χ², ANOVA)
- Significancia estadística, potencia estadística y tamaño de muestra
- Regresión lineal y múltiple (interpretación de coeficientes)
- Multicolinealidad y selección de variables
- Regularización estadística (ridge, lasso)
- Inferencia bayesiana aplicada
- Análisis causal (confusores, variables instrumentales, correlación vs causalidad)
- Evaluación de impacto y uplift
 
- Teoría del aprendizaje automático - Formulación de aprendizaje supervisado, no supervisado y semisupervisado
- Funciones de pérdida y significado estadístico
- Generalización: sesgo-varianza, capacidad del modelo y sobreajuste
- Dimensión VC, márgenes y control de complejidad
- PAC learning (visión conceptual)
- Regularización vista como restricción de complejidad
- Paisajes de optimización no convexa en redes profundas
- Estabilidad de entrenamiento y ruido
 
- Machine Learning clásico (ML tradicional) - Regresión lineal y logística
- k-NN y métodos basados en distancia
- Máquinas de soporte vectorial (SVM)
- Árboles de decisión
- Bosques aleatorios
- Ensembles y Gradient Boosting (XGBoost, LightGBM)
- Selección de variables y feature engineering
- Balanceo de clases y manejo de desbalance extremo
- Clustering (k-means, jerárquico, DBSCAN)
- Modelos de mezcla y clustering probabilístico
- Reducción de dimensionalidad (PCA, t-SNE, UMAP)
- Detección de anomalías y outliers
- Series temporales con ML tradicional (ARIMA, SARIMA, Holt-Winters, VAR)
- Forecasting de demanda y predicción multihorizonte
- AutoML y búsqueda de hiperparámetros / arquitecturas
- Aprendizaje semisupervisado y débilmente supervisado
 
- Evaluación de modelos y diseño experimental - Partición train/valid/test y validación cruzada
- Métricas de regresión, clasificación y ranking (ROC, PR, F1, calibración)
- Umbrales de decisión y coste esperado
- Interpretabilidad local y global (importancia de características, SHAP/LIME)
- Data leakage y fugas de información
- Robustez frente a ruido, datos faltantes y cambios de distribución
- A/B testing y experimentación controlada
- Modelos descriptivos / diagnósticos / predictivos / prescriptivos
- Análisis causal aplicado y uplift modeling en producto
- Detección temprana de degradación (drift de datos y drift de concepto)
- Aprendizaje en línea y adaptación continua
- Aprendizaje activo (el modelo pide etiquetas donde tiene más incertidumbre)
 
- Deep Learning: fundamentos - Neuronas artificiales y perceptrón multicapa
- Redes densas feed-forward
- Funciones de activación y normalización
- Retropropagación del gradiente
- Inicialización de pesos y estabilidad numérica
- Regularización en redes neuronales (dropout, weight decay)
- Ajuste de hiperparámetros en redes profundas
- Funciones de pérdida para clasificación y regresión
 
- Arquitecturas profundas avanzadas - Redes convolucionales (CNN) para visión
- Pooling, padding y bloques tipo ResNet
- Redes recurrentes (RNN, LSTM, GRU)
- Temporal Convolutional Networks
- Mecanismos de atención y self-attention
- Transformers y arquitecturas encoder-decoder
- Modelos generativos (autoencoders, GANs, modelos de difusión)
- Modelos multimodales (imagen-texto, audio-texto, fusión sensorial)
 
- Transfer learning, auto-supervisión y modelos fundacionales - Transfer learning clásico (pre-entrenar y ajustar)
- Aprendizaje auto-supervisado (contrastive, enmascarado, predicción de la siguiente parte)
- Modelos fundacionales y LLMs como base generalista
- Fine-tuning eficiente (LoRA, adapters, distillation)
- Continual learning y olvido catastrófico
 
- Lenguaje natural, recuperación aumentada y agentes - Representaciones de texto (TF-IDF, embeddings)
- Modelos de lenguaje (n-gramas, RNNs, Transformers)
- Modelos de lenguaje grandes (LLMs) y alineación básica
- Adaptación de dominio y fine-tuning instruccional
- Resumen automático, QA, NER y extracción de información
- Recuperación aumentada de contexto (búsqueda semántica, RAG)
- Orquestación de agentes que usan herramientas externas (tool-use)
- Seguridad y alucinación
 
- Visión computacional y aprendizaje en grafos - Aumentación y preprocesamiento de imágenes
- Clasificación, detección y segmentación de objetos
- Visión 3D, nubes de puntos y seguimiento en video
- Fusión sensorial (imagen + LiDAR)
- Representación de grafos (nodos, aristas, atributos)
- Redes neuronales en grafos (message passing, GCN, GAT)
- Aplicaciones en química, fraude, redes sociales y recomendación
 
- Series de tiempo avanzadas y señales - Estacionalidad, tendencia y descomposición
- Forecasting probabilístico y multihorizonte
- Detección de anomalías en tiempo real
- Transformers temporales y predicción secuencial multivariante
- Monitoreo operacional en streaming (alertas, SLA de detección)
 
- Aprendizaje por refuerzo y control - Formulación MDP (estados, acciones, recompensas)
- Métodos tabulares (Q-Learning, SARSA)
- Deep Q-Networks (DQN)
- Policy Gradient y actor-critic (PPO)
- Control continuo y robótica
- Multiagente y coordinación
- Seguridad, exploración controlada y alineación en RL
 
- Sistemas de recomendación y personalización - Segmentación de usuarios y clustering aplicado
- Filtrado colaborativo y factorización matricial
- Modelos basados en contenido y señales de contexto
- Ranking, CTR prediction y métricas top-K
- Recomendadores secuenciales y en tiempo real
- Personalización dinámica en producto
- Interpretabilidad y explicabilidad para equipos de negocio
 
- Ingeniería de datos y plataformas de datos - Modelado analítico orientado a negocio
- Modelado dimensional (hechos y dimensiones)
- Data warehouse, data lakes y lakehouses
- Formatos columnares y almacenamiento orientado a análisis
- Catálogo de datos, linaje y descubribilidad
- Gobernanza de acceso y control de permisos
- Retención, archivado y ciclo de vida de los datos
- Integración con herramientas de BI y tableros ejecutivos
- Exposición de datos como servicio (APIs analíticas)
- ETL / ELT y pipelines reproducibles y declarativos
- Procesamiento batch a gran escala
- Procesamiento streaming y datos en flujo continuo
- Orquestación de tareas y scheduling de flujos
- Optimización y perfilado de pipelines
- Pruebas de calidad, contratos de datos y SLAs de datos
- Observabilidad de datos (frescura, completitud, anomalías)
- Data mesh y dominios de datos
 
- Big Data y computación distribuida - Concepto de big data (volumen, velocidad, variedad, veracidad, valor)
- Arquitecturas distribuidas de datos
- Sistemas de archivos distribuidos
- Motores de consulta distribuida y SQL distribuido
- Buses de eventos y colas de mensajería
- Procesamiento en tiempo real para decisiones operativas
- Integración de telemetría de producto y métricas de negocio a escala
 
- Puesta en producción de modelos (MLOps / LLMOps) - Ciclo de vida del modelo: entrenamiento, validación, despliegue, rollback
- Tracking de experimentos y versionado de artefactos
- Gestión de características (feature stores)
- Servir modelos en batch y en tiempo real
- Inferencia de baja latencia y costo por predicción
- Monitorización de deriva y degradación de modelos
- Retraining continuo y loops de realimentación
- Testing de modelos antes del rollout y validación de seguridad
- A/B testing en producción y medición de impacto
- Observabilidad operativa (latencia, throughput, errores)
- SLOs y SLAs para servicios de inferencia
- Documentación y tarjetas de modelo (model cards)
 
- Escalamiento, eficiencia y despliegue en el borde - Entrenamiento distribuido (data parallelism, model parallelism, sharding)
- Mezcla de expertos y arquitecturas escalables
- Cuantización, poda y compresión de modelos
- Compiladores y runtimes optimizados (GPU / TPU / ASIC)
- Inferencia en el borde (edge AI, TinyML, microcontroladores)
- Limitaciones de memoria, energía y latencia dura
- Costos energéticos y sostenibilidad del cómputo en IA
 
- Ética, seguridad, privacidad y gobernanza - Privacidad de datos personales y minimización de uso
- Privacidad diferencial y aprendizaje federado
- Gobernanza, trazabilidad y auditoría de datos y modelos
- Cumplimiento normativo y marcos legales
- Control de acceso, clasificación de datos y dominios de seguridad
- Sesgos algorítmicos, equidad y no discriminación
- Explicabilidad y justificabilidad de decisiones automatizadas
- Riesgo reputacional y deepfakes / desinformación sintética
- Transparencia frente a usuarios y stakeholders
- Reproducibilidad científica y versionado de datasets/modelos
- Gobernanza del ciclo de vida completo del dato y del modelo
- Políticas internas de aprobación y revisión humana obligatoria
- Continuidad operativa y resiliencia ante fallos del modelo en producción
 
- Aplicaciones verticales y casos de uso - Analítica de negocio y optimización operacional
- Detección de fraude, scoring de riesgo y cumplimiento financiero
- Personalización, recomendación y priorización de leads
- Salud y biomedicina asistida por IA
- Retail, demanda y logística predictiva
- Industria y mantenimiento predictivo (gemelos digitales)
- Ciencia y simulación asistida por datos (clima, materiales, física)
- Agentes autónomos, robótica y control continuo
- Asistentes conversacionales y copilotos para trabajo humano
- Automatización de decisiones en línea dentro del flujo de negocio
 
 
- Seguridad - Seguridad de aplicaciones y servicios - Principales vectores de ataque en aplicaciones web
- Criptografía práctica y hashing seguro
- Canales seguros y certificados (cifrado en tránsito extremo a extremo)
- Protección contra ataques comunes en la web (inyecciones, XSS, CSRF, etc.)
- Autenticación y autorización (incluyendo federación de identidad y single sign-on)
- Manejo seguro de credenciales, llaves y secretos
- Seguridad en bases de datos y control de acceso a datos sensibles
- Registro de eventos de seguridad y trazabilidad
- Sanitización y validación de entrada
- Modelado de amenazas y pruebas básicas de penetración
- Gestión de sesiones y mitigación de secuestro de sesión
- Política de mínimo privilegio en componentes internos
 
- Seguridad de infraestructura y plataforma - Aislamiento entre servicios y entornos (producción, staging, desarrollo)
- Endurecimiento (hardening) de sistemas operativos, contenedores y runtimes
- Seguridad en redes: segmentación interna, firewalls, zonas de confianza
- Control de tráfico interno entre servicios (mTLS, políticas de red, service mesh)
- Seguridad en la nube: configuración segura de recursos gestionados
- Protección de datos en reposo (cifrado en disco, cifrado por objeto)
- Seguridad de la cadena de suministro de software (supply chain security)
- Escaneo de vulnerabilidades en dependencias, imágenes y artefactos
- Gestión de parches y actualizaciones de seguridad
- Backups seguros y recuperación ante desastres
 
- Identidad, acceso y control de privilegios - Gestión de identidad y acceso (IAM)
- Autenticación multifactor (MFA)
- Rotación periódica de credenciales y llaves
- Delegación de permisos y roles granulares
- Acceso just-in-time y acceso de emergencia controlado
- Auditoría de quién accede a qué y cuándo
- Separación de funciones críticas (segregation of duties)
- Gobierno de cuentas de servicio y claves de API
- Revocación y desactivación segura de accesos
 
- Monitoreo, detección y respuesta temprana - Detección de comportamientos anómalos y abuso
- Alertas de actividad sospechosa en autenticación y uso de APIs
- Correlación de eventos de seguridad en logs centralizados
- Protección contra fuga de datos y exfiltración
- Trazabilidad completa de acciones de alto riesgo
- Simulación de incidentes (ejercicios tipo “fire drill”)
- Detección de escalamiento lateral interno
- Señales tempranas de compromiso en entornos críticos
 
- Respuesta a incidentes y continuidad operativa - Plan de respuesta a incidentes de seguridad
- Contención, erradicación y recuperación
- Análisis forense y preservación de evidencia técnica
- Postmortems de seguridad sin cultura de culpa
- Comunicación interna y externa durante incidentes
- Planes de continuidad operativa y recuperación de negocio
- Gestión coordinada con legal, compliance y stakeholders críticos
 
- Cumplimiento y riesgo organizacional - Políticas internas de seguridad y uso aceptable
- Clasificación y manejo de datos sensibles
- Requisitos regulatorios y normativos aplicables
- Revisión periódica de riesgos y exposiciones
- Evaluación de terceros y proveedores (riesgo de cadena de suministro)
- Controles preventivos y controles compensatorios
- Trazabilidad, reportabilidad y obligaciones de notificación
- Cultura de seguridad: concientización y formación continua en el equipo
 
 
- Calidad y auditoría - Verificación formal y métodos formales - Especificación formal
- Model checking
- Pruebas asistidas por SMT/SAT
- Demostración asistida (proof assistants)
- Aplicaciones prácticas de métodos formales
 
- Testing y aseguramiento de calidad - Pruebas unitarias
- Pruebas de integración
- Pruebas de extremo a extremo
- Pruebas de contrato entre servicios
- Pruebas basadas en instantáneas y estados esperados
- Simulación de dependencias externas y uso de dobles de prueba
- Pruebas basadas en propiedades
- Métricas de cobertura y criterios de calidad
- Análisis estático y linters
- Análisis de seguridad automatizado
- Ejecución automática de pruebas en pipelines de entrega
 
- Procesos de calidad y auditoría - Integración continua y despliegue continuo
- Control de versiones de dependencias externas
- Revisión de código estructurada y guías internas
- Auditorías de seguridad y cumplimiento normativo
- Aseguramiento de calidad (QA) y control de calidad (QC)
- Métricas de calidad operacional (por ejemplo, densidad de defectos)
- Pruebas de aceptación y regresión
- Estándares de codificación y criterios de aprobación
- Pruebas no funcionales (rendimiento, carga, resiliencia)
- Documentación de calidad y trazabilidad
- Cumplimiento de marcos y certificaciones de la industria
- Evaluaciones posteriores al lanzamiento y mantenimiento preventivo
 
 
- Operación en producción - Concurrencia y rendimiento - Modelos asíncronos y bucles de eventos
- Paralelismo con hilos y procesos
- Tareas diferidas y trabajo en segundo plano
- Futuros, promesas y unidades de trabajo asíncronas
- Caching en memoria y distribuido
- Perfilado de CPU y memoria
- Cuellos de botella de entrada/salida frente a cómputo
- Medición de rendimiento y benchmarking
- Estrategias de escalado horizontal y vertical
- Colas de trabajo y orquestadores de tareas
- Control de tasa y mecanismos de alivio de presión
- Bloqueos, semáforos y estructuras de sincronización
 
- Infraestructura y operaciones - Estrategias avanzadas de control de versiones y ramas
- Integración continua / entrega continua en entornos reales
- Contenedores y definición de entornos portables
- Despliegue de múltiples servicios coordinados
- Orquestación de contenedores y planificación de cargas
- Monitoreo de infraestructura y paneles de visualización
- Infraestructura como código
- Plataformas en la nube (cómputo, redes, almacenamiento)
- Almacenamiento de objetos, ejecución sin servidor, monitoreo gestionado
- Gestión de configuración y secretos centralizados
- Monitoreo activo y alertas operacionales
- Optimización de costos y escalado automático
 
- Observabilidad, logs y métricas - Logging estructurado y contextualizado
- Monitoreo del desempeño de las aplicaciones (APM)
- Trazas distribuidas de extremo a extremo
- Métricas personalizadas y verificaciones de salud
- Alertas basadas en umbrales y tendencias
- Auditoría y reconstrucción de incidentes
 
- Resiliencia - Tolerancia a fallos y aislamiento
- Control de latencia y tiempo de espera
- Reintentos seguros
- Protección contra sobrecarga
- Salud del servicio y autosanación
- Recuperación y continuidad
 
 
- Gestión técnica - Cultura técnica y gestión del equipo - Revisión de código efectiva y empática
- Gestión de deuda técnica
- Mentoría y liderazgo técnico
- Respuesta a incidentes en producción
- Postmortems y análisis de causa raíz sin culpas
- Estándares internos de código y guías
- Comunicación con producto y otros equipos
- Planificación de iteraciones y lanzamientos
- Evaluación de decisiones técnicas y trade-offs
- Hoja de ruta técnica y visión de plataforma
- Cultura de documentación viva
- Inclusión, colaboración y seguridad psicológica
- Gestión del conocimiento y rotación de contexto
 
- Gestión y liderazgo técnico - Gestión de proyectos
- Estimación de esfuerzo y planificación técnica
- Gestión de riesgos y dependencias entre equipos
- Priorización de deuda técnica frente a features
- Gestión de releases y control de cambios
- Comunicación transversal (producto, QA, operaciones, datos)
- Desarrollo profesional y mentoría técnica
- Evaluación de desempeño técnico
- Registro y documentación de decisiones de arquitectura
- Presentación técnica a audiencias no técnicas
- Cultura de ingeniería basada en aprendizaje continuo
- Prácticas de mejora continua tras incidentes
- Gestión de capacidad y asignación de recursos
- Estrategia de contratación y onboarding técnico
- Escalamiento organizacional y delegación
 
- Operaciones, fiabilidad y excelencia de entrega - SRE interno y propiedad de servicio
- Observabilidad organizacional
- Gestión de SLAs, SLOs y SLIs
- Gestión de alertas y fatiga de alarmas
- Ciclos de despliegue seguro
- Gestión de entornos (dev, staging, prod)
- Controles de cambio y auditoría operativa
- Ejercicios de continuidad operacional y DRP
- Gestión de incidentes de seguridad
- Comunicación durante incidentes críticos
- Madurez de procesos DevSecOps
 
 
- Cumplimiento y mejora - Ética, legalidad y práctica profesional - Responsabilidad profesional en ingeniería de software
- Privacidad y manejo responsable de datos
- Propiedad intelectual y licenciamiento de software
- Cumplimiento normativo y estándares de la industria
- Riesgos de dependencia de un único proveedor y cierre tecnológico
- Sesgos algorítmicos y transparencia en sistemas automatizados
- Accesibilidad e inclusión en diseño y experiencia de usuario
- Gobernanza de software libre y colaboración abierta
- Protección de datos personales y trazabilidad de acceso
- Reproducibilidad técnica y científica
- Comunicación honesta y responsable con las partes interesadas
- Impacto social y ambiental del software
- Soberanía de datos y cumplimiento regional
- Gestión responsable de IA generativa
 
- Innovación, investigación y mejora continua - Evaluación crítica de nuevas tecnologías
- Prototipos rápidos y pruebas de concepto
- Medición comparativa y benchmarking técnico
- Observación de tendencias tecnológicas y estado del arte
- Participación en comunidades técnicas y proyectos abiertos
- Gestión del conocimiento interno y documentación compartida
- Diseño centrado en el usuario para resolver problemas reales
- Planes de aprendizaje continuo y formación técnica
- Experimentación controlada y despliegues graduales
- Innovación responsable, segura y sostenible
- Estrategia de patentes y divulgación científica
- Transferencia tecnológica y escalamiento a producción
- Cultura interna de experimentación y hack time
 
- Auditoría, métricas y optimización de procesos - Métricas de entrega y flujo de trabajo
- Métricas de confiabilidad y disponibilidad
- Métricas de calidad de código
- Auditoría de seguridad y cumplimiento
- Auditoría de acceso y trazabilidad
- Procesos de mejora continua tipo Kaizen
- Ciclo de retroalimentación con clientes y stakeholders
- Health checks organizacionales y madurez técnica
- Gestión de backlog de mejoras operativas
- Automatización de controles y reportabilidad
- Transparencia interna y reportes ejecutivos
- Preparación para auditorías externas y certificaciones