Scaling quantum optimization algorithms: advancing techniques for handling industrial-level workloads with artificial intelligence

Saved in:
Bibliographic Details
Title: Scaling quantum optimization algorithms: advancing techniques for handling industrial-level workloads with artificial intelligence
Authors: Riu Vicente, Jordi
Contributors: University/Department: Universitat Politècnica de Catalunya. Departament de Física
Thesis Advisors: García Sáez, Artur, Monras Blasi, Alexandre, Rey Oriol, Rosendo
Source: TDX (Tesis Doctorals en Xarxa)
Publisher Information: Universitat Politècnica de Catalunya, 2025.
Publication Year: 2025
Physical Description: 158 p.
Subject Terms: Quantum Computing, Artificial Intelligence, Quantum Optimization, Machine Learning, Reinforcement Learning, Graph Neural Networks, Variational Quantum Algorithms, Tensor Networks, ZX-Calculus, Àrees temàtiques de la UPC::Física, Àrees temàtiques de la UPC::Informàtica, 53 - Física, 004 - Informàtica
Description: Tesi amb continguts retallats per motius de confidencialitat
Description (Translated): Tesi amb menció de Doctorat Industrial (Generalitat de Catalunya)
(English) This thesis integrates traditional optimization methods and artificial intelligence techniques with near‑term quantum algorithms to accelerate the adoption of hybrid protocols for large‑scale, time‑sensitive decision problems. These techniques can manage millions of variables, but they are very expensive computationally. Conversely, quantum approaches such as quantum annealing and QAOA promise more efficient exploration of complex solution landscapes, yet they are hampered by severe hardware limitations and steep training challenges like barren plateaus. By combining these paradigms, the work offloads subproblems suited to classical resources and reserves quantum circuits for the most demanding kernels. We first present the formulation of a relevant use case of a medical‑drone logistics network modeled across Catalonia’s mountainous terrain. An initial discrete‑time MILP with millions of binary variables captures the relevant properties but exceeds the reach of current quantum hardware. A continuous‑time reformulation later reduces variable count. Resource estimates confirm that hardware scaling alone cannot close the gap, underscoring the need for new algorithmic strategies. To address NISQ‑era circuit depth, the thesis introduces RL‑ZX, a reinforcement‑learning–driven quantum compiler built on the ZX‑Calculus framework. Quantum circuits translate into feature‑annotated ZX diagrams, which a Graph Attention Network encodes. An agent trained with proximal policy optimization then applies ZX rewrite rules to minimize two‑qubit gates under device‑specific cost metrics. When evaluated on large, unseen circuits, RL‑ZX outperforms leading heuristics almost universally, yielding shallower, higher‑fidelity circuits. Next, we automate the process of including hard constraints in QUBO formulations. We design a Graph Neural Network and train it to predict penalty magnitudes in a single inference pass, treating variables and constraints as nodes and edges annotated with energy‑difference features. Integrated end‑to‑end with a differentiable QAOA simulator, this approach uses ground‑state sampling probability as its training signal. Experiments on random instances of the knapsack problem, TSP, and assignment tasks demonstrate large improvements in solution probability compared to analytic bounds. The third topic under study is the choice of starting state for VQAs. By measuring coherence via relative entropy, we show that higher‑coherence initial states produce better approximation ratios in fixed‑depth QAOA on small Max‑Cut instances. A tensor‑network imaginary‑time evolution protocol generates Matrix‑Product States approximating pure Gibbs states, that are later mapped to shallow quantum circuits. This initialization strategy suggests a clear path toward improved performance as quantum hardware matures. Finally, two “constraint-satisfying” ansätze are developed to prepare valid solutions directly, eliminating penalty terms. The first builds assignments incrementally using multi‑controlled rotations, while the second creates superpositions of partial assignments before deterministically completing them with ancilla qubits. By uniting these advances—hybrid classical/quantum decomposition, RL‑driven compilation, GNN‑based penalty tuning, coherence‑aware initialization, and feasible‑only state preparation—the thesis lays a scalable, modular foundation for achieving quantum advantage in real‑world optimization.
(Català) Aquesta tesi integra mètodes d’optimització tradicionals i tècniques d’intel·ligència artificial amb algoritmes quàntics de pròxim termini per accelerar l’adopció de protocols híbrids en problemes de decisió a gran escala i sensibles al temps. Aquestes tècniques poden gestionar milions de variables, però són molt costoses en termes de càlcul. En canvi, enfocaments quàntics com el “quantum annealing” i l’algorisme QAOA prometen una exploració més eficient de paisatges de solució complexos, tot i estar limitats per severes restriccions de maquinari i reptes de formació pronunciats, com els “barren plateaus”. Combinant ambdós paradigmes, aquest treball deriva subproblemes adequats per a recursos clàssics i reserva circuits quàntics per als nuclis més exigents. En primer lloc, presentem la formulació d’un cas d’ús rellevant: una xarxa logística de drons mèdics modelitzada en el relleu muntanyós de Catalunya. Un MILP en temps discret amb milions de variables binàries en capta les propietats essencials, però sobrepassa la capacitat de l’actual maquinari quàntic. Posteriorment, una reformulació en temps continu redueix el nombre de variables. Les estimacions de recursos confirmen que només escalar el maquinari no permet tancar la bretxa, emfasitzant la necessitat de noves estratègies algorítmiques. Per abordar la profunditat de circuits de l’era NISQ, la tesi introdueix RL‑ZX, un compilador quàntic impulsat per aprenentatge per reforç basat en el marc ZX‑Càlcul. Els circuits quàntics es tradueixen en diagrames ZX amb anotacions de característiques, que codifica una Xarxa d’Atenció sobre Grafs. Un agent entrenat amb optimització de polítiques proximal (PPO) aplica regles de reescriptura ZX per minimitzar les portes de dos qubits segons mètriques de cost específiques del dispositiu. A l’avaluar-lo en circuits grans i inèdits, RL‑ZX supera gairebé universalment les heurístiques punteres, generant circuits més plans i de fidelitat superior. Tot seguit, automatitzem el procés d’incloure restriccions estrictes en formulacions QUBO. Dissenyem una Xarxa Neuronal de Grafs i l’entrenem per predir la magnitud dels termes de penalització en una única passada d’inferència, tractant variables i restriccions com a nodes i arestes anotades amb característiques de diferència d’energia. Integrat de forma end‑to‑end amb un simulador diferenciable de QAOA, aquest enfocament utilitza la probabilitat de mostreig de l’estat fonamental com a senyal d’entrenament. Experiments en instàncies aleatòries del problema de la motxilla, el TSP i tasques d’assignació demostren millores significatives en la probabilitat de solució respecte de les cotes analítiques. El tercer tema d’estudi és l’elecció de l’estat inicial per a VQA. Mesurant la coherència mitjançant entropia relativa, demostrem que estats inicials d’alta coherència produeixen millors ràtios d’aproximació en QAOA de profunditat fixa en instàncies petites de Max‑Cut. Un protocol d’evolució en temps imaginari amb xarxa de tensors genera estats de producte de matrius que aproximen estats de Gibbs purs, que més endavant es projecten en circuits quàntics poc profunds. Aquesta estratègia d’inicialització assenyala un camí clar cap a un millor rendiment a mesura que el maquinari quàntic evoluciona. Finalment, es desenvolupen dos ansätze per preparar solucions vàlides de manera directa, eliminant els termes de penalització. El primer construeix les assignacions incrementalment amb rotacions multi‑controlades, mentre que el segon crea superposicions d’assignacions parcials abans de completar-les de manera determinista amb qubits ancilla. En unir aquests avanços—descomposició híbrida clàssic/quàntic, compilació guiada per RL, afinament de penalitzacions amb GNN, inicialització conscient de la coherència i preparació d’estats només factibles—, la tesi estableix una base escalable i modular per assolir l’avantatge quàntic en problemes d’optimització del món real.
(Español) Esta tesis integra métodos tradicionales de optimización y técnicas de inteligencia artificial con algoritmos cuánticos de corto plazo para acelerar la adopción de protocolos híbridos en problemas de decisión a gran escala y sensibles al tiempo. Estas técnicas pueden gestionar millones de variables, pero resultan muy costosas en términos computacionales. En cambio, enfoques cuánticos como “quantum annealing” y QAOA prometen una exploración más eficiente de paisajes de solución complejos, aunque se ven limitados por severas restricciones de hardware y pronunciados desafíos de entrenamiento, como los “barren plateaus”. Al combinar ambos paradigmas, este trabajo deriva subproblemas adecuados para recursos clásicos y reserva los circuitos cuánticos para los núcleos más exigentes. Primero presentamos la formulación de un caso de uso relevante: una red logística de drones médicos modelizada en el terreno montañoso de Cataluña. Un MILP en tiempo discreto con millones de variables binarias capta las propiedades esenciales, pero supera la capacidad del hardware cuántico actual. Más adelante, una reformulación en tiempo continuo reduce el número de variables. Las estimaciones de recursos confirman que escalar el hardware por sí solo no basta para cerrar la brecha, subrayando la necesidad de nuevas estrategias algorítmicas. Para abordar el coste de circuitos en la era NISQ, la tesis presenta RL‑ZX, un compilador cuántico impulsado por aprendizaje por refuerzo basado en el marco del cálculo ZX. Los circuitos cuánticos se traducen en diagramas ZX anotados con características, que codifica una Red de Atención de Grafos. Un agente entrenado con optimización de políticas proximales aplica reglas de reescritura ZX para minimizar las puertas de dos qubits según métricas de coste específicas del dispositivo. Al evaluarlo en circuitos grandes e inéditos, RL‑ZX supera casi universalmente a las heurísticas líderes, generando circuitos más planos y de mayor fidelidad. A continuación, automatizamos el proceso de inclusión de restricciones estrictas en formulaciones QUBO. Diseñamos una Red Neuronal de Grafos y la entrenamos para predecir magnitudes de penalización en una sola pasada de inferencia, tratando variables y restricciones como nodos y aristas anotados con características de diferencia de energía. Integrado de extremo a extremo con un simulador diferenciable de QAOA, este enfoque utiliza la probabilidad de muestreo del estado fundamental como señal de entrenamiento. Experimentos en instancias aleatorias del KP, el TSP y tareas de asignación demuestran mejoras muy significativas en la probabilidad de solución frente a las cotas analíticas. El tercer tema de estudio es la elección del estado inicial para VQAs. Midiendo la coherencia mediante entropía relativa, mostramos que estados iniciales de mayor coherencia producen mejores ratios de aproximación en QAOA de profundidad fija en pequeñas instancias de Max‑Cut. Un protocolo de evolución en tiempo imaginario con redes de tensores genera estados de producto matricial que aproximan estados de Gibbs puros, los cuales luego se mapean a circuitos cuánticos de poca profundidad. Finalmente, se desarrollan dos ansätze para preparar soluciones válidas directamente, eliminando los términos de penalización. El primero construye las asignaciones de forma incremental mediante rotaciones multicontroladas, mientras que el segundo crea superposiciones de asignaciones parciales antes de completarlas de manera determinista con qubits ancilla. Al unir estos avances —descomposición híbrida clásico/cuántica, compilación impulsada por RL, ajuste de penalizaciones basado en GNN, inicialización consciente de la coherencia y preparación de estados solo factibles—, la tesis establece una base escalable y modular para lograr ventaja cuántica en la optimización del mundo real.
DOCTORAT EN FÍSICA COMPUTACIONAL I APLICADA (Pla 2013)
Document Type: Dissertation/Thesis
File Description: application/pdf
Language: English
DOI: 10.5821/dissertation-2117-449633
Access URL: http://hdl.handle.net/10803/696222
https://dx.doi.org/10.5821/dissertation-2117-449633
Rights: ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
Accession Number: edstdx.10803.696222
Database: TDX
Description
Abstract:Tesi amb continguts retallats per motius de confidencialitat
DOI:10.5821/dissertation-2117-449633