Improving performance of genomics workloads through software optimizations and hardware acceleration
Gespeichert in:
| Titel: | Improving performance of genomics workloads through software optimizations and hardware acceleration |
|---|---|
| Autoren: | Langarita Benítez, Rubén |
| Weitere Verfasser: | University/Department: Universitat Politècnica de Catalunya. Departament d'Arquitectura de Computadors |
| Thesis Advisors: | Armejach Sanosa, Adrià, Alastruey Benedé, Jesús |
| Quelle: | TDX (Tesis Doctorals en Xarxa) |
| Verlagsinformationen: | Universitat Politècnica de Catalunya, 2026. |
| Publikationsjahr: | 2026 |
| Beschreibung: | 146 p. |
| Schlagwörter: | Genomics, Read mapping, Dynamic programming, Computer science, Computer engineering, Hardware accelerator, Software optimization, HPC, Àrees temàtiques de la UPC::Informàtica, Àrees temàtiques de la UPC::Ciències de la salut, 004 - Informàtica, 575 - Genètica general. Citogenètica general. Immunogenètica. Evolució. Filogènia |
| Beschreibung: | Tesi amb menció de Doctorat Internacional |
| Description (Translated): | (English) Modern multi-core architectures and accelerators have become the cornerstone for accelerating many workloads in scientific computing and engineering. Many efforts have been made to accelerate HPC applications on modern hardware architectures such as CPUs and GPUs, as well as FPGA and custom accelerators (ASICs) for specific workloads. Hence, HPC platforms are increasingly sought after to handle large-scale workloads that exploit different levels of parallelism available in the accelerators. However, there is an emergent class of workloads that cannot fully exploit the massively parallel capabilities of mainstream accelerators. Many HPC applications are often bottlenecked by the execution of sequential workflows composed of rather small compute-intensive kernels that implement complex dependency patterns. This is particularly noticeable in life science and healthcare applications, which implement long workflows of data-processing kernels. Often based on stencil and dynamic programming computations, these dependency-bound kernels tend to be moderate in size and implement complex data-dependency patterns that ultimately restrict parallelism exploitation. Precision medicine aims to improve healthcare by exploiting genomic information. In recent years, the sharp reduction in genome sequencing costs has driven a dramatic increase in the amount of data generated for processing, which has posed a significant computational and storage challenge. Sequence alignment, one of the most demanding computational problems addressed in sequencing studies, has numerous applications, including read mapping. The goal of read mapping is to align the reads extracted from the sequencing systems against a reference genome. A dynamic programming scheme is used to assign an alignment score for each of the candidates, which leads to poor data parallelization due to its dependency-bound patterns. The main objective of this work is to improve the performance of genomics workloads through software and hardware acceleration. We submit four contributions to the field. The first three are software enhancements, including an algorithm proposal, software optimizations, and kernel porting to the ARM architecture. In the last one, we expand our field of study and propose a new hardware accelerator for dependency-bound kernels, which targets dynamic programming algorithms used in genomics pipelines. (Català) Les arquitectures multinucli i els acceleradors moderns s'han convertit en la pedra angular per a accelerar moltes càrregues de treball en aplicacions científiques i d'enginyeria. S'han fet molts esforços per a accelerar aplicacions HPC en arquitectures hardware modernes com les CPUs i les GPUs, així com les FPGAs i acceleradors a mida (ASICs) per a càrregues de treball específiques. D'aquí ve que cada vegada es busquin més plataformes HPC per a manejar càrregues de treball a gran escala que explotin els diferents nivells de paral·lelisme disponibles als acceleradors. No obstant això, hi ha una classe emergent de càrregues de treball que no poden explotar plenament les capacitats de paral·lelisme massiu dels acceleradors convencionals. Moltes aplicacions HPC es veuen sovint limitades per execucions seqüencials compostes de petites seccions de càlcul intensiu que inclouen patrons complexos de dependències. Això és especialment notable en les aplicacions de ciències de la vida i de la salut, que implementen llargs fluxos de treball de processament de dades. Sovint basats en càlculs "stencil" i de programació dinàmica, aquests algorismes "dependency-bound" tendeixen a ser d'una mida moderada i implementen patrons complexos de dependències de dades que, en última instància, restringeixen l'aprofitament del paral·lelisme. La medicina de precisió pretén millorar l'assistència sanitària utilitzant dades genòmiques. En els últims anys, la forta reducció dels costos de la seqüenciació genòmica ha impulsat un augment espectacular de la quantitat de dades generades per al seu processament, la qual cosa ha plantejat un important repte computacional i d'emmagatzematge. L'alineació de seqüències, un dels problemes computacionals més exigents abordats en els estudis de seqüenciació, té nombroses aplicacions, entre elles el mapatge de "reads". L'objectiu del mapatge de "reads" és alinear les lectures extretes dels sistemes de seqüenciació contra un genoma de referència. S'utilitza un esquema de programació dinàmica per a assignar una puntuació d'alineament a cadascun dels candidats, la qual cosa condueix a una paral·lelització sub-optima de les dades a causa dels patrons "dependency-bound". L'objectiu principal d'aquest treball és millorar el rendiment de les aplicacions genòmiques mitjançant l'acceleració software i hardware. Presentem quatre contribucions a aquest camp. Les tres primeres són millores software, inclosa la proposta d'un algorisme, optimitzacions software i l'adaptació de diversos algorismes a l'arquitectura ARM. En l'última, ampliem el nostre camp d'estudi i proposem un nou accelerador hardware per a algorismes "dependency-bound", el qual aborda algorismes de programació dinàmica utilitzats en "pipelines" genòmics. (Español) Las arquitecturas multinúcleo y los aceleradores modernos se han convertido en la piedra angular para acelerar muchas cargas de trabajo en aplicaciones científicas y de ingeniería. Se han realizado muchos esfuerzos para acelerar aplicaciones HPC en arquitecturas hardware modernas como las CPUs y las GPUs, así como las FPGAs y aceleradores a medida (ASICs) para cargas de trabajo específicas. De ahí que cada vez se busquen más plataformas HPC para manejar cargas de trabajo a gran escala que exploten los distintos niveles de paralelismo disponibles en los aceleradores. Sin embargo, hay una clase emergente de cargas de trabajo que no pueden explotar plenamente las capacidades de paralelismo masivo de los aceleradores convencionales. Muchas aplicaciones HPC se ven a menudo limitadas por ejecuciones secuenciales compuestas de pequeñas secciones de cálculo intensivo que incluyen patrones complejos de dependencias. Esto es especialmente notable en las aplicaciones de ciencias de la vida y de la salud, que implementan largos flujos de trabajo de procesamiento de datos. A menudo basados en cálculos "stencil" y de programación dinámica, estos algoritmos "dependency-bound" tienden a ser de tamaño moderado e implementan patrones complejos de dependencias de datos que, en última instancia, restringen el aprovechamiento del paralelismo. La medicina de precisión pretende mejorar la asistencia sanitaria utilizando datos genómicos. En los últimos años, la fuerte reducción de los costes de la secuenciación genómica ha impulsado un aumento espectacular de la cantidad de datos generados para su procesamiento, lo que ha planteado un importante reto computacional y de almacenamiento. La alineación de secuencias, uno de los problemas computacionales más exigentes abordados en los estudios de secuenciación, tiene numerosas aplicaciones, entre ellas el mapeo de "reads". El objetivo del mapeo de "reads" es alinear las lecturas extraídas de los sistemas de secuenciación contra un genoma de referencia. Se utiliza un esquema de programación dinámica para asignar una puntuación de alineamiento a cada uno de los candidatos, lo que conduce a una paralelización sub-optima de los datos debido a los patrones "dependency-bound". El objetivo principal de este trabajo es mejorar el rendimiento de las aplicaciones genómicas mediante la aceleración software y hardware. Presentamos cuatro contribuciones a este campo. Las tres primeras son mejoras software, incluida la propuesta de un algoritmo, optimizaciones software y la adaptación de varios algoritmos a la arquitectura ARM. En la última, ampliamos nuestro campo de estudio y proponemos un nuevo acelerador hardware para algoritmos "dependency-bound", el cual aborda algoritmos de programación dinámica utilizados en "pipelines" genómicos. DOCTORAT EN ARQUITECTURA DE COMPUTADORS (Pla 2012) |
| Publikationsart: | Dissertation/Thesis |
| Dateibeschreibung: | application/pdf |
| Sprache: | English |
| DOI: | 10.5821/dissertation-2117-456958 |
| Zugangs-URL: | http://hdl.handle.net/10803/696948 https://dx.doi.org/10.5821/dissertation-2117-456958 |
| Rights: | L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/ |
| Dokumentencode: | edstdx.10803.696948 |
| Datenbank: | TDX |
Schreiben Sie den ersten Kommentar!