Innovative Tools and Strategies for Metabolomics Data Analysis

Gespeichert in:
Bibliographische Detailangaben
Titel: Innovative Tools and Strategies for Metabolomics Data Analysis
Autoren: Llambrich Rodriguez, Maria
Thesis Advisors: Brezmes Llecha, Jesús Jorge, Cumeras Olmeda, Raquel
Quelle: TDX (Tesis Doctorals en Xarxa)
Verlagsinformationen: "Universitat Rovira i Virgili", 2025.
Publikationsjahr: 2025
Beschreibung: 267 p.
Schlagwörter: Metabolòmica, Data anàlisis, Compostos orgànics volàtils, Compuestos Organicos volatil, Metabolomics, Data Analysis, volatile compounds, Ciències de la salut
Beschreibung: La metabolòmica és un bon enfocament per comprendre els fenotips. Això és valuós en aplicacions biomèdiques, ja que els metabòlits proporcionen informació sobre els processos bioquímics en temps real. La volatilòmica es centra en els compostos orgànics volàtils (VOCs), molècules petites amb potencial per a diagnòstics no invasius. Tècniques com la cromatografia de gasos acoblada a l’espectrometria de masses (GC-MS) i la cromatografia de gasos bidimensional (GC×GC-MS) ofereixen alta sensibilitat i capacitats d’alt rendiment per al seu anàlisi. Tanmateix, desafiaments com el processament de dades de gran dimensionalitat, la variabilitat metodològica i la manca d’estandardització en els resultats limiten la adopció clínica més àmplia. Aquesta tesi aborda aquests desafiaments mitjançant el desenvolupament d’eines i estratègies per automatitzar i estandarditzar els fluxos de treball en metabolòmica, impulsant el potencial clínic de la metabolòmica i la volatilòmica. El treball se centra en tres objectius principals: millorar l’anàlisi de dades de GC×GC-MS, perfeccionar les metodologies per a l’anàlisi de VOCs en orina i millorar la integració de dades entre estudis. La tesi presenta GcDUO, un programari de codi obert en R per al processament en bloc de dades complexes de GC×GC-MS en metabolòmica. GcDUO és escalable i personalitzable, resolent barreres clau en la gestió de conjunts de dades de gran dimensionalitat. En el segon objectiu es va compilar una base de dades amb 841 VOCs urinàries i es va validar el mètode de GC-MS basat en SPME Arrow, demostrant la seva reproductibilitat i utilitat per a aplicacions clíniques. Per abordar la variabilitat en la nomenclatura dels metabolits, s’ha desenvolupat dues eines. L’Estratègia d’Unificació de Metabolits que estandarditza els identificadors de metabolits per millorar la integració de conjunts de dades, mentre que Amanida, una eina de metanàlisi, sintetitza resultats de diversos estudis. Amanida, disponible com a paquet de R i aplicació Shiny. Aquestes innovacions automatitzen el processament de dades, estandarditzen metodologies i milloren la comparabilitat dels resultats, enfortint el paper de la metabolòmica en la recerca clínica.
Description (Translated): Los metabolitos, productos de procesos celulares, reflejan la actividad bioquímica de los organismos, lo que convierte a la metabolómica en un enfoque poderoso para comprender los fenotipos. Esto es particularmente valioso en aplicaciones biomédicas. La volatilómica se centra en los compuestos orgánicos volátiles (VOCs), moléculas pequeñas con potencial para diagnósticos no invasivos. Técnicas como la cromatografía de gases acoplada a espectrometría de masas (GC-MS) y la cromatografía de gases bidimensional (GC×GC-MS) ofrecen alta sensibilidad y capacidades de alto rendimiento para su análisis. Sin embargo, desafíos como el procesamiento de datos de alta dimensionalidad, la variabilidad metodológica y la falta de estandarización en los resultados limitan su adopción clínica. Esta tesis aborda estos desafíos mediante el desarrollo de herramientas y estrategias para automatizar y estandarizar los flujos de trabajo en metabolómica. El trabajo tiene tres objetivos principales: mejorar el análisis de datos de GC×GC-MS, perfeccionar las metodologías para el análisis de VOCs en orina y mejorar la integración de datos entre estudios. La tesis presenta GcDUO, un software de código abierto en R para el procesamiento por lotes de datos complejos GC×GC-MS en metabolómica. GcDUO es escalable y personalizable, resolviendo barreras clave en el manejo de conjuntos de datos de alta dimensionalidad. Para el segundo objetivo se compiló una base de datos con 841 VOCs urinarios y se validó el método de GC-MS basado en SPME Arrow, demostrando su reproducibilidad y utilidad para aplicaciones clínicas. Para la integración de datos, se desarrollaron dos herramientas. La Estrategia de Unificación de Metabolitos que estandariza los identificadores de metabolitos, mientras que Amanida, una herramienta de meta-análisis, sintetiza hallazgos de múltiples estudios utilizando estadísticas generales. Amanida, disponible tanto en R como app Shiny. Estas innovaciones automatizan el procesamiento de datos, estandarizan metodologías y mejoran la comparabilidad de resultados, fortaleciendo el papel de la metabolómica en la investigación clínica y traslacional.
Metabolites, products of cellular processes, reflect the biochemical activity of organisms, making metabolomics—the study of metabolites—a powerful approach to understanding phenotypes. This is particularly valuable in biomedical applications, as metabolites provide insights into real-time biochemical processes. Among the subfields of metabolomics, volatilomics focuses on volatile organic compounds (VOCs), small molecules with significant potential for non-invasive diagnostics. Techniques like gas chromatography–mass spectrometry (GC-MS) and comprehensive GC×GC-MS offer sensitivity and high-throughput capabilities for VOC analysis. However, challenges such as high-dimensional data processing, methodological variability, and the lack of standardized reporting hinder broader clinical adoption. This thesis addresses these challenges by developing tools and strategies to automate and standardize metabolomics workflows, advancing the clinical potential of metabolomics and volatilomics. The work focuses on three objectives: improving GC×GC-MS data analysis, refining VOC methodologies for urine, and enhancing data integration across studies through harmonization and meta-analysis. To streamline GC×GC-MS data processing, the thesis introduces GcDUO, an open-source R-based software for batch processing complex metabolomics data. GcDUO is scalable and customizable, addressing key barriers in handling high-dimensional datasets. Urine, a key biofluid in diagnostics, was central to the second objective. A database of 841 urinary VOCs was compiled, and SPME Arrow-based GC-MS was validated for reproducibility and high-throughput clinical applications. To tackle variability in metabolite reporting, two tools were developed. The Metabolite Merging Strategy standardizes metabolite identifiers for better dataset integration, while Amanida, a meta-analysis tool, synthesizes findings from multiple studies using overall statistics. Amanida, available as an R package and Shiny app, enables evidence-based approaches in metabolomics. These innovations automate data processing, standardize methodologies, and improve result comparability, strengthening metabolomics' role in clinical and translational research.
"Universitat Rovira i Virgili. Programa de doctorat en Tecnologies per a Nanosistemes, Bioenginyeria i Energia"
Publikationsart: Dissertation/Thesis
Dateibeschreibung: application/pdf
Sprache: English
Zugangs-URL: http://hdl.handle.net/10803/694113
Rights: ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
info:eu-repo/semantics/embargoedAccess
Dokumentencode: edstdx.10803.694113
Datenbank: TDX
FullText Text:
  Availability: 0
CustomLinks:
  – Url: http://hdl.handle.net/10803/694113#
    Name: EDS - TDX (s4221598)
    Category: fullText
    Text: View record in TDX
Header DbId: edstdx
DbLabel: TDX
An: edstdx.10803.694113
RelevancyScore: 1423
AccessLevel: 3
PubType: Dissertation/ Thesis
PubTypeId: dissertation
PreciseRelevancyScore: 1423.37231445313
IllustrationInfo
Items – Name: Title
  Label: Title
  Group: Ti
  Data: Innovative Tools and Strategies for Metabolomics Data Analysis
– Name: Author
  Label: Authors
  Group: Au
  Data: <searchLink fieldCode="AR" term="%22Llambrich+Rodriguez%2C+Maria%22">Llambrich Rodriguez, Maria</searchLink>
– Name: Author
  Label: Thesis Advisors
  Group: Au
  Data: Brezmes Llecha, Jesús Jorge<br />Cumeras Olmeda, Raquel
– Name: TitleSource
  Label: Source
  Group: Src
  Data: TDX (Tesis Doctorals en Xarxa)
– Name: Publisher
  Label: Publisher Information
  Group: PubInfo
  Data: "Universitat Rovira i Virgili", 2025.
– Name: DatePubCY
  Label: Publication Year
  Group: Date
  Data: 2025
– Name: PhysDesc
  Label: Physical Description
  Group: PhysDesc
  Data: 267 p.
– Name: Subject
  Label: Subject Terms
  Group: Su
  Data: <searchLink fieldCode="DE" term="%22Metabolòmica%22">Metabolòmica</searchLink><br /><searchLink fieldCode="DE" term="%22Data+anàlisis%22">Data anàlisis</searchLink><br /><searchLink fieldCode="DE" term="%22Compostos+orgànics+volàtils%22">Compostos orgànics volàtils</searchLink><br /><searchLink fieldCode="DE" term="%22Compuestos+Organicos+volatil%22">Compuestos Organicos volatil</searchLink><br /><searchLink fieldCode="DE" term="%22Metabolomics%22">Metabolomics</searchLink><br /><searchLink fieldCode="DE" term="%22Data+Analysis%22">Data Analysis</searchLink><br /><searchLink fieldCode="DE" term="%22volatile+compounds%22">volatile compounds</searchLink><br /><searchLink fieldCode="DE" term="%22Ciències+de+la+salut%22">Ciències de la salut</searchLink>
– Name: Abstract
  Label: Description
  Group: Ab
  Data: La metabolòmica és un bon enfocament per comprendre els fenotips. Això és valuós en aplicacions biomèdiques, ja que els metabòlits proporcionen informació sobre els processos bioquímics en temps real. La volatilòmica es centra en els compostos orgànics volàtils (VOCs), molècules petites amb potencial per a diagnòstics no invasius. Tècniques com la cromatografia de gasos acoblada a l’espectrometria de masses (GC-MS) i la cromatografia de gasos bidimensional (GC×GC-MS) ofereixen alta sensibilitat i capacitats d’alt rendiment per al seu anàlisi. Tanmateix, desafiaments com el processament de dades de gran dimensionalitat, la variabilitat metodològica i la manca d’estandardització en els resultats limiten la adopció clínica més àmplia. Aquesta tesi aborda aquests desafiaments mitjançant el desenvolupament d’eines i estratègies per automatitzar i estandarditzar els fluxos de treball en metabolòmica, impulsant el potencial clínic de la metabolòmica i la volatilòmica. El treball se centra en tres objectius principals: millorar l’anàlisi de dades de GC×GC-MS, perfeccionar les metodologies per a l’anàlisi de VOCs en orina i millorar la integració de dades entre estudis. La tesi presenta GcDUO, un programari de codi obert en R per al processament en bloc de dades complexes de GC×GC-MS en metabolòmica. GcDUO és escalable i personalitzable, resolent barreres clau en la gestió de conjunts de dades de gran dimensionalitat. En el segon objectiu es va compilar una base de dades amb 841 VOCs urinàries i es va validar el mètode de GC-MS basat en SPME Arrow, demostrant la seva reproductibilitat i utilitat per a aplicacions clíniques. Per abordar la variabilitat en la nomenclatura dels metabolits, s’ha desenvolupat dues eines. L’Estratègia d’Unificació de Metabolits que estandarditza els identificadors de metabolits per millorar la integració de conjunts de dades, mentre que Amanida, una eina de metanàlisi, sintetitza resultats de diversos estudis. Amanida, disponible com a paquet de R i aplicació Shiny. Aquestes innovacions automatitzen el processament de dades, estandarditzen metodologies i milloren la comparabilitat dels resultats, enfortint el paper de la metabolòmica en la recerca clínica.
– Name: Abstract
  Label: Description (Translated)
  Group: Ab
  Data: Los metabolitos, productos de procesos celulares, reflejan la actividad bioquímica de los organismos, lo que convierte a la metabolómica en un enfoque poderoso para comprender los fenotipos. Esto es particularmente valioso en aplicaciones biomédicas. La volatilómica se centra en los compuestos orgánicos volátiles (VOCs), moléculas pequeñas con potencial para diagnósticos no invasivos. Técnicas como la cromatografía de gases acoplada a espectrometría de masas (GC-MS) y la cromatografía de gases bidimensional (GC×GC-MS) ofrecen alta sensibilidad y capacidades de alto rendimiento para su análisis. Sin embargo, desafíos como el procesamiento de datos de alta dimensionalidad, la variabilidad metodológica y la falta de estandarización en los resultados limitan su adopción clínica. Esta tesis aborda estos desafíos mediante el desarrollo de herramientas y estrategias para automatizar y estandarizar los flujos de trabajo en metabolómica. El trabajo tiene tres objetivos principales: mejorar el análisis de datos de GC×GC-MS, perfeccionar las metodologías para el análisis de VOCs en orina y mejorar la integración de datos entre estudios. La tesis presenta GcDUO, un software de código abierto en R para el procesamiento por lotes de datos complejos GC×GC-MS en metabolómica. GcDUO es escalable y personalizable, resolviendo barreras clave en el manejo de conjuntos de datos de alta dimensionalidad. Para el segundo objetivo se compiló una base de datos con 841 VOCs urinarios y se validó el método de GC-MS basado en SPME Arrow, demostrando su reproducibilidad y utilidad para aplicaciones clínicas. Para la integración de datos, se desarrollaron dos herramientas. La Estrategia de Unificación de Metabolitos que estandariza los identificadores de metabolitos, mientras que Amanida, una herramienta de meta-análisis, sintetiza hallazgos de múltiples estudios utilizando estadísticas generales. Amanida, disponible tanto en R como app Shiny. Estas innovaciones automatizan el procesamiento de datos, estandarizan metodologías y mejoran la comparabilidad de resultados, fortaleciendo el papel de la metabolómica en la investigación clínica y traslacional.<br />Metabolites, products of cellular processes, reflect the biochemical activity of organisms, making metabolomics—the study of metabolites—a powerful approach to understanding phenotypes. This is particularly valuable in biomedical applications, as metabolites provide insights into real-time biochemical processes. Among the subfields of metabolomics, volatilomics focuses on volatile organic compounds (VOCs), small molecules with significant potential for non-invasive diagnostics. Techniques like gas chromatography–mass spectrometry (GC-MS) and comprehensive GC×GC-MS offer sensitivity and high-throughput capabilities for VOC analysis. However, challenges such as high-dimensional data processing, methodological variability, and the lack of standardized reporting hinder broader clinical adoption. This thesis addresses these challenges by developing tools and strategies to automate and standardize metabolomics workflows, advancing the clinical potential of metabolomics and volatilomics. The work focuses on three objectives: improving GC×GC-MS data analysis, refining VOC methodologies for urine, and enhancing data integration across studies through harmonization and meta-analysis. To streamline GC×GC-MS data processing, the thesis introduces GcDUO, an open-source R-based software for batch processing complex metabolomics data. GcDUO is scalable and customizable, addressing key barriers in handling high-dimensional datasets. Urine, a key biofluid in diagnostics, was central to the second objective. A database of 841 urinary VOCs was compiled, and SPME Arrow-based GC-MS was validated for reproducibility and high-throughput clinical applications. To tackle variability in metabolite reporting, two tools were developed. The Metabolite Merging Strategy standardizes metabolite identifiers for better dataset integration, while Amanida, a meta-analysis tool, synthesizes findings from multiple studies using overall statistics. Amanida, available as an R package and Shiny app, enables evidence-based approaches in metabolomics. These innovations automate data processing, standardize methodologies, and improve result comparability, strengthening metabolomics' role in clinical and translational research.<br />"Universitat Rovira i Virgili. Programa de doctorat en Tecnologies per a Nanosistemes, Bioenginyeria i Energia"
– Name: TypeDocument
  Label: Document Type
  Group: TypDoc
  Data: Dissertation/Thesis
– Name: Format
  Label: File Description
  Group: SrcInfo
  Data: application/pdf
– Name: Language
  Label: Language
  Group: Lang
  Data: English
– Name: URL
  Label: Access URL
  Group: URL
  Data: <link linkTarget="URL" linkTerm="http://hdl.handle.net/10803/694113" linkWindow="_blank">http://hdl.handle.net/10803/694113</link>
– Name: Copyright
  Label: Rights
  Group: Cpyrght
  Data: ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.<br />info:eu-repo/semantics/embargoedAccess
– Name: AN
  Label: Accession Number
  Group: ID
  Data: edstdx.10803.694113
PLink https://erproxy.cvtisr.sk/sfx/access?url=https://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edstdx&AN=edstdx.10803.694113
RecordInfo BibRecord:
  BibEntity:
    Languages:
      – Text: English
    PhysicalDescription:
      Pagination:
        PageCount: 267
    Subjects:
      – SubjectFull: Metabolòmica
        Type: general
      – SubjectFull: Data anàlisis
        Type: general
      – SubjectFull: Compostos orgànics volàtils
        Type: general
      – SubjectFull: Compuestos Organicos volatil
        Type: general
      – SubjectFull: Metabolomics
        Type: general
      – SubjectFull: Data Analysis
        Type: general
      – SubjectFull: volatile compounds
        Type: general
      – SubjectFull: Ciències de la salut
        Type: general
    Titles:
      – TitleFull: Innovative Tools and Strategies for Metabolomics Data Analysis
        Type: main
  BibRelationships:
    HasContributorRelationships:
      – PersonEntity:
          Name:
            NameFull: Llambrich Rodriguez, Maria
    IsPartOfRelationships:
      – BibEntity:
          Dates:
            – D: 27
              M: 02
              Type: published
              Y: 2025
ResultId 1