Výsledky vyhľadávania - "Electrical Engineering and Systems Science - Audio and Speech Processing"

  1. 1

    Generalized Domain Adaptation Framework for Parametric Back-End in Speaker Recognition Autor Qiongqiong Wang, Koji Okabe, Kong Aik Lee, Takafumi Koshinaka

    ISSN: 1556-6013, 1556-6021
    Vydavateľské údaje: Institute of Electrical and Electronics Engineers (IEEE) 01.01.2023
    Získať plný text
    Journal Article
  2. 2

    Versatile Time-Frequency Representations Realized by Convex Penalty on Magnitude Spectrogram Autor Keidai Arai, Koki Yamada, Kohei Yatabe

    ISSN: 1070-9908, 1558-2361
    Vydavateľské údaje: Institute of Electrical and Electronics Engineers (IEEE) 01.01.2023
    Vydané v IEEE Signal Processing Letters (01.01.2023)
    Získať plný text
    Journal Article
  3. 3

    Investigation of Japanese PnG BERT Language Model in Text-to-Speech Synthesis for Pitch Accent Language Autor Yusuke Yasuda, Tomoki Toda

    ISSN: 1932-4553, 1941-0484
    Vydavateľské údaje: Institute of Electrical and Electronics Engineers (IEEE) 01.10.2022
    Získať plný text
    Journal Article
  4. 4
  5. 5
  6. 6

    Bass Accompaniment Generation Via Latent Diffusion Autor Pasini, Marco, Grachten, Maarten, Lattner, Stefan

    ISSN: 2379-190X
    Vydavateľské údaje: IEEE 14.04.2024
    “…The ability to automatically generate music that appropriately matches an arbitrary input track is a challenging task. We present a novel controllable system…”
    Získať plný text
    Konferenčný príspevok..
  7. 7
  8. 8
  9. 9

    RISC: A Corpus for Shout Type Classification and Shout Intensity Prediction Autor Takahiro Fukumori, Taito Ishida, Yoichi Yamashita

    ISSN: 2329-9290, 2329-9304
    Vydavateľské údaje: Institute of Electrical and Electronics Engineers (IEEE) 01.01.2024
    Získať plný text
    Journal Article
  10. 10

    PeriodGrad: Towards Pitch-Controllable Neural Vocoder Based on a Diffusion Probabilistic Model Autor Hono, Yukiya, Hashimoto, Kei, Nankaku, Yoshihiko, Tokuda, Keiichi

    ISSN: 2379-190X
    Vydavateľské údaje: IEEE 14.04.2024
    “…This paper presents a neural vocoder based on a denoising diffusion probabilistic model (DDPM) incorporating explicit periodic signals as auxiliary…”
    Získať plný text
    Konferenčný príspevok..
  11. 11

    MOS-FAD: Improving Fake Audio Detection Via Automatic Mean Opinion Score Prediction Autor Zhou, Wangjin, Yang, Zhengdong, Chu, Chenhui, Li, Sheng, Dabre, Raj, Zhao, Yi, Tatsuya, Kawahara

    ISSN: 2379-190X
    Vydavateľské údaje: IEEE 14.04.2024
    “…IEEE Automatic Mean Opinion Score (MOS) prediction is employed to evaluate the quality of synthetic speech. This study extends the application of predicted MOS…”
    Získať plný text
    Konferenčný príspevok..
  12. 12
  13. 13

    Data Driven Grapheme-to-Phoneme Representations for a Lexicon-Free Text-to-Speech Autor Garg, Abhinav, Kim, Jiyeon, Khyalia, Sushil, Kim, Chanwoo, Gowda, Dhananjaya

    ISSN: 2379-190X
    Vydavateľské údaje: IEEE 14.04.2024
    “…Grapheme-to-Phoneme (G2P) is an essential first step in any modern, high-quality Text-to-Speech (TTS) system. Most of the current G2P systems rely on carefully…”
    Získať plný text
    Konferenčný príspevok..
  14. 14
  15. 15
  16. 16
  17. 17

    Localizing Acoustic Energy in Sound Field Synthesis by Directionally Weighted Exterior Radiation Suppression Autor Tomita, Yoshihide, Koyama, Shoichi, Saruwatari, Hiroshi

    ISSN: 2379-190X
    Vydavateľské údaje: IEEE 14.04.2024
    “…A method for synthesizing the desired sound field while suppressing the exterior radiation power with directional weighting is proposed. The exterior radiation…”
    Získať plný text
    Konferenčný príspevok..
  18. 18

    Optimizing multi-user indoor sound communications with acoustic reconfigurable metasurfaces Autor Hongkuan Zhang, Qiyuan Wang, Mathias Fink, Guancong Ma

    ISSN: 2041-1723
    Vydavateľské údaje: Springer Science and Business Media LLC 10.02.2024
    Vydané v Nature Communications (10.02.2024)
    Získať plný text
    Journal Article
  19. 19
  20. 20