IEEE ICASSP 2024 || Seoul, Korea || 14-19 April 2024

AASP-L3: Environmental Sound Synthesis and Generation

Tue, 16 Apr, 16:30 - 18:30 (UTC +9)

Location: Room E2

Session Type: Lecture

Session Co-Chairs: Francois Germain, Mitsubishi Electric Research Laboratories and Prem Seetharaman, Adobe Research

Track: Audio and Acoustic Signal Processing

Tue, 16 Apr, 16:30 - 16:50 (UTC +9)

AASP-L3.1: Environmental sound synthesis from vocal imitations and sound event labels

Yuki Okamoto, Ritsumeikan University, Japan; Keisuke Imoto, Doshisha University, Japan; Shinnosuke Takamichi, The University of Tokyo, Japan; Ryotaro Nagase, Takahiro Fukumori, Yoichi Yamashita, Ritsumeikan University, Japan

Tue, 16 Apr, 16:50 - 17:10 (UTC +9)

AASP-L3.2: RETRIEVAL-AUGMENTED TEXT-TO-AUDIO GENERATION

Yi Yuan, Haohe Liu, Xubo Liu, Qiushi Huang, Mark D. Plumbley, Wenwu Wang, University of Surrey, United Kingdom of Great Britain and Northern Ireland

Tue, 16 Apr, 17:10 - 17:30 (UTC +9)

AASP-L3.3: SOUNDLOCD: AN EFFICIENT CONDITIONAL DISCRETE CONTRASTIVE LATENT DIFFUSION MODEL FOR TEXT-TO-SOUND GENERATION

Xinlei Niu, Jing Zhang, Australian National University, Australia; Christian Walder, Google DeepMind, Canada; Charles Patrick Martin, Australian National University, Australia

Tue, 16 Apr, 17:30 - 17:50 (UTC +9)

AASP-L3.4: MTDIFFUSION: MULTI-TASK DIFFUSION MODEL WITH DUAL-UNET FOR FOLEY SOUND GENERATION

Anbin Qi, Xiang Xie, Jing Wang, Beijing Institute of Technology, China

Tue, 16 Apr, 17:50 - 18:10 (UTC +9)

AASP-L3.5: GENERATION OR REPLICATION: AUSCULTATING AUDIO LATENT DIFFUSION MODELS

Dimitrios Bralios, University of Illinois Urbana-Champaign, United States of America; Gordon Wichern, François Germain, Zexu Pan, Sameer Khurana, Chiori Hori, Jonathan Le Roux, Mitsubishi Electric Research Laboratories (MERL), United States of America

Tue, 16 Apr, 18:10 - 18:30 (UTC +9)

AASP-L3.6: ADAPTING FRECHET AUDIO DISTANCE FOR GENERATIVE MUSIC EVALUATION

Azalea (Yijie) Gui, University of Toronto, Canada; Hannes Gamper, Sebastian Braun, Dimitra Emmanouilidou, Microsoft, United States of America