IEEE ICASSP 2026 || Barcelona, Spain || 4-8 May 2026

AASP-P22: Audio and Speech Source Separation and Signal Enhancement II

Poster

Thu, 7 May, 16:30 - 18:30

Location: Poster Area 24

Session Type: Poster

Session Chair: Jong Won Shin, Gwangju Institute of Science and Technology

Track: Audio and Acoustic Signal Processing [AA]

AASP-P22.1: ADAPTIVE DETERMINISTIC FLOW MATCHING FOR TARGET SPEAKER EXTRACTION

Tsun-An Hsieh, Minje Kim, University of Illinois Urbana-Champaign, United States of America

AASP-P22.2: I-DCCRN-VAE: AN IMPROVED DEEP REPRESENTATION LEARNING FRAMEWORK FOR COMPLEX VAE-BASED SINGLE-CHANNEL SPEECH ENHANCEMENT

Jiatong Li, Simon Doclo, Carl von Ossietzky Universität Oldenburg, Germany

AASP-P22.3: DOMAIN PARTITIONING MEETS PARAMETER-EFFICIENT FINE-TUNING: A NOVEL METHOD FOR IMPROVED LANGUAGE-QUERIED AUDIO SOURCE SEPARATION

Yinkai Zhang, Dingbang Zhang, Tao Wang, Xinjiang University, China; Diana Rakhimova, Al-Farabi Kazakh National University, Kazakhstan; Kai Wang, Hao Huang, Xinjiang University, China

AASP-P22.4: VM-UNSSOR: Unsupervised Neural Speech Separation Enhanced by Higher-SNR Virtual Microphone Arrays

Shulin He, Zhong-Qiu Wang, Southern University of Science and Technology, China

AASP-P22.5: Do We Need EMA for Diffusion-Based Speech Enhancement? Toward a Magnitude-Preserving Network Architecture

Julius Richter, Danilo de Oliveira, Timo Gerkmann, University of Hamburg, Germany

AASP-P22.6: HAIR NOISE ANALYSIS AND MITIGATION FOR SMART GLASSES AUDIO CAPTURES

Subrata Biswas, Worcester Polytechnic Institute, United States of America; Daniel Wong, Meta Platforms, Inc., United States of America; Bashima Islam, Worcester Polytechnic Institute, United States of America; Sanjeel Parekh, Vladimir Tourbabin, Meta Platforms, Inc., United States of America

AASP-P22.7: SOUNDCOMPASS: NAVIGATING TARGET SOUND EXTRACTION WITH EFFECTIVE DIRECTIONAL CLUE INTEGRATION IN COMPLEX ACOUSTIC SCENES

Dayun Choi, Jung-Woo Choi, Korea Advanced Institute of Science and Technology (KAIST), Korea, Republic of

AASP-P22.8: UNMIXX: UNTANGLING HIGHLY CORRELATED SINGING VOICES MIXTURES

Jihoo Jung, Ji-Hoon Kim, Doyeop Kwak, Junwon Lee, Juhan Nam, Joon Son Chung, Korea Advanced Institute of Science and Technology, South Korea, Korea, Republic of

AASP-P22.9: MMAUDIOSEP: TAMING VIDEO-TO-AUDIO GENERATIVE MODEL TOWARDS VIDEO/TEXT-QUERIED SOUND SEPARATION

Akira Takahashi, Shusuke Takahashi, Yuki Mitsufuji, Sony Group Corporation, Japan

AASP-P22.10: DITSE: HIGH-FIDELITY GENERATIVE SPEECH ENHANCEMENT VIA LATENT DIFFUSION TRANSFORMERS

Heitor Rodrigues Guimaraes, Institut National de la Recherche Scientifique, Canada; Jiaqi Su, Rithesh Kumar, Adobe Research, United States of America; Tiago Falk, Institut National de la Recherche Scientifique, Canada; Zeyu Jin, Adobe Research, United States of America