IEEE ICASSP 2024 || Seoul, Korea || 14-19 April 2024

AASP-P16: Music separation; Audio for multimedia and audio processing systems

Thu, 18 Apr, 16:30 - 18:30 (UTC +9)

Location: Poster Zone 4C

Session Type: Poster

Session Chair: Jordi Pons, Stability AI

Track: Audio and Acoustic Signal Processing

AASP-P16.1: PoP-IDLMA: Product-of-Prior Independent Deeply Learned Matrix Analysis for Multichannel Music Source Separation

Takuya Hasumi, Tomohiko Nakamura, Norihiro Takamune, Hiroshi Saruwatari, The University of Tokyo, Japan; Daichi Kitamura, National Institute of Technology, Kagawa College, Japan; Yu Takahashi, Kazunobu Kondo, Yamaha Corporation, Japan

AASP-P16.2: VIRTUAL BASS ENHANCEMENT VIA MUSIC DEMIXING

Riccardo Giampiccolo, Alessandro Ilic Mezza, Alberto Bernardini, Augusto Sarti, Politecnico di Milano, Italy

AASP-P16.3: MUSIC SOURCE SEPARATION BASED ON A LIGHTWEIGHT DEEP LEARNING FRAMEWORK (DTTNET: DUAL-PATH TFC-TDF UNET)

Junyu Chen, Imperial College London, United Kingdom of Great Britain and Northern Ireland; Susmitha Vekkot, Amrita Vishwa Vidyapeetham, India; Pancham Shukla, Imperial College London, United Kingdom of Great Britain and Northern Ireland

AASP-P16.4: ON THE EFFECT OF DATA-AUGMENTATION ON LOCAL EMBEDDING PROPERTIES IN THE CONTRASTIVE LEARNING OF MUSIC AUDIO REPRESENTATIONS

Matthew McCallum, Matthew Davies, Florian Henkel, Jaehun Kim, Samuel Sandberg, Sirius XM, United States of America

AASP-P16.1: PoP-IDLMA: Product-of-Prior Independent Deeply Learned Matrix Analysis for Multichannel Music Source Separation

AASP-P16.2: VIRTUAL BASS ENHANCEMENT VIA MUSIC DEMIXING

AASP-P16.3: MUSIC SOURCE SEPARATION BASED ON A LIGHTWEIGHT DEEP LEARNING FRAMEWORK (DTTNET: DUAL-PATH TFC-TDF UNET)

AASP-P16.4: ON THE EFFECT OF DATA-AUGMENTATION ON LOCAL EMBEDDING PROPERTIES IN THE CONTRASTIVE LEARNING OF MUSIC AUDIO REPRESENTATIONS

AASP-P16.5: SCNet: Sparse Compression Network for Music Source Separation

AASP-P16.6: MDX-GAN: ENHANCING PERCEPTUAL QUALITY IN MULTI-CLASS SOURCE SEPARATION VIA ADVERSARIAL TRAINING

AASP-P16.7: STEREOPHONIC MUSIC SOURCE SEPARATION WITH SPATIALLY-INFORMED BRIDGING BAND-SPLIT NETWORK

AASP-P16.8: VOICE TOXICITY DETECTION USING MULTI-TASK LEARNING

AASP-P16.9: AutoPrep: An Automatic Preprocessing Framework for In-the-Wild Speech Data

AASP-P16.10: AAT: ADAPTING AUDIO TRANSFORMER FOR VARIOUS ACOUSTICS RECOGNITION TASKS

AASP-P16.11: Hybrid Packet Loss Concealment for Real-Time Networked Music Applications