EUSIPCO 2023 || Helsinki, Finland || 4

Tue PM2.L1: Speech Recognition

Tue, 5 Sep, 16:40 - 18:20 Finland Time (UTC +3)

Location: EUROPAEA

Session Type: Lecture

Session Chair: Stefan Goetze, University of Sheffield

Track: ASMSP - Acoustic, Speech and Music Signal Processing

Tue, 5 Sep, 16:40 - 17:00 Finland Time (UTC +3)

Tue PM2.L1.1: Mask-CTC-based Encoder Pre-training for Streaming End-to-End Speech Recognition

Huaibo Zhao, Yosuke Higuchi, Waseda University, Japan; Yusuke Kida, Line Corporation, Japan; Tetsuji Ogawa, Tetsunori Kobayashi, Waseda University, Japan

Tue, 5 Sep, 17:00 - 17:20 Finland Time (UTC +3)

Tue PM2.L1.2: LOW-RESOURCE TEXT-TO-SPEECH USING SPECIFIC DATA AND NOISE AUGMENTATION

Kishor Kayyar Lakshminarayana, Christian Dittmar, Nicola Pia, Fraunhofer Institute for Integrated Circuits (IIS), Germany; Emanuël A.P. Habets, Friedrich-Alexander-Universität Erlangen-Nürnberg, Germany

Tue, 5 Sep, 17:20 - 17:40 Finland Time (UTC +3)

Tue PM2.L1.3: CANONICAL VOICE CONVERSION AND DUAL-CHANNEL PROCESSING FOR IMPROVED VOICE PRIVACY OF SPEECH RECOGNITION DATA

Dushyant Sharma, Nuance / Microsoft, United States; Francesco Nespoli, Nuance / Imperial College, United Kingdom; Rong Gong, Nuance / Microsoft, Austria; Patrick Naylor, Imperial College, United Kingdom

Tue, 5 Sep, 17:40 - 18:00 Finland Time (UTC +3)

Tue PM2.L1.4: ROOM ADAPTATION OF TRAINING DATA FOR DISTANT SPEECH RECOGNITION

James Fosburgh, Dushyant Sharma, Nuance Communications Inc., United States; Patrick Naylor, Imperial College London, United Kingdom

Tue, 5 Sep, 18:00 - 18:20 Finland Time (UTC +3)

Tue PM2.L1.5: A PRIVACY-PRESERVING METHOD USING SECRET KEY FOR CONVOLUTIONAL NEURAL NETWORK-BASED SPEECH CLASSIFICATION

Shoko Niwa, Sayaka Shiota, Hitoshi Kiya, Tokyo Metropolitan University, Japan