个人简介

  • 谭旭是微软亚洲研究院的首席研究经理,研究方向为生成式人工智能、自然语言/语音/音乐处理、虚拟人、AI内容生成等。
  • 在AI学术会议发表学术论文引用10000+余次,在机器翻译、预训练、语音合成、AI音乐创作等领域的研究在学术界和工业界产生广泛的影响力。
  • 多项技术(如机器翻译技术,预训练模型MASS,语音合成技术FastSpeech 1/2AdaSpeechLRSpeech,音乐生成技术TeleMelodyHiFiSinger,语音识别纠错技术FastCorrect 1/2等)应用在微软产品中(如Bing搜索,Bing广告,Azure机器翻译,Azure语音合成,Azure语音识别,微软小冰等)。
  • 通过Github开源多个项目和工具包,包括MASS,MPNet(Huggingface),MuzicNeuralSpeechJARVIS等。
  • 研发的机器翻译系统在中英新闻翻译上达到人类水平(新智元机器之心微软AI头条InfoQ),并在WMT 2019机器翻译比赛中获多项冠军(新浪新闻微软AI头条)。
  • 研发的预训练模型MASS是该领域最有影响力的模型之一,是ICML 2019最高引(1000+)论文之一。MASS部署在微软Bing搜索广告、微软Azure翻译系统等多个产品线。
  • 研发的FastSpeech 1/2(总引用量2000+)是语音合成领域最广泛使用的技术之一,成为很多语音合成、歌声合成模型的基础。在业界广泛使用, 如应用在微软Azure TTS服务以支持100多种语言的语音合成(Azure AI)。已整合到流行的语音开源项目中,如Fairseq, ESPNet,NVIDIA Nemo,TensorFlowTTS,百度PaddlePaddle Parakeet等。在英伟达GTC大会上作为语音合成加速案例展示。(InfoQ机器之心微软AI头条)
  • 研发的NaturalSpeech在语音合成LJSpeech数据集上首次达到人类录音水平! NaturalSpeech 2实现高质量的零样本语音合成。
  • 在语音合成领域的综述论文演讲教程在学术界和工业界产生广泛的影响。
  • 在AI音乐领域(词曲创作、伴奏生成、编曲、歌声合成、音乐理解等)开展了系统性的研究,研究论文CLaMP获得ISMIR 2023最佳学生论文,开源AI音乐研究项目Muzic
  • 担任Transactions on Machine Learning Research (TMLR) Action Editor,担任AAAI/NeurIPS/ICASSP的Meta审稿人或领域主席,IEEE Senior Member,CCF计算艺术分会常委。



For English Bio, please go to my homepage.