该项目旨在开发可用于自动创建儿童故事的语音生成技术。 可听故事的生成基于一系列神经网络模块,这些模块经过数小时的粤语儿童故事录音训练。 用户可以使用移动应用程序(iOS 或 Android)收听预加载的故事,建议对故事内容的修改并立即收听修改后的故事。
神经文本到语音(TTS)已被广泛研究并取得了良好的成功。 然而,现有系统无法生成具有所需表达风格的语音,例如讲故事、对话。 该项目的主要技术挑战是儿童讲故事中多方面风格变化的建模和控制说话风格的有效机制。
香港中文大学(中大)成立于1963年,是一所具有全球视野的前瞻性综合性研究型大学,其使命是融合传统与现代,融汇中西。中大师生来自世界各地。四位诺贝尔奖得主与大学有联系,是香港唯一一所拥有诺贝尔奖、图灵奖、菲尔兹奖和凡勃伦奖得主的大专院校。中大毕业生通过广泛的校友网络连接全球。中大在多个学科领域开展广泛的研究项目,并努力为所有学术人员提供开展咨询和与业界合作项目的空间。大学对最高研究标准的坚持为其赢得了令人羡慕的研究声誉。学校设有5个国家重点实验室,受中国科技部委托,开展具有国际水平的研究,承担国家重大科研任务。大学还拥有发表研究的出色记录,无论是在特定学科期刊,还是在更引人注目的出版物上,如《科学》、《自然》和《柳叶刀》。