覆盖中、英、日、韩、西、法等多语种,支持新闻播报、童声、解说等数十种音色风格,适配全球内容创作场景。
仅需少量样本即可复刻特定人声,保留音色、语速与呼吸细节,也可创建专属音库,实现个性化语音输出。
支持喜悦、悲伤、愤怒、惊讶等多种情绪嵌入,可调节语速、音高与停顿,让合成语音富有表现力与真实感。
北京灵动音科技有限公司正式成立,团队核心成员来自出门问问、微软亚洲研究院等机构,专注于AI语音合成技术研发,为后续魔音工坊产品奠定算法基础。
魔音工坊首个版本上线,推出网页端AI配音工具,支持中文语音合成,提供数十种音色选择,率先在短视频创作者群体中获好评,注册用户突破10万。
推出多语言合成功能,新增英、日、韩等语种及方言音色;同时上线文本转语音API接口,面向企业和开发者开放商用授权,合作客户覆盖教育、媒体、游戏等领域。
发布声音克隆与情感控制功能,用户可上传短音频定制专属音色,并调节语气、语速、停顿等参数;同年推出移动端App“魔音工坊”,月活跃用户突破100万。
底层模型升级为基于Diffusion的语音生成架构,提升自然度和拟人表现;上线“AI配音直播间”功能,支持实时语音合成与字幕生成,并入驻飞书、钉钉等平台生态。
推出“魔音工坊企业版”,集成角色扮演、长篇有声书制作、多角色对话等高级场景;音色库扩展至5000+,覆盖全球主流语种及方言,累计服务用户超过500万。