使用方法

注册与登录

访问魔音工坊官网(moyin.com),点击右上角的“登录”按钮。新用户可选择手机号或邮箱注册,完成验证后即可进入工作台。登录后系统会默认分配免费额度,用于体验基础语音合成功能。建议首次使用前先阅读平台提供的快速入门指南,了解界面布局。

选择声音模型

进入创作页面后,左侧为声音库面板。魔音工坊提供数百种预设声音,涵盖普通话、粤语、英语、日语等语种。点击任意声音卡片可试听音色。若需要更精准的风格匹配,可以使用搜索栏按“温柔”“新闻”“动漫”等关键词筛选。对于有定制需求的用户,点击“声音克隆”选项,上传一段30秒以上的干净人声样本,系统会自动生成专属声音模型,通常需要3-5分钟处理时间。

输入文本与基础调整

在右侧文本编辑区输入或粘贴需要合成的文字内容。支持直接输入,也支持导入TXT、SRT等格式文件。输入后点击“预览”按钮,系统会快速生成第一版音频。若对语速、音调或停顿不满意,可在“高级参数”面板中调节:语速范围0.5-2.0倍,音调可微调±5个半音,停顿则通过插入“”标记实现精确控制。注意每次调整后需重新点击预览生效。

多段合成与多情感控制

对于较长的文案,建议分段合成。点击“添加段落”按钮可单独设置每一段的音色和参数,适合制作对话或旁白混合的音频。魔音工坊支持情感标签,在文本中插入“[happy]”“[sad]”等标签,合成时会自动匹配对应情感的语气变调。目前官方支持开心、悲伤、愤怒、惊讶四种基础情感,部分声音模型还支持自定义情感强度。

导出与格式选择

合成满意后点击“导出”按钮。弹出窗口提供多种格式:MP3(320kbps)、WAV(16bit/44.1kHz)、OGG等。若用于视频配音,建议选择WAV以保证音质;若用于移动端分享,MP3更合适。导出前还可勾选“降噪处理”以去除背景底噪。完成后音频文件将自动下载到本地,同时云端保存30天内的历史记录,可在“我的作品”中随时回听或二次编辑。

批量处理与API接入

魔音工坊支持批量合成功能。在“批量工具”中上传包含多行文本的CSV文件,每行对应一条音频,系统会按设置的声音和参数依次生成并打包为ZIP下载。对于开发团队,官网“开发文档”提供了RESTful API接口,支持文本转语音、声音克隆、流式合成等能力,调用前需申请API密钥并阅读限流说明。