访问 Synthesia 官网(www.synthesia.io),点击右上角的“Get started”按钮进入注册流程。支持邮箱注册或使用Google账户快速登录。完成邮箱验证后,系统会引导你完成基础信息填写,包括你的使用场景(如营销、培训、个人创作等)。注册成功后,你将被引导至主控制台,所有视频项目的创建和管理都从这里开始。
进入“Presenters”选项卡,你会看到Synthesia内置的数十种AI头像,覆盖不同肤色、年龄、着装风格。每个头像都附带多语言口型同步支持。点击任意头像可预览其说话效果。若你需要自定义形象,可上传本人正面录制视频,Synthesia会根据素材生成专属数字分身。注意上传视频需满足光线充足、背景整洁、口齿清晰的条件,生成过程通常需要数小时。
创建新项目后,进入“Script”编辑框。你可以直接输入文字,也可以粘贴已有内容。Synthesia支持超过120种语言的文本转语音,包括中文(普通话及粤语)、英语、日语、西班牙语等。在右侧“Language”下拉菜单中选择目标语言,系统会自动匹配对应语种的语音。若需调整语气或语速,可点击“Voice settings”调节参数,支持从慢速到快速的五档调节。脚本框内支持换行和标点符号,这些都会影响AI语音的停顿与节奏。
点击“Scene”标签可切换不同的视频场景。Synthesia提供多种内置背景模板,如办公室、演播室、纯色背景等。你也可以上传自定义图片或视频作为背景。在“Media”选项卡中,可插入图片、视频片段、形状和文字叠加层。所有元素均支持拖动调整位置和大小,时间轴编辑器允许你精确控制每个元素的入场与退场时间。注意:若背景为动态视频,建议保持AI头像的尺寸适中,避免遮挡关键信息。
生成视频前,务必检查“Preview”功能。点击播放按钮,观察AI头像的口型是否与脚本内容同步。Synthsia的引擎能够根据文本中的音素自动匹配嘴部动作,但若遇到专有名词或外语混合情况,可能会出现轻微不同步。可在“Phonetic editing”模式下手动调整单词的发音方式。例如,将“Synthesia”拆分为“sin-thee-zha”以改善中文用户的听感。调整后再次预览,直到满意为止。
完成所有编辑后,点击右下角“Generate”按钮。生成时间取决于视频长度和画质选择,通常1分钟以内的视频大约需要3-5分钟。生成完成后,你会进入“Download”页面。Synthesia支持导出为MP4格式,分辨率可选720p、1080p或4K。注意:免费试用版本会带有Synthesia水印,付费订阅可去除。导出后的视频文件可直接用于社交媒体、网站嵌入或内部培训平台。
在“Projects”页面,你可以创建文件夹对视频分类管理。点击视频右侧的“Share”按钮,可生成协作链接,邀请团队成员在线编辑脚本或添加注释。每个项目都会保留版本历史,方便回溯修改。如果你需要批量生成多个视频(例如产品演示的不同语言版本),可使用“Bulk generate”功能,上传包含脚本、语言、头像配置的CSV文件,系统会自动创建并渲染所有视频。此功能尤其适合多语言营销团队。
对于开发者或需要高度自动化的用户,Synthesia提供REST API。通过API,你可以将视频生成功能嵌入到自己的应用或后台系统中。例如,自动根据用户提交的表单数据生成个性化欢迎视频。官方文档中提供了详细的端点说明、身份验证方式以及Python、JavaScript的示例代码。使用API时需注意速率限制,每个账户每分钟最多可发起60次请求,超出时会被临时限制。
在编辑过程中,建议定期点击“Save”按钮,系统不会自动保存草稿。如果你需要更换已生成视频中的头像或背景,必须重新生成整个视频,无法单独替换某一元素。另外,Synthesia的AI不支持实时直播功能,仅能生成预渲染视频文件。对于需要字幕的视频,可在“Subtitles”选项卡开启自动字幕生成,支持SRT格式下载,方便后续本地化编辑。