wav2lip数字人对口型免安装环境版免费下载
更新: 12/21/2024 字数: 0 字 时长: 0 分钟
概述
Wav2Lip 是一种通过将音频与视频中的嘴唇动作同步的技术,旨在生成与音频内容高度匹配的口型动画。其主要应用是让视频中的人物嘴唇动作与配音或其他音频输入精确同步,这在电影配音、虚拟主持人、在线教学、影视后期处理等领域非常有用。
使用说明
项目信息
项目主页:地址
技术原理:地址
模型下载
Model | 描述 | 链接 |
---|---|---|
Wav2Lip | 高度准确的口型同步 | 链接 |
Wav2Lip + GAN | 口型同步略差,但视觉质量更好 | 链接 |
专家判别器 | 专家判别器的权重 | 链接 |
视觉质量鉴别器 | 在 GAN 设置中训练的视盘权重 | 链接 |
在线体验
google-colab: 地址
paper
arxiv: 点击访问
wav2lip高清商用模型免安装WebUI版(推荐) ✅
注意
解压后,路径不要含有中文,路径不要含有中文,路径不要含有中文
下载说明
- 软件已经过测试,测试平台为
Windows10
和Nvidia-4090
显卡 - 不支持
AMD显卡
及核显
,显存尽量大于12GB
,cuda-12
版本,低显存
或低cuda版本不保证正常使用 - 点此查看自己的显卡相关信息
- 压缩包已包含依赖的环境模型等大文件,无需安装环境,点开即用;
- 大小:4GB
下载地址
主地址
备用地址
运行说明
参考提示词
- 下载后,解压缩
- 点击
go-web.bat
访问http://127.0.0.1:7860/
- 基本使用
- 添加自定义数字人
- 显卡如果配置较高,可考虑开启人脸高清
测试音视频
测试两种情况
- 张口+闭口表情
- 一直闭口表情
- 测试音频
- 张口+闭口表情
- 闭口表情
效果
- 张口+闭口结果
- 闭口结果