RobustVideoMatting(RVM)图片/视频抠像exe免安装环境版
更新: 12/21/2024 字数: 0 字 时长: 0 分钟
概述
RVM 专为稳定人物视频抠像设计。不同于现有神经网络将每一帧作为单独图片处理,RVM 使用循环神经网络,在处理视频流时有时间记忆。RVM 可在任意视频上做实时高清抠像。
在 Nvidia GTX 1080Ti 上实现 4K 76FPS 和 HD 104FPS
配置要求
- Windows10及以上系统
- Nvidia显卡+cuda
特点
- 稳定人物视频抠像设计
- 在任意视频上做实时高清抠
使用说明
项目信息
项目主页:地址
项目说明:地址
在线体验
Colab 演示:体验
网络摄像头演示:体验
模型下载
说明
- 如果下载太慢,可以考虑使用如下
镜像代理
- 在源网址前加上
https://hub.gitmirror.com/
,例如: - 上方链接可能会出现无法使用的情况,您也可以使用其他爱好者提供的链接:
https://ghproxy.com/
https://ghps.cc/
https://gh.ddlc.top/
Framework | Download | Notes |
---|---|---|
PyTorch | rvm_mobilenetv3.pth rvm_resnet50.pth | Official weights for PyTorch. Doc |
TorchHub | Nothing to Download. | 在PyTorch机器学习库项目中使用我们的模型的最简单方法。 Doc |
TorchScript | rvm_mobilenetv3_fp32.torchscript rvm_mobilenetv3_fp16.torchscript rvm_resnet50_fp32.torchscript rvm_resnet50_fp16.torchscript | 如果在移动设备上进行推理,请考虑自己导出int8量化模型 Doc |
ONNX | rvm_mobilenetv3_fp32.onnx rvm_mobilenetv3_fp16.onnx rvm_resnet50_fp32.onnx rvm_resnet50_fp16.onnx | 在带有CPU和CUDA后端的ONNX运行时上进行了测试。提供的型号使用opset 12 Doc, Exporter. |
TensorFlow | rvm_mobilenetv3_tf.zip rvm_resnet50_tf.zip | TensorFlow 2 模型. Doc |
TensorFlow.js | rvm_mobilenetv3_tfjs_int8.zip | 在web上运行模型. Demo, Starter Code |
CoreML | rvm_mobilenetv3_1280x720_s0.375_fp16.mlmodel rvm_mobilenetv3_1280x720_s0.375_int8.mlmodel rvm_mobilenetv3_1920x1080_s0.25_fp16.mlmodel rvm_mobilenetv3_1920x1080_s0.25_int8.mlmodel | CoreML不支持动态分辨率。其他分辨率可以自己导出。型号需要iOS13+. s 表示 downsample_ratio . Doc, Exporter |
paper
arxiv: 点击访问
说明
建议
- 生成的视频,是以原图片裁剪生成512x512比例
EXE免安装环境版💎
截图
注意
启动时,会显示相关信息,根据配置不同,加载时间不同,请耐心等待
- 启动成功,选择操作
- 使用Pytorch框架:4090运行10秒视频抠图合并自定义背景,耗时45-70s左右
下载地址
注意
解压后,路径不要含有中文,路径不要含有中文,路径不要含有中文
下载说明
- 包含了依赖的环境模型等大文件,无需安装,点开即用;
- 大小:9GB