Skip to content

RobustVideoMatting(RVM)图片/视频抠像exe免安装环境版

更新: 12/21/2024 字数: 0 字 时长: 0 分钟

概述

RVM 专为稳定人物视频抠像设计。不同于现有神经网络将每一帧作为单独图片处理,RVM 使用循环神经网络,在处理视频流时有时间记忆。RVM 可在任意视频上做实时高清抠像。

在 Nvidia GTX 1080Ti 上实现 4K 76FPSHD 104FPS

配置要求

  • Windows10及以上系统
  • Nvidia显卡+cuda

40371e24fd20241122105502

特点

  • 稳定人物视频抠像设计
  • 在任意视频上做实时高清抠

使用说明

项目信息

项目主页:地址

项目说明:地址

在线体验

Colab 演示:体验

网络摄像头演示:体验

模型下载

说明

FrameworkDownloadNotes
PyTorchrvm_mobilenetv3.pth
rvm_resnet50.pth
Official weights for PyTorch. Doc
TorchHubNothing to Download.在PyTorch机器学习库项目中使用我们的模型的最简单方法。 Doc
TorchScriptrvm_mobilenetv3_fp32.torchscript
rvm_mobilenetv3_fp16.torchscript
rvm_resnet50_fp32.torchscript
rvm_resnet50_fp16.torchscript
如果在移动设备上进行推理,请考虑自己导出int8量化模型 Doc
ONNXrvm_mobilenetv3_fp32.onnx
rvm_mobilenetv3_fp16.onnx
rvm_resnet50_fp32.onnx
rvm_resnet50_fp16.onnx
在带有CPU和CUDA后端的ONNX运行时上进行了测试。提供的型号使用opset 12 Doc, Exporter.
TensorFlowrvm_mobilenetv3_tf.zip
rvm_resnet50_tf.zip
TensorFlow 2 模型. Doc
TensorFlow.jsrvm_mobilenetv3_tfjs_int8.zip在web上运行模型. Demo, Starter Code
CoreMLrvm_mobilenetv3_1280x720_s0.375_fp16.mlmodel
rvm_mobilenetv3_1280x720_s0.375_int8.mlmodel
rvm_mobilenetv3_1920x1080_s0.25_fp16.mlmodel
rvm_mobilenetv3_1920x1080_s0.25_int8.mlmodel
CoreML不支持动态分辨率。其他分辨率可以自己导出。型号需要iOS13+. s 表示 downsample_ratio. Doc, Exporter

paper

arxiv: 点击访问

说明

建议

  • 生成的视频,是以原图片裁剪生成512x512比例

EXE免安装环境版💎

截图

图片[2]-RobustVideoMatting(RVM)图片/视频抠像免安装环境版-AI - The Next generation

注意

启动时,会显示相关信息,根据配置不同,加载时间不同,请耐心等待

图片[3]-RobustVideoMatting(RVM)图片/视频抠像免安装环境版-AI - The Next generation

  • 启动成功,选择操作

图片[4]-RobustVideoMatting(RVM)图片/视频抠像免安装环境版-AI - The Next generation

  • 使用Pytorch框架:4090运行10秒视频抠图合并自定义背景,耗时45-70s左右

图片[5]-RobustVideoMatting(RVM)图片/视频抠像免安装环境版-AI - The Next generation

下载地址

注意

解压后,路径不要含有中文路径不要含有中文路径不要含有中文

下载说明

  • 包含了依赖的环境模型等大文件,无需安装,点开即用;
  • 大小:9GB

主地址

备用地址

网站公告

说明

本站正在搭建并持续更新中,如果对您有帮助,不妨加入收藏

Last updated: