您现在的位置是:首页 > 榴榴无忌

分享使用大模型看视频软件,找到你需要的内容

| 人围观 |

菌斑佬2026-05-09 17:36:36

基于大模型软件,可以根据动作定位到视频的几分几秒。
此模型对英文支持更好,在翻译软件中翻译成英文后再搜索准确率更高
比如搜索女上位,用female on top更准
如果思路打开,可以查看家里猫狗状态。或者要调监控,比起逐帧去找,输入一段话就可以了。比如我要找之前跟谁的合影,上传一张现在的照片,就能找到。软件无需联网隐私无忧
目前开源免费,欢迎提出改进建议
目前单人连轴转,纯纯为爱发电,希望有条件的能去https://github.com/XinzhengDu/SnapFind点个星,或者分享软件到更多的群和社交媒体论坛
点击这里打开新视窗 | 以下内容被隐藏:www.bilibili.com (我已了解这是外部网站,并同意加载)
<iframe src='about:blank' id='iframe1' FRAMEBORDER=0 ALLOWTRANSPARENCY=true SCROLLING=YES WIDTH=100% HEIGHT=500></iframe>

使用前,你必须下载以下模型与分词器文件:
siglip_vision.onnx
siglip_text.onnx
tokenizer.json
下载链接:https://www.modelscope.cn/models/XinzhengDu/siglip2-base-patch16-224-onnx/files
右键单击文件名并选择下载。将所有文件放入models文件夹中。
结果不准确可能是保存帧不够密集,可以在文件-设置选项里设为1秒一帧。
结果不准确可能是用了较小的模型,大的模型需要更高的算力,联系作者获取


此贴由valen重新编辑:2026-05-06 20:18

随便看看