@roamer,我使用mpv一直有个痛点。
就是外挂字幕是被渲染成图像显示在视频之上的,鼠标没办法选中然后搜索查词。
我之前尝试过阅读mpv文档写一个脚本,但是奈何水平实在是有限;
我现在的间接解决方法是遇到要查的词,暂停用ocr识别后查词。
关于这个功能你有什么思路吗?
「外挂字幕是以图像形式渲染在视频之上」,这是指 SUP 这类的图像软字幕,还是指直接压制进视频画面的硬字幕?
两者好像都有针对性的 OCR 工具,问了下 GPT 推荐 Tesseract OCR 等工具,mpv 可以写脚本集成,从而实现碰到生词快捷键 ocr 当前字幕,mpv 的话可以加入剪贴板从而支持取词?可以多问问 AI,跟 AI 多磨一下脚本应该是能跑通的,就是要花时间,mpv 文档可以喂给 gemini 再问他
不过个人不建议折腾这个,OCR 方案即便能查词似乎也不能制卡,也不能制作压缩音频,更推荐下面几种方式
- 寻找外挂字幕 Jimaku Kitsunekko ACGRIP 还有搜索引擎多找找
- 本地转录/在线转录 直接生成字幕 (可以参考这两个帖子 几个动画字幕转录应用使用体验 动画字幕转录应用推荐 Pyvideotrans)
- 直接无字幕沉浸(按照 Matt 的观点无字幕沉浸应该越早越好,即便在几乎听不懂的阶段也应该进行一定量的无字幕沉浸)
- 等以后能无字幕沉浸了再看
- 放弃该动画……
我的使用场景,视频文件一般就是mp4、mkv(各类动漫资源)。
外挂字幕一般就是srt,ass文件(收集自各个字幕组)。
硬字幕的话我就用ocr了。
看视频anki制卡的话我暂时还没空折腾,目前在备考7月份jlpt n1,anki卡片每天都快复习不过来了
我想在mpv上面搞的效果,类似这个插件浏览器实现的效果asbplayer(这里的网址应该是官方的演示网站)。
如上图,字幕文件被解析成可以选中的文本,然后正好平时一直用一个quicker动作查词:GoldenDict 查词 动作信息 - Quicker,只要是可以选中的文字就不需要键盘敲了,特别方便。
所以如果mpv如果能做到字幕文本可选中的话完美了。
另外这个浏览器插件虽然也挺好,但是视频播放器的web应用我个人还是有点喜欢不上,哪怕做成electron应用百来mb大小的,我都觉得比每次用浏览器打开更好些。
看来我还是有空的时候再把mpv文档喂给ai跟它学一学吧,全英文的文档对我实在是很吃力了,b站里面虽然有人发过个人翻译汉化的文档,但是说实话中文我也看得一头雾水,那种只有已经懂的人才看得懂在说什么的感觉。
看视频制卡才是正解啊,强行背单词不如沉浸背单词,我也报了 7 月的 N1,不过没专门准备,只是日常沉浸
我还是没明白你指的什么操作,mpv 工作流可以自动取词啊,你是因为什么卡住了?
比如 mpv 可以实现 Memento 的这些操作啊,虽然没有 Memento 方便
Memento 才是正解,即开即用,功能强大,开发者还是业界楷模,提了很多改进都采纳了,现在比 mpv 好用多了,比方说 现在可以在弹出的辞典上选中一段文本,直接 Ctrl+D 就能一键制卡,再也不用翻找那个添加按钮了(我的建议 )