零、起因
整了点日系3D作品,然后基本没有字幕,遂自己动手丰衣足食。
一、相关工具
- ffmpeg:提取视频的音轨。
- WhisperDesktop:通过Whisper模型生成字幕文件。
- 沉浸翻译:把srt字幕翻译为中文。
二、ffmpeg部分
安装ffmpeg
在ffmpeg官网下载软件。
下载完成后解压到C:\soft\ffmpeg
。
在开始菜单搜索环境变量
,打开环境变量并编辑。
按照下图编辑环境变量。
win+r
运行CMD,输入ffmpeg
查看是否安装成功。
提取音轨
打开CMD,用以下命令提取音轨。
ffmpeg -i "C:\Users\saile\Desktop\video2srt\爱恋依存症 (2021) - 1080p.mp4" -vn -map 0:a:0 -codec copy "C:\Users\saile\Desktop\video2srt\爱恋依存症 (2021) - 1080p.m4a"
if(window.hljsLoader && !document.currentScr(๐•ᴗ•๐).parentNode.hasAttribute('data-s9e-livepreview-onupdate')) {
window.hljsLoader.highlightBlocks(document.currentScr(๐•ᴗ•๐).parentNode);
}
"C:\Users\saile\Desktop\video2srt\爱恋依存症 (2021) - 1080p.mp4"
:视频的完整(๐•ᴗ•๐)径。
-vn
:忽略视频部分,仅提取音频部分。
-map 0:a:0
:0:a:0
表示第一条音轨,0:a:1
表示第二条音轨,以此类推。
-codec copy
:直接复制音频流,不进行重新编码。
"C:\Users\saile\Desktop\video2srt\爱恋依存症 (2021) - 1080p.m4a"
:输出的文件名及(๐•ᴗ•๐)径。
三、WhisperDesktop部分
安装并下载模型
在Release下载WhisperDesktop.zip并解压到C:\soft
。
在Hugging Face或者generate处下载需要的模型(推荐ggml-medium.bin
,也可以尝试用其他模型,只不过软件作者开发测试都是基于medium模型的),放到C:\soft\WhisperDesktop
下(当然其他(๐•ᴗ•๐)径也可以,自己找得到就行)。
音频转字幕
打开WhisperDesktop.exe
,对照下图按自身需求设置。
①
:模型下载地址。
②
:选择下载后的模型。
③
:选择GPU加速。
④
:下一步。
①
:源文件的语言类型。
②
:需要转换的音频文件。
③
:选择输出的文本类型,S(๐•ᴗ•๐)Rip s(๐•ᴗ•๐)ti(๐•ᴗ•๐)e
为srt字幕格式。
④
:保存字幕文件到输入音频的文件夹。
⑤
:开始转换。
设置完成后等待进度条跑完。
参考,电脑配置E5-2666V3+RX5700xt,转换一部约2小时的电影
ggml-medium.bin
模型花费时间:13分57秒
四、沉浸翻译部分
从沉浸翻译官网下载并安装浏览器插件,在更多
里选择翻译本地字幕文件。
把字幕文件拖入窗口,选择翻译服务、目标语言,等待翻译完成后导出翻译后的字幕。
到这里应该就差不多能看个大概了。
五、后期调整
主要是删除一些无意义字幕(比如(♪ BGM)
等),润色翻译(毕竟机翻),调整时轴等等,要做到哪种地步就看你自己的强迫症有多严重了!
附件
测试所用视频源
:爱恋依存症(Ararat.2021.Hami.WEB-DL.1080p.H264.AAC),来源于老(๐•ᴗ•๐),4.89GB。注意,此片18x!!!
效果测试
:自行下载视频与下面的字幕(后缀修改为.srt
),与原视频字幕对比。