现在很多 YouTube 视频都配有非常棒软字幕,我们在做视频的汉化时,这个软字幕是非常好的原始素材。其实 YouTube 的这些字幕是可以下载的,下载地址是 http://video.google.com/timedtext?lang=en&v=VIDEO_ID 其中的 VIDEO_ID 就是 YouTube 播放页面 watch?v= 后面的部分。举例来说这个 Eric Schmidt 在 TechCrunch Disrupt 上的讲话视频,播放页面是 http://www.youtube.com/watch?v=G7djoQfncRw ,则字幕下载地址就是 http://video.google.com/timedtext?lang=en&v=G7djoQfncRw。
字幕是以 xml 格式存储的,我们可以通过查看页面源代码,将源代码贴到这个工具里面,并点击 Go! 按钮,即可得到纯文本的字幕脚本了。其实我们仔细观察 xml 文件就可以发现,字幕文本对应的时间轴也保存在 xml 标记中,用 python 之类的脚本语言应该非常容易将这些 xml 字幕文件直接转换为 srt 或者其他格式的通用字幕文件,如果你制作了类似的工具或者发现哪里有类似的工具下载,欢迎在留言中告诉我们。
UPDATE:感谢读者 xslidian ,果然已经有类似的 YouTube xml –> SRT 的工具了,点此进入。另外读者 我知道 还给我们推荐了另外一个可以通过输入视频播放地址直接下载 YouTube 字幕的网站,点此进入。
via GOS
Related posts
- Google 开始收录 SVG 内容
- Google 官方表示小网站不需要 XML Sitemaps 也无所谓
- 如何阻止 Chrome 劫持 RSS 文件?
- 用 Google App Engine 开发 Go 语言应用的简明教程
- 跟去年相比,YouTube 的广告商数量翻了 10 倍
- 抛弃 Flash 吧!YouTube 正式开始测试 HTML5 视频播放
- 美国总统奥巴马将在 1 月 30 日于 Google+ 和 YouTube 现场回答网友提问
- iGoogle 中国大学生创新大赛之背景主题(Theme)正式启动,Google 黑板报换用优酷了……囧
- YouTube Live 整合 Google+ Hangouts,让网友坐在一起看视频直播
- Facebook 超越 Yahoo 和 Google 成为 2010 年访客最多的网站
没有评论:
发表评论