华溪声坊

 找回密码
 立即注册
Discuz! Database Error
(0) notconnect

????????????????????????????????????????????????????????????

鎴戜滑鍙兘浼氢笌浜呜В鏀惧叾浠栦汉镄勫叧绯伙纴鎴栬呭苟涓??兘寰楀埌浜呜В銆傚鏋滀綘镓惧埌浜呜В鏀剧殑淇℃伅锛屽嵈涓嶆槸浣犵殑淇℃伅锛屾垜浠彨鑳借姹傛偍鎻愪贡鏁堟灉鍙婄绣绔欎富锷炶垂浜虹◣浜ゆ敮鎸佸湴鍧銆傝繖浜涘叧浜庡叾浠栦汉镄勫叧绯伙纴鎴栬呭拰浣犵殑淇℃伅鐢ㄦ埛绉姩浜х敓锛屽嵈涓嶆槸浣犵殑淇℃伅銆

查看: 8531|回复: 4

繁體中文版 IdxSubOcr(圖片式字幕轉文字式字幕)

[复制链接]

该用户从未签到

管理员

QQ上不太方便处理问题.有问题请到论坛反馈区开贴详细反馈.谢

最后登录
2025-4-19
在线时间
4125 小时
回帖
1585
主题
4614
精华
9
贝里
175321
威望
125
积分
26157
阅读权限
200
发表于 2016-11-23 17:41:46 | 显示全部楼层
声明:本站所有作品片源均来源于互联网公开渠道,版权均归原作品公司所有,如有侵犯版权,请与admin@joyfulday.me联系,我们会立即删除 声坊宗旨

更新
2013-06-01
我用 VB Express 2010 寫了個程式改 *.idx 的 Timestamp,詳情請按這裡,無需再用 Word VBA。

2013-03-25
無 M$ Office XP~2007 的用戶,可以裝 SharePoint Designer 2007,內有 M$ Office 2007 的 MODI(OCR Engine)。
安裝 SharePoint Designer 2007(方法 2)
下載 SharePoint Designer 2007
不過,如果要用我個 Word VBA 去改 *.idx 的 Timestamp,仍然需要較新的 M$ Word,太舊版的 VBA 無 FileDialog 功能,不能在程式中開出選擇開啟檔案的視窗,印象中好似 XP 還是 2003 才開始有這功能,其實在 2000 要寫都寫得出,只不過懶得做。undefined



IdxSubOcr 原作者主頁
下載原裝簡體版 IdxSubOcr

之前提過用 IdxSubOcr 將圖片式字幕轉文字式字幕。IdxSubOcr 本身是簡體中文軟件,我發覺在繁中 Win XP/7 經 AppLocale 以 GBK 碼執行的話,轉出來的 srt 字幕檔是 GBK 碼,而且用 ConvertZ 把這 srt 檔轉回 Big5/UTF-8 時,部份字會變"?"問號;如果在繁中 WinXP/7 直接執行的話,轉出來 srt 檔已是 Big5 碼,不過,程式介面會出亂碼。詳情可看這個舊 Post

我現把 IdxSubOcr 的介面改為繁體中文,可直接在繁中 WinXP/7 內執行,不會有亂碼。
按這裡下載繁體中文版

IdxSubOcr 需使用 MS Office 2003(我用 2007) 附帶的 OCR Engine,下圖是轉換繁中字幕的效果(未經人手修改),準確度都算不錯。
12040721321862f4924d848c8c.gif

不過都有少許問題,例如明珠台的美劇繁體中文字幕,經常會將兩個人的短對白以空格分開放在同一行字幕,轉換後會失去空格,感嘆號(!)經常誤認為(’)或失去,(…)就從未試過認到出來!
1204071816ad57b7697fb2a754.gif

英文方面,下圖是未經人手修改的轉換效果,錯得很多,不能接受!
120407213573cd93cea9fefb9f.gif

以上測試,來源檔是由機頂盒錄影出來的 *.trp,經 SmartCutter 剪接後再由 ProjectX 分拆出來的 *.sup.idx 字幕。

有時 ProjectX 分拆出來的字幕檔,時間軸跟影片有很大距離,我會先用 KMPlayer 同時開影片和字幕,留意第一句字幕出現時間及第一句對白出現時間,計出差距,然後在 KMPlayer 畫面上 Right click→字幕配置→同步字幕→字幕同步設定(或者按 Alt-Y,我不記得這個是原裝的 Keyboard shortcut 還是我自己加入的),輸入差距時間,再自行微調時間,直到影片跟字幕同步(通常較到 +/- 200ms 已經可以接受)。例如計出相距時間是 1 分 7 秒,可先試輸入 67000,然後再每 200 一級的嘗試。
120407224317f28a06753d0c74.gif

記下這個時間,然後我會用我自己寫的 Word VBA 程式去修改 *.sup.idx 入面的 timestamp。按這裡可下載我的程式。打開 IdxSubTime.doc 後,先跟下圖啟用巨集與ActiveX。
12040723053387ce5f4c1ab5f9.gif

然後在方格中輸入差距時間(秒),例如之前試出 67400 毫秒,就輸入 67.4(本來應該跟 KMPlayer 用毫秒,不過懶得再改寫程式),按 Enter 後就可以選擇要修改的 *.sup.idx 檔案。原本的檔案會以 yyyymmdd-hhmmss-*.sup.idx 檔名備份,yyyymmdd 及 hhmmss 時備份時的日期和時間。
120407231020e5720e3afe9ddf.gif

我選擇用 Word VBA 是為了貪方便,因為我常用的幾部電腦都已經裝有 MS Office,不用另外再裝 S/W。如果不用我這個程式,也可以用其它程式去改 timestamp。

不過無論用什麼程式去改 timestamp,應該先更改 *.sup.idx,然後才用 IdxSubOcr 轉字幕格式,確保轉出來的 *.srt 字幕已是修正了的時間軸。

最近访问 列表模式
回复

使用道具

  • TA的每日心情
    开心
    2024-8-3 12:44
  • 签到天数: 1194 天

    [LV.10]以坛为家III

    实力派

    最后登录
    2025-1-6
    在线时间
    599 小时
    回帖
    1296
    主题
    0
    精华
    0
    贝里
    1942
    威望
    0
    积分
    1371
    阅读权限
    60
    发表于 2017-4-11 00:00:35 | 显示全部楼层
    非常有用的教程,看到论坛好多动画字幕做得很漂亮,学一下自己动手做做

    回复 支持 反对

    使用道具

  • TA的每日心情
    慵懒
    2025-1-18 11:17
  • 签到天数: 2144 天

    [LV.Master]伴坛终老

    声坊维护者

    最后登录
    2025-2-15
    在线时间
    370 小时
    回帖
    2285
    主题
    0
    精华
    0
    贝里
    9437
    威望
    0
    积分
    3374
    阅读权限
    80
    发表于 2017-5-24 12:14:29 | 显示全部楼层
    这个很多需要后期手工处理 工作量巨大

    回复 支持 反对

    使用道具

  • TA的每日心情

    2022-6-25 20:02
  • 签到天数: 649 天

    [LV.9]以坛为家II

    独特存在

    最后登录
    2024-12-20
    在线时间
    2338 小时
    回帖
    1654
    主题
    310
    精华
    1
    贝里
    297856
    威望
    3
    积分
    2358
    阅读权限
    70
    发表于 2018-6-23 22:36:16 | 显示全部楼层
    正在烦恼这个问题,ocr出来错很多

    回复 支持 反对

    使用道具

  • TA的每日心情
    慵懒
    2024-8-18 16:38
  • 签到天数: 424 天

    [LV.9]以坛为家II

    实力派

    最后登录
    2024-8-18
    在线时间
    3073 小时
    回帖
    750
    主题
    0
    精华
    0
    贝里
    4721
    威望
    0
    积分
    1268
    阅读权限
    60
    发表于 2020-8-17 08:51:29 | 显示全部楼层
    进来学习教程

    回复 支持 反对

    使用道具

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    Archiver|华溪声坊

    GMT+8, 2025-4-20 01:38

    Powered by Discuz!

    © 2025 JFD.

    快速回复 返回顶部 返回列表