主頁 > 知識庫 > Python 制作自動化翻譯工具

Python 制作自動化翻譯工具

熱門標簽:地圖制圖標注位置改變是移位嗎 315電話機器人廣告 南京銷售外呼系統(tǒng)軟件 房產(chǎn)電銷外呼系統(tǒng) 地圖標注的意義點 蓋州市地圖標注 上海機器人外呼系統(tǒng)哪家好 浙江電銷卡外呼系統(tǒng)好用嗎 地圖標注微信發(fā)送位置不顯示

媽媽再也不用擔心我的英語了。

一個可能你似曾相識的場景

閱讀內(nèi)容包含大量英文的 PPT、Word、Excel 或者記事本時,由于英語不熟悉,為了流利地閱讀,需要打開瀏覽器進入谷歌翻譯的主界面,然后把英文復制到谷歌翻譯的輸入框中,最后又把翻譯結果復制回 PPT、Word 和 Excel。

要是一個兩個單詞還好,要是發(fā)現(xiàn)有 100 個單詞不認識,就必須復制粘貼 200 次,如此機械性重復性的工作,應該交給程序來做,這就是我設計下面這個自動化翻譯工具的初衷。

提升辦公效率的法寶

如上圖,運行程序并保持后臺運行,在電腦上的任何一個軟件中選擇一段文本,并 Ctrl + C 復制到系統(tǒng)剪貼板中,程序就會自動幫助我們完成翻譯,并將翻譯結果自動復制到系統(tǒng)剪貼版中,只需 Ctrl + V,就完成了翻譯結果對原文的替換。

編碼實現(xiàn)

程序主要分為兩部分,第一部分為谷歌翻譯爬蟲,第二部分就是實現(xiàn)這個將翻譯結果自動替換的業(yè)務邏輯。

谷歌翻譯爬蟲

通過瀏覽器 F12 開發(fā)者工具,很容易定位到翻譯請求的 URL: http://translate.google.cn/translate_a/single?client=tsl=entl=zh-CNhl=zh-CNdt=atdt=bddt=exdt=lddt=mddt=qcadt=rwdt=rmdt=ss dt=tie=UTF-8oe=UTF-8clearbtn=1otf=1pc=1srcrom=0ssel=0tsel=0kc=2

這個請求接受兩個參數(shù),一個就是我們要翻譯的字符串 q,另一個是用于用戶認證的 tk(token),其中 q 很容易構造,tk 的構造就需要花費一番心力了,需要我們調(diào)試 js 代碼,這里參考 Github 上大神的輪子: https://github.com/cocoa520/Google_TK

谷歌翻譯爬蟲的主要代碼如下:

def translate(tk, content):
    if len(content) > 4891:
        print("翻譯的長度超過限制?。。?)
        return

    param = {'tk': tk, 'q': content}

    result = requests.get("""http://translate.google.cn/translate_a/single?client=tsl=en
        tl=zh-CNhl=zh-CNdt=atdt=bddt=exdt=lddt=mddt=qcadt=rwdt=rmdt=ss
        dt=tie=UTF-8oe=UTF-8clearbtn=1otf=1pc=1srcrom=0ssel=0tsel=0kc=2""", params=param)

    data = result.json()
    print(data[0][0][0])

返回結果是 json 形式的,翻譯結果保存在結果的第一個元組中。

Python 操作系統(tǒng)剪貼板

將讀取剪貼板的內(nèi)容的代碼封裝成函數(shù)如下:

def getText():#讀取剪切板
    # 打開剪貼板
    w.OpenClipboard()
    # 讀取剪貼板的內(nèi)容
    d = w.GetClipboardData(win32con.CF_TEXT)
    # 關閉剪貼板
    w.CloseClipboard()
    try:
        return d.decode('utf-8')
    except:
        return d.decode('gbk')

返回值 d 是字節(jié)類型的,需要解碼,中文按 gbk 格式解碼,英文按 utf-8 解碼。

類似地,寫入剪貼板的代碼如下:

def setText(aString):#寫入剪切板
    # 打開剪貼板
    w.OpenClipboard()
    # 清空剪貼板
    w.EmptyClipboard()
    # 寫入剪貼板
    w.SetClipboardText(aString)
    # 關閉剪貼板
    w.CloseClipboard()

實現(xiàn)將翻譯結果自動替換原文的邏輯的代碼如下:

while(True):
        # 如果剪貼板正在被占用
        try:
            cs = getText()
        except:
            time.sleep(1)
            cs = getText()
        print('cs',cs)
        if cs and cs != ls:
            print('準備翻譯')
            content = getText()
            tk = js.getTk(content)
            res = translate(tk, content)
            setText(res)
            time.sleep(1)
            ls = res

值得注意的是,系統(tǒng)剪貼板對象是單例模式的,在操作系統(tǒng)范圍內(nèi)只有一個,而且讀寫剪貼板都是互斥的,在讀(寫)剪貼板的同時不允許任何對剪貼板的寫(讀)操作。試想這樣一種情景,我們在其他軟件中 Ctrl + C 寫入剪貼板,而此時我們的程序代碼正好執(zhí)行到讀剪貼板那一行,毫無疑問會報錯,我的解決辦法是使用 try…except 語句延時 1 s再讀取,這樣可以大大降低讀寫碰撞的概率,但無疑消耗了程序性能。最好的辦法是判斷剪貼板對象句柄是否被占用,其實我一直在尋找是否存在判斷剪貼板對象句柄是否被占用的 API,但是一直沒有找到

項目地址

https://github.com/Python3Spiders/GoogleAutoTranslationTool

以上就是Python 實現(xiàn)自動化翻譯和替換的腳本的詳細內(nèi)容,更多關于python 自動化翻譯的資料請關注腳本之家其它相關文章!

您可能感興趣的文章:
  • python 利用PyAutoGUI快速構建自動化操作腳本
  • python 辦公自動化——基于pyqt5和openpyxl統(tǒng)計符合要求的名單
  • python辦公自動化之excel的操作
  • 教你利用Selenium+python自動化來解決pip使用異常
  • 十個Python自動化常用操作,即拿即用
  • 如何用 Python 子進程關閉 Excel 自動化中的彈窗
  • python自動化之如何利用allure生成測試報告
  • 教你怎么用Python處理excel實現(xiàn)自動化辦公
  • python實現(xiàn)百度文庫自動化爬取
  • Python自動化之批量處理工作簿和工作表

標簽:臨汾 陽泉 貴州 金華 日照 克拉瑪依 赤峰 雙鴨山

巨人網(wǎng)絡通訊聲明:本文標題《Python 制作自動化翻譯工具》,本文關鍵詞  Python,制作,自動化,翻譯,;如發(fā)現(xiàn)本文內(nèi)容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python 制作自動化翻譯工具》相關的同類信息!
  • 本頁收集關于Python 制作自動化翻譯工具的相關信息資訊供網(wǎng)民參考!
  • 推薦文章