[發明專利]翻譯需求識別方法及系統有效
| 申請號: | 201110391077.2 | 申請日: | 2011-11-30 |
| 公開(公告)號: | CN103136192A | 公開(公告)日: | 2013-06-05 |
| 發明(設計)人: | 馬艷軍;吳華;王海峰 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06F17/30 |
| 代理公司: | 北京鴻德海業知識產權代理事務所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 翻譯 需求 識別 方法 系統 | ||
1.一種翻譯需求識別方法,其特征在于,包括:
獲取網絡平臺中的熱門話題的主題詞條;
利用D1-D3中至少一種識別方法,判斷該熱門話題的主題詞條所對應話題類別的文本信息是否有翻譯為目標語言的需求,其中
所述D1為:判斷熱門話題中主題詞條的關鍵詞是否包含目標語言的詞項、音譯詞詞項或者預設關鍵詞列表中的詞項;
所述D2為:將熱門話題的主題詞條翻譯成目標語言對應的主題詞條譯文,在目標語言的網絡平臺中搜索與該主題詞條譯文所對應話題類別的文本信息,并統計搜索到的文本信息的數量是否超過預設閾值;
所述D3為:對每個熱門話題通過用戶調查進行翻譯需求征集,根據用戶反饋的標注信息進行判斷。
3.根據權利要求1所述的方法,其特征在于,所述利用D1判斷該熱門話題的主題詞條所對應話題類別的文本信息是否有翻譯為目標語言的需求,具體包括以下步驟:
S101、判斷熱門話題中主題詞條的關鍵詞是否包含目標語言的詞項,如果包含,則進入S104,否則,進入S102;
S102、判斷熱門話題中主題詞條的關鍵詞是否包含目標語言的音譯詞詞項,如果包含,則進入S104,否則,進入S103;
S103、將熱門話題中主題詞條的關鍵詞與預設的關鍵詞列表進行匹配,并計算匹配度,判斷匹配度是否滿足預設要求,如果滿足,則進入S104,否則,進入S105;
S104、識別為有翻譯需求;
S105、識別為無翻譯需求。
4.根據權利要求1所述的方法,其特征在于,所述利用D2判斷該熱門話題的主題詞條所對應話題類別的文本信息是否有翻譯為目標語言的需求,如果搜索到的文本信息數量超過預設閾值,則識別為有翻譯需求。
5.根據權利要求1所述的方法,其特征在于,所述利用D3判斷該熱門話題的主題詞條所對應話題類別的文本信息是否有翻譯為目標語言的需求,根據用戶反饋的標注信息,統計標注為有翻譯需求的用戶數,當用戶數超過預設閾值時,則識別為有翻譯需求。
6.根據權利要求1所述的方法,其特征在于,所述利用D3判斷該熱門話題的主題詞條所對應話題類別的文本信息是否有翻譯為目標語言的需求,根據用戶反饋的標注信息,采用機器分類方法進行分類,分為有翻譯需求和無翻譯需求兩個類別,具體包括以下步驟:
S401、獲取用戶標注的數據信息;
S402、根據用戶標注的數據,選取熱門話題的分類特征,并對熱門話題進行機器學習訓練得到分類器;
S403、利用訓練好的分類器對任意熱門話題進行自動分類,分為有翻譯需求和無翻譯需求兩個類別。
7.根據權利要求6所述的方法,其特征在于,所述熱門話題的分類特征包括:
熱門話題的關鍵詞、所述關鍵詞的同義詞、所述關鍵詞的譯文以及熱門話題所對應話題類別的文本信息中的高頻詞。
8.根據權利要求1所述的方法,其特征在于,所述利用D1-D3中至少一種識別方法,判斷該熱門話題的主題詞條所對應話題類別的文本信息是否有翻譯為目標語言的需求,包括:利用D1、D2和D3結合進行判斷該熱門話題的主題詞條所對應話題類別的文本信息是否有翻譯為目標語言的需求,具體包括:
根據所述D1、D2和D3的識別結果,采用投票的方式進行判斷,將至少有兩種策略的識別結果為有翻譯需求的熱門話題,判斷為有翻譯需求;
或者,先為所述D1、D2和D3分配不同的權重,再根據所述D1、D2和D3的識別結果,采用加權投票的方式進行判斷,計算識別結果的投票權重,將得到的投票權重超過權重閾值的熱門話題,判斷為有翻譯需求。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110391077.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:自動清洗噴頭的噴碼機
- 下一篇:壓凸、燙金一次完成模具





