[發明專利]語句診斷方法、裝置和系統有效
| 申請號: | 201811117612.3 | 申請日: | 2018-09-20 |
| 公開(公告)號: | CN110929504B | 公開(公告)日: | 2023-05-30 |
| 發明(設計)人: | 李辰;周君沛;劉恒友;包祖貽;徐光偉;李林琳 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F40/253 | 分類號: | G06F40/253;G06F40/284;G06F40/44;G06F40/58 |
| 代理公司: | 北京博浩百睿知識產權代理有限責任公司 11134 | 代理人: | 褚敏;宋子良 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語句 診斷 方法 裝置 系統 | ||
1.一種語句診斷方法,其特征在于,包括:
使用至少兩種語句診斷模型對目標語句進行語句診斷,得到至少兩種類型的中間診斷結果,其中,所述語句診斷模型包括如下至少兩個:基于規則的模型、基于統計機器翻譯的模型和基于神經機器翻譯的模型;
將得到的中間診斷結果進行合并,得到所述目標語句的診斷結果;
其中,使用至少兩種語句診斷模型對目標語句進行語句診斷,得到至少兩種類型的中間診斷結果,包括:使用所述基于規則的模型對所述目標語句進行語句診斷,得到第一中間診斷結果;使用所述基于統計機器翻譯的模型對所述目標語句進行語句診斷,得到多個第二中間診斷結果;使用所述基于神經機器翻譯的模型對所述目標語句進行語句診斷,得到多個第三中間診斷結果;
所述方法還包括:通過預定合并方式對多個所述第二中間診斷結果進行合并得到第一合并結果;和/或,通過所述預定合并方式對多個所述第三中間診斷結果進行合并得到第二合并結果;
將得到的中間診斷結果進行合并,得到所述目標語句的診斷結果,包括:將所述第一中間診斷結果、所述第一合并結果和所述第二合并結果中的至少兩個進行合并,得到所述診斷結果。
2.根據權利要求1所述的方法,其特征在于,使用所述基于規則的模型對所述目標語句進行語句診斷,得到第一中間診斷結果,包括:
獲取預先構建的詞語庫;
將所述目標語句進行分詞處理,得到所述目標語句對應的分詞結果;
將所述分詞結果中的每個詞與所述詞語庫中的候選詞進行比對,查找出不屬于所述詞語庫中的目標詞;
將不屬于所述詞語庫中的目標詞進行變形處理,得到所述第一中間診斷結果。
3.根據權利要求2所述的方法,其特征在于,將不屬于所述詞語庫中的目標詞進行變形處理,得到所述第一中間診斷結果,包括:
將所述目標詞進行多種變形處理,得到對應的多種候選診斷結果;
從所述候選診斷結果中選擇所述第一中間診斷結果。
4.根據權利要求3所述的方法,其特征在于,將所述目標詞進行多種變形處理,得到對應的多種候選診斷結果,包括如下任意一種或多種:
如果所述目標詞中包括兩個及以上的字符,且將所述目標詞中的字符改變順序后,屬于所述詞語庫中的詞語,確定改變字符順序后的目標詞為所述候選診斷結果;
如果所述目標詞與所述目標語句中的前一個詞語或后一個詞語連接得到的第一組合屬于所述詞語庫,確定所述第一組合為所述候選診斷結果;
生成所述目標詞中每個字符對應的相似字,所述相似字包括:形近字或音近字,如果所述相似字與所述目標語句中的前一個詞語或后一個詞語的第二組合屬于所述詞語庫,確定所述第二組合為所述候選診斷結果。
5.根據權利要求3所述的方法,其特征在于,從所述候選診斷結果中選擇所述第一中間診斷結果,包括:
使用預設的語言模型對每個候選診斷結果進行打分,其中,所述打分用于表示所述候選診斷結果的準確程度;
選擇得分最高的候選診斷結果為所述第一中間診斷結果。
6.根據權利要求1所述的方法,其特征在于,使用所述基于統計機器翻譯的模型對所述目標語句進行語句診斷,得到第二中間診斷結果,包括:
基于預設的短語表獲取所述目標語句對應的候選語句;
基于預設的語言模型確定所述候選語句的得分,其中,所述候選語句的得分用于表示所述候選語句的準確程度;
將所述目標語句分別和每個所述候選語句組合,構成多個句子對;
基于預設的翻譯模型獲取所述句子對的條件概率,其中,所述句子對的條件概率用于表示在所述候選語句生成的情況下,生成所述目標語句的概率;
使用束搜索根據所述得分和所述條件概率得到所述第二中間診斷結果。
7.根據權利要求6所述的方法,其特征在于,基于預設的短語表獲取所述目標語句對應的候選語句,包括:
對所述目標語句以預設粒度進行分割,得到所述目標語句對應的多個單位對象;
在預設短語表中查找與所述單位對象對應的內容,并將與每個所述單位對象對應的內容進行排列組合,得到與所述目標語句對應的候選語句。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811117612.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種含人體干細胞培養液的面膜及其制備方法
- 下一篇:游離鋅離子的檢測方法





