[發明專利]上下文感知機器語言識別有效
| 申請號: | 202111302817.0 | 申請日: | 2021-11-05 |
| 公開(公告)號: | CN114462415B | 公開(公告)日: | 2023-02-14 |
| 發明(設計)人: | 王帆;曹立;王銳;高磊 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/58 |
| 代理公司: | 中國貿促會專利商標事務所有限公司 11038 | 代理人: | 吳信剛 |
| 地址: | 美國*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 上下文 感知 機器語言 識別 | ||
1.一種機器翻譯系統,包括:
密度計算器,所述密度計算器適于:
計算輸入文本中的多個詞元中的每個詞元的詞性POS密度,其中詞元的所述POS密度指示該詞元對于含義表示的重要性;
計算所述多個詞元中的每個詞元的知識密度,其中所述知識密度與按照POS分級的每個詞元的定義的數量有關;以及
將所述POS密度和所述知識密度相乘來計算所述多個詞元中的每個詞元的信息密度。
2.根據權利要求1所述的機器翻譯系統,其中所述密度計算器還適于將所述輸入文本詞元化成所述多個詞元。
3.根據權利要求1所述的機器翻譯系統,其中所述密度計算器還適于通過POS來對所述知識密度進行分級。
4.根據權利要求1所述的機器翻譯系統,其中所述密度計算器還適于返回所述多個詞元的詞信息密度。
5.根據權利要求1所述的機器翻譯系統,還包括義素附加器,所述義素附加器適于:
使用所述多個詞元中的一個或多個詞元的相應POS密度和知識密度來生成所述一個或多個詞元的一個或多個對應的義素;并且
將所述一個或多個對應的義素附加到所述一個或多個詞元。
6.根據權利要求5所述的機器翻譯系統,其中所述義素附加器還適于對所述輸入文本進行詞形還原。
7.根據權利要求5所述的機器翻譯系統,其中所述義素附加器還適于在其POS下生成所述一個或多個對應的義素。
8.根據權利要求5所述的機器翻譯系統,其中所述義素附加器還適于返回所述多個詞元的義素列表。
9.根據權利要求1所述的機器翻譯系統,還包括上下文翻譯器,所述上下文翻譯器適于:
通過停止詞將所述輸入文本劃分成多個更小的塊,所述多個更小的塊包括具有所附加的一個或多個對應的義素的一個或多個詞元;
使用所述一個或多個對應的義素來為所述更小的塊中的一個或多個生成語義上下文;并且
使用所述語義上下文來翻譯所述輸入文本。
10.根據權利要求9所述的機器翻譯系統,其中所述上下文翻譯器還適于通過詞使用來識別上下文。
11.根據權利要求9所述的機器翻譯系統,其中所述上下文翻譯器還適于返回目標語言的翻譯匹配義素。
12.根據權利要求9所述的機器翻譯系統,其中所述上下文翻譯器還適于:
使用對應的義素來聚類詞元;以及
確定所聚類的詞元的涵義。
13.根據權利要求12所述的機器翻譯系統,其中所述上下文翻譯器還適于:
將所述涵義與對應的義素合并,以生成所述塊中的一個的語義上下文;并且
使用所述語義上下文來翻譯所述塊。
14.根據權利要求11所述的機器翻譯系統,還包括ChatOps系統,所述ChatOps系統適于從終端用戶接收所述輸入文本并且從所述輸入文本生成命令。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111302817.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于限制駕駛員分心的系統和方法
- 下一篇:密封部件中的放電減少





