[發明專利]用于從用戶的自然語言輸入中提取關鍵元素的方法有效
| 申請號: | 201710407203.6 | 申請日: | 2017-06-02 |
| 公開(公告)號: | CN107203512B | 公開(公告)日: | 2021-04-23 |
| 發明(設計)人: | 王溪華;郝新利 | 申請(專利權)人: | 上海對岸信息科技有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30 |
| 代理公司: | 上海智晟知識產權代理事務所(特殊普通合伙) 31313 | 代理人: | 李鏑的;張東梅 |
| 地址: | 200030 上海市徐匯*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 用戶 自然語言 輸入 提取 關鍵 元素 方法 | ||
1.一種用于從用戶的自然語言輸入中提取關鍵元素的方法,包括下列步驟:
根據第一語義知識庫對用戶的第一自然語言輸入進行語義匹配以識別所述第一自然語言輸入的總體語義,其中第一自然語言輸入包括用戶輸入的語句;
選擇限定知識庫;
通過確定所述限定知識庫中與所述總體語義相關聯的條目并去除其余條目來縮減所述限定知識庫,包括下列步驟:
通過所述總體語義確定相關聯的一個或多個類別;以及
除去限定知識庫中除所述相關聯的一個或多個類別以外的類別的條目;
對所述第一自然語言輸入進行機械分詞以生成所述第一自然語言輸入的分詞結果集合;
使用經縮減的限定知識庫對所述分詞結果進行匹配以從分詞結果集合中確定分詞結果;以及
從所述分詞結果的詞語中選擇一個或多個作為關鍵元素。
2.根據權利要求1所述的方法,其中從所述分詞結果的詞語中選擇一個或多個作為關鍵元素包括步驟:
使用第二語義知識庫對分詞結果中的詞語進行匹配以確定所述詞語的語義;以及
從所述詞語的語義中選擇一個或多個作為關鍵元素。
3.根據權利要求1或2所述的方法,還包括步驟:
存儲所述關鍵元素,以供用于為用戶的第二自然語言輸入生成自然語言輸出。
4.根據權利要求1所述的方法,其中根據一個或多個第一自然語言輸入的上下文或者根據預設來選擇限定知識庫。
5.根據權利要求1所述的方法,其中根據第一語義知識庫對所述第一自然語言輸入進行語義匹配包括下列步驟:
將所述第一自然語言輸入與第一語義知識庫進行匹配以識別所述第一自然語言中的句型,其中所述第一語義知識庫包括預先存儲的句型模型;以及
根據所述句型確定所述第一自然語言輸入的總體語義。
6.根據權利要求2所述的方法,其中使用語義知識庫對分詞結果中的詞語進行匹配以確定所述詞語的語義包括下列步驟:
使用語義知識庫對分詞結果中的第一詞語進行匹配以確定第一詞語的一個或多個語義;
使用語義知識庫對分詞結果中的第二詞語進行匹配以確定第二詞語的多個語義;
分別確定第二詞語的多個語義中的每個與第一詞語的一個或多個語義中的每個的關聯性;
確定第二詞語的語義和第一詞語的語義中彼此具有最大關聯性的語義;以及
將所述語義分別確定為第二詞語的語義和第一詞語的語義。
7.根據權利要求1所述的方法,其中使用貪婪算法、退火算法或者經典二叉樹算法來使用限定知識庫對所述分詞結果進行匹配。
8.根據權利要求1所述的方法,其中使用貪婪算法、退火算法或者經典二叉樹算法來使用語義知識庫對分詞結果中的詞語進行匹配。
9.根據權利要求2所述的方法,其中在語義匹配和/或使用限定知識庫對所述分詞結果進行的匹配和/或使用語義知識庫對分詞結果中的詞語進行的匹配失敗時,執行異常處理程序,其中輸出錯誤提示或者使用神經網絡以在神經網絡中尋找就近的匹配節點。
10.一種機器可讀存儲介質,其具有存儲在其上的計算機程序,所述計算機程序被配置為執行根據權利要求1-9之一所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海對岸信息科技有限公司,未經上海對岸信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710407203.6/1.html,轉載請聲明來源鉆瓜專利網。





