[發(fā)明專利]文本條目搜索方法、裝置、系統(tǒng)及存儲介質有效
| 申請?zhí)枺?/td> | 202010160441.3 | 申請日: | 2020-03-09 |
| 公開(公告)號: | CN111400429B | 公開(公告)日: | 2023-06-30 |
| 發(fā)明(設計)人: | 丁建平;李成 | 申請(專利權)人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/33;G06F16/35 |
| 代理公司: | 北京華夏泰和知識產權代理有限公司 11662 | 代理人: | 劉曉燕;李雪 |
| 地址: | 100080 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 條目 搜索 方法 裝置 系統(tǒng) 存儲 介質 | ||
1.一種文本條目搜索方法,其特征在于,所述方法包括:
獲取包含待識別實體的語言文本;
利用統(tǒng)計語言模型從預構建的知識庫中查詢包含所述待識別實體的文字組集,所述文字組集包括預設數量的文字組合,每一個文字組合包括預設數量的文字和預設數量的符號;
根據所述包含待識別實體的文字組集生成索引向量;
從所述預構建的數據庫中查詢與所述待識別實體對應的標識信息,并根據所述標識信息生成編碼向量;
根據所述索引向量、所述編碼向量以及預設定的語言長度,構成知識識別特征;
根據所述知識識別特征,以及從預構建的實體識別模型中提取的與所述語言文本對應的語言特征,獲取意圖槽位標簽;
根據所述意圖槽位標簽,搜索與所述包含待識別實體的語言文本對應的文本條目。
2.根據權利要求1所述的方法,其特征在于,所述利用統(tǒng)計語言模型從預構建的知識庫中查詢包含所述待識別實體的文字組集,具體包括:
利用統(tǒng)計語言模型,從預構建的知識庫中查詢與所述語言文本中每一個字分別對應的文字組集;
識別每一個字分別對應的文字組集,當確定所述語言文本中第i個字對應的第i文字組集中,存在與所述待識別實體相匹配的文字組合時,確定所述第i文字組集為包含所述待識別實體的文字組集,其中,i為大于或者等于1,小于或者等于所述語言文本中文字總數的數值,i依次遞進取值,初始取值為1。
3.根據權利要求2所述的方法,其特征在于,文字組集中的所有文字組合按照預設形式進行排序,所述生成與包含所述待識別實體的文字組集對應的索引向量,具體包括:
將包含所述待識別實體的文字組集中,與所述待識別實體相匹配的文字組合對應的索引向量元素置為1,未與所述待識別實體相匹配的文字組合對應的索引向量元素置為0,其中,所述索引向量中各元素所在位置與所述文字組集中對應的文字組合所在位置相同。
4.根據權利要求1-3任一項所述的方法,其特征在于,所述根據所述知識識別特征,以及從預構建的實體識別模型中提取的與所述語言文本對應的語言特征,獲取意圖槽位標簽,具體包括:
將所述知識識別特征輸入至所述預構建的實體識別模型中,與所述語言特征進行融合后進行槽位分類,獲取意圖槽位標簽。
5.一種文本條目搜索裝置,其特征在于,所述裝置包括:
獲取單元,用于獲取包含待識別實體的語言文本;
查詢單元,用于利用統(tǒng)計語言模型從預構建的知識庫中查詢包含所述待識別實體的文字組集,所述文字組集包括預設數量的文字組合,每一個文字組合包括預設數量的文字和預設數量的符號;
處理單元,用于根據所述包含待識別實體的文字組集生成索引向量;
所述查詢單元還用于,從所述預構建的數據庫中查詢與所述待識別實體對應的標識信息;
所述處理單元還用于,根據所述標識信息生成編碼向量;
根據所述索引向量、所述編碼向量以及預設定的語言長度,構成知識識別特征;
根據所述知識識別特征,以及從預構建的實體識別模型中提取的與所述語言文本對應的語言特征,獲取意圖槽位標簽;
搜索單元,用于根據所述意圖槽位標簽,搜索與所述包含待識別實體的語言文本對應的文本條目。
6.根據權利要求5所述的裝置,其特征在于,所述查詢單元用于,利用統(tǒng)計語言模型,從預構建的知識庫中查詢與所述語言文本中每一個字分別對應的文字組集;
識別每一個字分別對應的文字組集,當確定所述語言文本中第i個字對應的第i文字組集中,存在與所述待識別實體相匹配的文字組合時,確定所述第i文字組集為包含所述待識別實體的文字組集,其中,i為大于或者等于1,小于或者等于所述語言文本中文字總數的數值,i依次遞進取值,初始取值為1。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇藝世紀科技有限公司,未經北京奇藝世紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010160441.3/1.html,轉載請聲明來源鉆瓜專利網。





