[發明專利]基于人工智能的搜索方法、裝置和電子設備有效
| 申請號: | 201711464202.1 | 申請日: | 2017-12-28 |
| 公開(公告)號: | CN108052659B | 公開(公告)日: | 2022-03-11 |
| 發明(設計)人: | 朱勇;宋勛超;李瑩;張一麟 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G06F40/30 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 搜索 方法 裝置 電子設備 | ||
1.一種基于人工智能的搜索方法,其特征在于,包括:
獲取輸入的查詢語句;
切分所述查詢語句,得到多個分詞組成的分詞序列;
對所述分詞序列進行結構化分析,生成文本結構;
基于所述文本結構,對所述分詞序列進行知識化分析,生成語義分析結果,所述知識化分析包括對語義結構中的每個語義成分進行語義分析;
根據所述文本結構和所述語義分析結果,確定所述查詢語句對應的理解結果;
所述結構化分析包括:計算多組語義基本等價的所述分詞序列之間的位置重疊與錯位關系,計算重疊的頻度和錯位的長尾性,得到分詞序列共性的序列區間和特異性的序列區間;基于帶類型的槽位,替換所述特異性的序列區間生成所述文本結構。
2.如權利要求1所述的方法,其特征在于,對所述分詞序列進行結構化分析,生成文本結構,包括:
基于歷史查詢日志,對所述分詞序列進行共現挖掘和同義挖掘,以獲取多個擴展查詢語句;
基于預設聚類算法,對所述多個擴展查詢語句進行聚類;
對聚類后的所述多個擴展查詢語句進行結構抽取,以生成所述文本結構。
3.如權利要求2所述的方法,其特征在于,在生成所述文本結構之后,還包括:
對所述文本結構進行泛化和等價歸一。
4.如權利要求1所述的方法,其特征在于,基于所述文本結構,對所述分詞序列進行知識化分析,生成語義分析結果,包括:
對所述分詞序列進行需求識別,以生成需求識別結果;
基于知識庫,對所述需求識別結果進行概念識別,以生成概念識別結果;
基于所述知識庫,對所述概念識別結果進行意圖識別,以生成所述語義分析結果。
5.如權利要求2所述的方法,其特征在于,對聚類后的所述多個擴展查詢語句進行結構抽取,以生成所述文本結構,包括:
基于所述多個擴展查詢語句之間的重疊的頻度和錯位的長尾性,獲取所述多個擴展查詢語句之間的共性的序列區間和特異性的序列區間;
基于預設類型的槽位,替換所述多個擴展查詢語句之間的特異性的序列區間;
基于所述共性的序列區間和所述預設類型的槽位,生成所述文本結構。
6.如權利要求3所述的方法,其特征在于,對所述文本結構進行泛化和等價歸一,包括:
對所述文本結構和候選文本結構填充相同的多組語義成分,以生成所述文本結構對應的第一查詢語句和所述候選文本結構對應的第二查詢語句;
基于所述第一查詢語句進行查詢獲取第一搜索結果;
基于所述第二查詢語句進行查詢獲取第二搜索結果;
計算所述第一搜索結果和所述第二搜索結果的點擊共現分數;
當所述點擊共現分數大于預設分數時,確定所述候選文本結構與所述文本結構等價。
7.如權利要求4所述的方法,其特征在于,對所述分詞序列進行需求識別,以生成需求識別結果,包括:
提取所述分詞序列對應的查詢語句特征;
獲取與所述查詢語句對應的搜索結果的特征;
根據所述查詢語句特征和所述搜索結果的特征生成所述需求識別結果。
8.如權利要求7所述的方法,其特征在于,所述搜索結果的特征包括題目特征、摘要特征、位置特征、樣式特征中的至少一種。
9.如權利要求7所述的方法,其特征在于,在根據所述查詢語句特征和所述搜索結果的特征生成所述需求識別結果之后,還包括:
對所述需求識別結果進行需求消歧。
10.如權利要求9所述的方法,其特征在于,對所述需求識別結果進行需求消歧,包括:
獲取與所述查詢語句對應的搜索結果的語義片段;
利用預設模型獲得所述語義片段中的實體標簽;
基于所述實體標簽對所述需求識別結果進行需求消歧。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711464202.1/1.html,轉載請聲明來源鉆瓜專利網。





