[發(fā)明專(zhuān)利]基于人工智能的搜索方法、裝置和電子設(shè)備有效
| 申請(qǐng)?zhí)枺?/td> | 201711464202.1 | 申請(qǐng)日: | 2017-12-28 |
| 公開(kāi)(公告)號(hào): | CN108052659B | 公開(kāi)(公告)日: | 2022-03-11 |
| 發(fā)明(設(shè)計(jì))人: | 朱勇;宋勛超;李瑩;張一麟 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類(lèi)號(hào): | G06F16/35 | 分類(lèi)號(hào): | G06F16/35;G06F40/289;G06F40/30 |
| 代理公司: | 北京清亦華知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 人工智能 搜索 方法 裝置 電子設(shè)備 | ||
本發(fā)明公開(kāi)了一種基于人工智能的搜索方法、裝置和電子設(shè)備,其中,基于人工智能的搜索方法包括:獲取輸入的查詢(xún)語(yǔ)句;切分查詢(xún)語(yǔ)句,得到多個(gè)分詞組成的分詞序列;對(duì)分詞序列進(jìn)行結(jié)構(gòu)化分析,生成文本結(jié)構(gòu);基于文本結(jié)構(gòu),對(duì)分詞序列進(jìn)行知識(shí)化分析,生成語(yǔ)義分析結(jié)果;根據(jù)文本結(jié)構(gòu)和語(yǔ)義分析結(jié)果,確定查詢(xún)語(yǔ)句對(duì)應(yīng)的理解結(jié)果。本發(fā)明實(shí)施例的基于人工智能的搜索方法、裝置和電子設(shè)備,通過(guò)對(duì)查詢(xún)語(yǔ)句進(jìn)行結(jié)構(gòu)化分析和知識(shí)化分析,得到文本結(jié)構(gòu)和語(yǔ)義分析結(jié)果,從而確定查詢(xún)語(yǔ)句對(duì)應(yīng)的理解結(jié)果,降低搜索結(jié)果的誤召回,提高準(zhǔn)確率,滿(mǎn)足用戶(hù)需求。
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理技術(shù)領(lǐng)域,尤其涉及一種基于人工智能的搜索方法、裝置和電子設(shè)備。
背景技術(shù)
傳統(tǒng)的搜索引擎,對(duì)query(查詢(xún)信息)的理解,主要還是將query切分為多個(gè)關(guān)鍵詞來(lái)進(jìn)行解析。具體地,可先對(duì)query進(jìn)行分詞,生成由多個(gè)關(guān)鍵詞(keyword)組成的序列,并為每個(gè)關(guān)鍵詞分配一定的權(quán)重(weight)。然后,對(duì)待檢索內(nèi)容(比如互聯(lián)網(wǎng)網(wǎng)頁(yè))同樣做分詞,生成分詞(term)序列,并分配一定的權(quán)重。計(jì)算兩個(gè)序列中分詞的重合程度(相似度),同時(shí)配合權(quán)重計(jì)算得分,得到一個(gè)純文本相關(guān)度的排序結(jié)果。最后,基于用戶(hù)對(duì)原始排序結(jié)果不斷地點(diǎn)擊行為的記錄,動(dòng)態(tài)調(diào)整排序結(jié)果,從而得到用戶(hù)更愿意點(diǎn)擊或停留的搜索結(jié)果。
但是,上述方法并沒(méi)有對(duì)query進(jìn)行更深層次地理解,依靠比較扁平化的關(guān)鍵詞序列來(lái)召回排序結(jié)果,依靠用戶(hù)的歷史行為來(lái)優(yōu)化排序結(jié)果,準(zhǔn)確率并不高,無(wú)法滿(mǎn)足用戶(hù)的需求。
發(fā)明內(nèi)容
本發(fā)明提供一種基于人工智能的搜索方法、裝置和電子設(shè)備,以解決上述技術(shù)問(wèn)題中的至少一個(gè)。
本發(fā)明實(shí)施例提供一種基于人工智能的搜索方法,包括:獲取輸入的查詢(xún)語(yǔ)句;
切分所述查詢(xún)語(yǔ)句,得到多個(gè)分詞組成的分詞序列;
對(duì)所述分詞序列進(jìn)行結(jié)構(gòu)化分析,生成文本結(jié)構(gòu);
基于所述文本結(jié)構(gòu),對(duì)所述分詞序列進(jìn)行知識(shí)化分析,生成語(yǔ)義分析結(jié)果;
根據(jù)所述文本結(jié)構(gòu)和所述語(yǔ)義分析結(jié)果,確定所述查詢(xún)語(yǔ)句對(duì)應(yīng)的理解結(jié)果。
可選的,對(duì)所述分詞序列進(jìn)行結(jié)構(gòu)化分析,生成文本結(jié)構(gòu),包括:
基于歷史查詢(xún)?nèi)罩?,?duì)所述分詞序列進(jìn)行共現(xiàn)挖掘和同義挖掘,以獲取多個(gè)擴(kuò)展查詢(xún)語(yǔ)句;
基于預(yù)設(shè)聚類(lèi)算法,對(duì)所述多個(gè)擴(kuò)展查詢(xún)語(yǔ)句進(jìn)行聚類(lèi);
對(duì)聚類(lèi)后的所述多個(gè)擴(kuò)展查詢(xún)語(yǔ)句進(jìn)行結(jié)構(gòu)抽取,以生成所述文本結(jié)構(gòu)。
可選的,在生成所述文本結(jié)構(gòu)之后,還包括:
對(duì)所述文本結(jié)構(gòu)進(jìn)行泛化和等價(jià)歸一。
可選的,基于所述文本結(jié)構(gòu),對(duì)所述分詞序列進(jìn)行知識(shí)化分析,生成語(yǔ)義分析結(jié)果,包括:
對(duì)所述分詞序列進(jìn)行需求識(shí)別,以生成需求識(shí)別結(jié)果;
基于知識(shí)庫(kù),對(duì)所述需求識(shí)別結(jié)果進(jìn)行概念識(shí)別,以生成概念識(shí)別結(jié)果;
基于所述知識(shí)庫(kù),對(duì)所述概念識(shí)別結(jié)果進(jìn)行意圖識(shí)別,以生成所述語(yǔ)義分析結(jié)果。
可選的,對(duì)聚類(lèi)后的所述多個(gè)擴(kuò)展查詢(xún)語(yǔ)句進(jìn)行結(jié)構(gòu)抽取,以生成所述文本結(jié)構(gòu),包括:
基于所述多個(gè)擴(kuò)展查詢(xún)語(yǔ)句之間的重疊的頻度和錯(cuò)位的長(zhǎng)尾性,獲取所述多個(gè)擴(kuò)展查詢(xún)語(yǔ)句之間的共性的序列區(qū)間和特異性的序列區(qū)間;
基于預(yù)設(shè)類(lèi)型的槽位,替換所述多個(gè)擴(kuò)展查詢(xún)語(yǔ)句之間的特異性的序列區(qū)間;
基于所述共性的序列區(qū)間和所述預(yù)設(shè)類(lèi)型的槽位,生成所述文本結(jié)構(gòu)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711464202.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 使用基于云端的度量迭代訓(xùn)練人工智能的系統(tǒng)
- 一種人工智能轉(zhuǎn)人工智能再轉(zhuǎn)人工方案
- O-RAN系統(tǒng)中的人工智能模型處理方法和裝置
- 人工智能傷口評(píng)估方法及智能終端
- 人工智能倫理風(fēng)險(xiǎn)與防范虛擬仿真方法、系統(tǒng)和機(jī)器人
- 一種基于人工智能基礎(chǔ)資源與技術(shù)調(diào)控系統(tǒng)及方法
- 基于人工智能倫理備選規(guī)則的人工智能倫理風(fēng)險(xiǎn)防范方法
- 人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范虛擬仿真實(shí)驗(yàn)方法和機(jī)器人
- 基于人工智能體決策的人工智能倫理風(fēng)險(xiǎn)辨識(shí)和防范方法
- 基于算法選擇的人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范方法和機(jī)器人
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線(xiàn)程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





