[發(fā)明專利]一種智能理解用戶查詢意圖的方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201810123239.6 | 申請日: | 2018-02-07 |
| 公開(公告)號: | CN110309400A | 公開(公告)日: | 2019-10-08 |
| 發(fā)明(設(shè)計)人: | 楊云飛;李超;吳雪軍 | 申請(專利權(quán))人: | 鼎復數(shù)據(jù)科技(北京)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F17/27 |
| 代理公司: | 北京康思博達知識產(chǎn)權(quán)代理事務所(普通合伙) 11426 | 代理人: | 范國鋒;劉冬梅 |
| 地址: | 100020 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用戶查詢 命名實體 智能理解 查詢效率 查詢語句 詞性標注 分詞處理 分詞結(jié)果 輸入查詢 語法規(guī)則 語法解析 詞性 語句 標注 詞語 審計 分析 保證 | ||
本發(fā)明公開了一種智能理解用戶查詢意圖的方法及系統(tǒng),其實現(xiàn)過程為輸入查詢語句,結(jié)合詞典,進行分詞處理;對分詞結(jié)果進行詞性標注;對標注詞性后詞語進行命名實體識別;通過命名實體識別的結(jié)果和設(shè)定的語法規(guī)則,進行語法解析,獲得用戶查詢意圖。本發(fā)明方法針對貸款審計行業(yè)中行文特點,對輸入的查詢語句逐層分析,深入地理解用戶查詢意圖,在保證準確性的前提下,提高了查詢效率。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理技術(shù),具體涉及一種智能理解用戶查詢意圖的方法及系統(tǒng)。
背景技術(shù)
用戶查詢意圖的理解與處理旨在通過對用戶輸入查詢的建模、分析和處理。理解用戶查詢的意圖,利于提高信息檢索的質(zhì)量和用戶體驗。現(xiàn)有通用搜索的特點是抓取互聯(lián)網(wǎng)/數(shù)據(jù)庫上的一切有價值的信息同時建立索引,以關(guān)鍵字匹配為基本檢索方式。傳統(tǒng)的通用搜索引擎中,由于其要適用廣泛的要求,其智能性往往不高;因為提高其智能性必定大幅降低搜索的效率,讓搜索引擎不堪重負。因此,通用的搜索引擎在信息查找時往往存在很多的缺陷,大多數(shù)用戶并不能十分準確地用查詢詞表達自己的搜索意圖,而使得搜索引擎無法提供精準、高效、個性化的搜索服務,甚至根本就搜索不到用戶真正需要查找的信息。
到目前為止,關(guān)于用戶查詢意圖理解的研究有很多,但在面向主題的用戶查詢意圖理解中還存在以下問題:
(1)現(xiàn)有的查詢搜索方法中多是基于簡短的關(guān)鍵字或特定格式模版的查詢,能查詢的輸入長度十分有限,在輸入一句較長文本的情況下,大多時候會被截斷并忽略處理,使得用戶查詢意圖無法正確獲取;
(2)對于輸入完整語句的查詢算法中,沒有較好的利用語句中的關(guān)鍵實體和句法結(jié)構(gòu)帶來的有用信息。
本發(fā)明人了解到,貸款審計行業(yè)中存在大量文檔閱讀審計的需求,閱讀量大需要根據(jù)文檔內(nèi)容進行理解、判斷進行決策。由于文本中大量都是非結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù),且寫文檔的人水平思路又不盡相同,造成人在審閱過程中所有內(nèi)容都需要進行理解查看,而實際需要重點關(guān)注的內(nèi)容其實并不多或者不同部門的人關(guān)注的內(nèi)容不同,如在財務報表中,存在著大量的非結(jié)構(gòu)化數(shù)據(jù),但經(jīng)常更關(guān)注各個指標與對應數(shù)值而不需要閱讀全部文字內(nèi)容,從而造成人力浪費嚴重;進而可能需要將非結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),或者分析非結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù)中的信息對,獲得匹配的指標與對應數(shù)值。
但不論是將非結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),還是分析非結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù)中的信息對,理解文檔中表述的意圖是基本前提。面對大量的閱讀需求,有必要采用自動化智能理解技術(shù),通過語法解析獲取關(guān)鍵詞(或?qū)嶓w) 依存關(guān)系,對文檔進行理解。人們通過語法解析后輸出結(jié)果,即可獲得文檔語義及關(guān)鍵詞表達。
基于上述問題,亟需開發(fā)一種智能理解用戶查詢意圖的方法,該方法不受查詢輸入長度限制,且能較好利用關(guān)鍵詞,快速、準確判斷用戶查詢意圖(即查詢文檔內(nèi)容),為準確及時的對查詢信息進行反饋提供支持。
發(fā)明內(nèi)容
為了克服上述問題,本發(fā)明人進行了銳意研究,基于用戶大量的查詢輸入和主題特點,結(jié)合關(guān)鍵詞和特定主題,提出了一種經(jīng)分詞、詞性分析、命名實體識別和自底向上的句法結(jié)構(gòu)分析,逐層深入地理解用戶查詢意圖的方法,從而完成本發(fā)明。
本發(fā)明的目的在于提供以下技術(shù)方案:
(1)一種智能理解用戶查詢意圖的方法,所述方法包括:
步驟110,輸入查詢語句,結(jié)合詞典,進行分詞處理;
步驟120,對分詞結(jié)果進行詞性標注;
步驟130,對標注詞性后詞語進行命名實體識別;
步驟140,通過命名實體識別的結(jié)果和設(shè)定的語法規(guī)則,進行語法解析,獲得用戶查詢意圖。
(2)一種用于實現(xiàn)上述(1)所述方法的智能理解用戶查詢意圖的系統(tǒng),所述系統(tǒng)包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于鼎復數(shù)據(jù)科技(北京)有限公司,未經(jīng)鼎復數(shù)據(jù)科技(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810123239.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:基于日期分類的場景信息推送方法及裝置
- 下一篇:一種信息處理方法及裝置





