[發(fā)明專利]一種自動化搜索的方法有效
| 申請?zhí)枺?/td> | 201810207878.0 | 申請日: | 2018-03-09 |
| 公開(公告)號: | CN110309408B | 公開(公告)日: | 2023-07-14 |
| 發(fā)明(設(shè)計)人: | 陳包容 | 申請(專利權(quán))人: | 陳包容 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9537 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 410000 湖南省長沙市*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 自動化 搜索 方法 | ||
1.一種自動化搜索的方法,其特征在于:包括以下步驟:
第一步:創(chuàng)建用戶搜索意圖計算系統(tǒng),所述用戶搜索意圖計算系統(tǒng),包括子系統(tǒng):
(1)創(chuàng)建用戶的個人場景事件圖譜;
(2)搜索前,用戶操作的復(fù)制、剪切、粘貼事件中的一種及多種組合;
(3)搜索前,用戶在設(shè)備上接觸的具體事件;
(4)搜索前,基于用戶的消息、語音、視頻、電郵通訊內(nèi)容;
(5)基于用戶的疑問;
(6)基于最近的熱點新聞事件;
(7)基于新知識點;
(8)基于聯(lián)系人、聯(lián)系方式和通訊錄附屬信息;所述通訊錄附屬信息包括:單位、地址與備注信息;
(9)基于用戶的拍照、視頻;
(10)基于用戶的個人場景搜索記錄庫;
(11)基于深度學(xué)習(xí)的概率預(yù)測;
(12)基于用戶編輯的文檔內(nèi)容;
第二步:獲取用戶的搜索意圖;
第三步:基于意圖,生成搜索文本;所述生成搜索文本,包括:
(1)直接采用已有的文本;
(2)在已有的文本基礎(chǔ)上,優(yōu)化生成搜索文本;首先對已有的文本通過詞條初始URL進行解析,然后頁面鏈接解析器基于定義的HTML規(guī)則將該頁面中所包含的其它詞條URL保存至詞條URL庫中,之后對解析的URL發(fā)出抓取請求,將獲取的數(shù)據(jù)發(fā)送至知識數(shù)據(jù)解析器,由知識數(shù)據(jù)解析器負(fù)責(zé)在每個詞條頁面中獲取所需要的知識數(shù)據(jù)去重,最后對過濾后的知識數(shù)據(jù)進行三元組存儲集合處理,達到優(yōu)化生成搜索文本;
(3)智能生成搜索文本;
所述智能生成搜索文本包括:
①將圖片、音頻、視頻、動漫轉(zhuǎn)換成文本;
②將長句子、篇章文本通過文本摘要技術(shù)智能生成符合預(yù)先設(shè)定的搜索關(guān)鍵詞的字?jǐn)?shù)閾值;自動文摘過程包括三個基本步驟:
S1、文本分析過程:對長句子、篇章文本進行分析處理,識別出冗余信息;
S2、文本內(nèi)容的選取和泛化過程:從文檔中辨認(rèn)重要信息,通過摘錄式文摘和理解式文摘的方法壓縮文本,形成文摘表示;摘錄型文摘由原文中抽取出來的片段組成,理解型文摘是對原文只要內(nèi)容重新組織后形成的;
S3、文摘的轉(zhuǎn)換和生成過程:實現(xiàn)對原文內(nèi)容的重組或根據(jù)語義表示生成文摘,并確保文摘的連貫性;
第四步:自動彈框顯示不少于一個搜索文本,點擊打開搜索網(wǎng)頁;或/和直接顯示基于搜索文本的搜索頁面;
所述創(chuàng)建用戶的個人場景事件圖譜步驟包括:
步驟1:預(yù)設(shè)多層次場景標(biāo)簽庫,并預(yù)設(shè)對應(yīng)的場景邏輯關(guān)系、場景間的關(guān)聯(lián)概率計算規(guī)則、以及場景之間的時序關(guān)系、鏈?zhǔn)酱?lián)表達關(guān)系;
步驟2:通過用戶手機使用的基站與衛(wèi)星定位系統(tǒng)動獲得獲取與計算用戶的多層次場景標(biāo)簽值,對應(yīng)存儲到預(yù)設(shè)的多層次場景標(biāo)簽庫中,根據(jù)預(yù)設(shè)的所述場景邏輯關(guān)系,生成用戶個人場景;
步驟3:基于多個獨立的用戶個人場景,根據(jù)場景間的關(guān)聯(lián)概率計算規(guī)則,計算預(yù)設(shè)時間段內(nèi)多個獨立的用戶個人場景之間關(guān)聯(lián)概率,根據(jù)預(yù)設(shè)的場景之間的時序關(guān)系、鏈?zhǔn)酱?lián)表達關(guān)系,生成用戶個人場景圖譜;
所述個人場景搜索記錄庫存儲為區(qū)塊鏈云服務(wù)器,包括私有區(qū)塊鏈設(shè)備、公有區(qū)塊鏈設(shè)備、節(jié)點服務(wù)器、中央服務(wù)器、硬件防火墻、區(qū)塊鏈存儲模塊、發(fā)送模塊和接收模塊;其中私有區(qū)塊鏈設(shè)備、公有區(qū)塊鏈設(shè)備通過區(qū)塊鏈存儲模塊存儲個人的公有和私有的事件采集數(shù)據(jù),實時的通過發(fā)送模塊分布式發(fā)送到節(jié)點服務(wù)器中,通過接收模塊接受實時采集的事件數(shù)據(jù)并通過節(jié)點服務(wù)器上傳到中央服務(wù)器中,所述云服務(wù)器還包括硬件防火墻;區(qū)塊鏈存儲模塊中數(shù)據(jù)劃分為區(qū)塊鏈備份模塊、區(qū)塊鏈隔離模塊和區(qū)塊鏈節(jié)點模塊,將現(xiàn)有區(qū)塊鏈數(shù)據(jù)按照功能隔離為單獨的模塊,區(qū)塊鏈節(jié)點模塊設(shè)置在節(jié)點服務(wù)器中,支持跨網(wǎng)絡(luò)訪問,在模塊出現(xiàn)運行錯誤時,區(qū)塊鏈備份模塊、區(qū)塊鏈隔離模塊針對單一模塊進行升級修復(fù)更新。
2.如權(quán)利要求1所述的一種自動化搜索的方法,其特征在于:所述基于深度學(xué)習(xí)的猜測包括:應(yīng)用于個人場景搜索記錄庫,對生成的數(shù)據(jù)做濾波、去除偽跡預(yù)處理操作,然后提取數(shù)據(jù)的人、時間、天氣、地點、性別、職業(yè)、年齡的實時特征參數(shù),進行PCA相關(guān)性主成分分析,提取主成分特征參數(shù),然后訓(xùn)練識別模型,選擇徑向基函數(shù)為核函數(shù)的支持向量機作為情緒識別模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于陳包容,未經(jīng)陳包容許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810207878.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 自動化設(shè)備和自動化系統(tǒng)
- 一種基于流程驅(qū)動的測試自動化方法以及測試自動化系統(tǒng)
- 用于工業(yè)自動化設(shè)備認(rèn)識的系統(tǒng)和方法
- 實現(xiàn)過程自動化服務(wù)的標(biāo)準(zhǔn)化設(shè)計方法學(xué)的自動化系統(tǒng)
- 一種日產(chǎn)50萬安時勻漿自動化系統(tǒng)
- 一種自動化肥料生產(chǎn)系統(tǒng)
- 一種電氣自動化設(shè)備自動檢測系統(tǒng)及檢測方法
- 用于自動化應(yīng)用的抽象層
- 一種基于虛擬化架構(gòu)的自動化系統(tǒng)功能驗證方法
- 自動化測試框架自動測試的實現(xiàn)技術(shù)





