[發(fā)明專(zhuān)利]一種數(shù)據(jù)處理方法和系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201710285832.6 | 申請(qǐng)日: | 2017-04-27 |
| 公開(kāi)(公告)號(hào): | CN107193883B | 公開(kāi)(公告)日: | 2020-06-02 |
| 發(fā)明(設(shè)計(jì))人: | 劉超;王洪俊;肖詩(shī)斌 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京拓爾思信息技術(shù)股份有限公司 |
| 主分類(lèi)號(hào): | G06F16/335 | 分類(lèi)號(hào): | G06F16/335;G06F16/332 |
| 代理公司: | 北京康達(dá)聯(lián)禾知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11461 | 代理人: | 陳曉娟;王方明 |
| 地址: | 100088 北京市海淀區(qū)知*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 數(shù)據(jù)處理 方法 系統(tǒng) | ||
本發(fā)明實(shí)施例提供了一種數(shù)據(jù)處理方法和系統(tǒng),其中,所述方法包括:獲取待處理的第一數(shù)據(jù);根據(jù)自然語(yǔ)言處理引擎抽取所述第一數(shù)據(jù)的關(guān)鍵詞序列;根據(jù)協(xié)同過(guò)濾引擎確定所述關(guān)鍵詞序列的推薦數(shù)據(jù);查詢(xún)預(yù)設(shè)的數(shù)據(jù)庫(kù),得到與所述推薦數(shù)據(jù)匹配的第二數(shù)據(jù)。本發(fā)明實(shí)施例利用協(xié)同過(guò)濾引擎和第一數(shù)據(jù)的關(guān)鍵詞序列確定第一數(shù)據(jù)的相似數(shù)據(jù),即推薦數(shù)據(jù),采用協(xié)同過(guò)濾技術(shù)確定第一數(shù)據(jù)的相似數(shù)據(jù),提高了確定相似數(shù)據(jù)的準(zhǔn)確率。當(dāng)?shù)谝粩?shù)據(jù)作為問(wèn)題數(shù)據(jù),第二數(shù)據(jù)作為答案數(shù)據(jù)時(shí),本發(fā)明實(shí)施例也提高了答案推薦的準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明實(shí)施例涉及人工智能技術(shù)領(lǐng)域,尤其涉及一種數(shù)據(jù)處理方法和系統(tǒng)。
背景技術(shù)
智能問(wèn)答是將積累的無(wú)序語(yǔ)料信息,進(jìn)行有序和科學(xué)的整理,并建立基于知識(shí)的分類(lèi)模型;這些分類(lèi)模型可以指導(dǎo)新增加的語(yǔ)料咨詢(xún)和服務(wù)信息,節(jié)約人力資源,提高信息處理的自動(dòng)性,降低網(wǎng)站運(yùn)行成本。
傳統(tǒng)的智能問(wèn)答方案是基于問(wèn)題的相似度計(jì)算,或者是基于句型模式匹配,都是在顯示關(guān)系中進(jìn)行挖掘,即尋找知識(shí)庫(kù)中的相似問(wèn)題進(jìn)行問(wèn)題匹配,將與匹配得到的問(wèn)題對(duì)應(yīng)的答案作為最終的答案。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種數(shù)據(jù)處理方法和系統(tǒng),以解決現(xiàn)有的智能問(wèn)答方案推薦的答案不準(zhǔn)確的問(wèn)題。
根據(jù)本發(fā)明實(shí)施例的一方面,提供了一種數(shù)據(jù)處理方法,包括:獲取待處理的第一數(shù)據(jù);根據(jù)自然語(yǔ)言處理引擎抽取所述第一數(shù)據(jù)的關(guān)鍵詞序列;根據(jù)協(xié)同過(guò)濾引擎確定所述關(guān)鍵詞序列的推薦數(shù)據(jù);查詢(xún)預(yù)設(shè)的數(shù)據(jù)庫(kù),得到與所述推薦數(shù)據(jù)匹配的第二數(shù)據(jù)。
根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種數(shù)據(jù)處理系統(tǒng),包括:獲取模塊,用于獲取待處理的第一數(shù)據(jù);抽取模塊,用于根據(jù)自然語(yǔ)言處理引擎抽取所述第一數(shù)據(jù)的關(guān)鍵詞序列;確定模塊,用于根據(jù)協(xié)同過(guò)濾引擎確定所述關(guān)鍵詞序列的推薦數(shù)據(jù);查詢(xún)模塊,用于查詢(xún)預(yù)設(shè)的數(shù)據(jù)庫(kù),得到與所述推薦數(shù)據(jù)匹配的第二數(shù)據(jù)。
根據(jù)本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理方法和系統(tǒng),獲取待處理的第一數(shù)據(jù),第一數(shù)據(jù)可以為用戶輸入的問(wèn)題數(shù)據(jù),進(jìn)而根據(jù)自然語(yǔ)言處理引擎抽取第一數(shù)據(jù)的關(guān)鍵詞序列,再根據(jù)協(xié)同過(guò)濾引擎確定關(guān)鍵詞序列的推薦數(shù)據(jù),該推薦數(shù)據(jù)可以理解為與第一數(shù)據(jù)相似的問(wèn)題數(shù)據(jù),最后查詢(xún)預(yù)設(shè)的數(shù)據(jù)庫(kù),得到與推薦數(shù)據(jù)匹配的第二數(shù)據(jù),該第二數(shù)據(jù)可以理解為推薦數(shù)據(jù)的答案數(shù)據(jù)。
本發(fā)明實(shí)施例在獲取到第一數(shù)據(jù)之后,抽取第一數(shù)據(jù)的關(guān)鍵詞序列,進(jìn)而根據(jù)協(xié)同過(guò)濾引擎確定關(guān)鍵詞序列的推薦數(shù)據(jù),再?gòu)念A(yù)設(shè)的數(shù)據(jù)庫(kù)中查找到與推薦數(shù)據(jù)匹配的第二數(shù)據(jù)作為第一數(shù)據(jù)的答案。與傳統(tǒng)的直接從數(shù)據(jù)庫(kù)中查找第一數(shù)據(jù)的相似數(shù)據(jù)不同,本發(fā)明實(shí)施例利用協(xié)同過(guò)濾引擎和第一數(shù)據(jù)的關(guān)鍵詞序列確定第一數(shù)據(jù)的相似數(shù)據(jù),即推薦數(shù)據(jù),采用協(xié)同過(guò)濾技術(shù)確定第一數(shù)據(jù)的相似數(shù)據(jù),提高了確定相似數(shù)據(jù)的準(zhǔn)確率。當(dāng)?shù)谝粩?shù)據(jù)作為問(wèn)題數(shù)據(jù),第二數(shù)據(jù)作為答案數(shù)據(jù)時(shí),本發(fā)明實(shí)施例也提高了答案推薦的準(zhǔn)確率。
附圖說(shuō)明
圖1是根據(jù)本發(fā)明實(shí)施例一的一種數(shù)據(jù)處理方法的步驟流程圖;
圖2是根據(jù)本發(fā)明實(shí)施例一的一種數(shù)據(jù)處理方法中一種用戶與物品的關(guān)聯(lián)管理示意圖;
圖3是根據(jù)本發(fā)明實(shí)施例一的一種數(shù)據(jù)處理方法中另一種用戶與物品的關(guān)聯(lián)管理示意圖;
圖4是根據(jù)本發(fā)明實(shí)施例二的一種數(shù)據(jù)處理方法的步驟流程圖;
圖5是根據(jù)本發(fā)明實(shí)施例二的一種數(shù)據(jù)處理方法中問(wèn)題數(shù)據(jù)與關(guān)鍵詞之間的隱式關(guān)系示意圖;
圖6是根據(jù)本發(fā)明實(shí)施例二的一種數(shù)據(jù)處理方法中問(wèn)答流程示意圖;
圖7是根據(jù)本發(fā)明實(shí)施例二的一種數(shù)據(jù)處理方法中生成關(guān)鍵詞-推薦問(wèn)題詞典的步驟流程圖;
圖8是根據(jù)本發(fā)明實(shí)施例二的一種數(shù)據(jù)處理方法中生成新的隱式關(guān)系詞典的步驟流程圖;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京拓爾思信息技術(shù)股份有限公司,未經(jīng)北京拓爾思信息技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710285832.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計(jì)算機(jī)可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





