[發(fā)明專利]一種互聯(lián)對(duì)象的檢索方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201910378932.2 | 申請(qǐng)日: | 2019-05-08 |
| 公開(kāi)(公告)號(hào): | CN110110333A | 公開(kāi)(公告)日: | 2019-08-09 |
| 發(fā)明(設(shè)計(jì))人: | 湯奇峰;龍文明 | 申請(qǐng)(專利權(quán))人: | 上海數(shù)據(jù)交易中心有限公司 |
| 主分類號(hào): | G06F17/27 | 分類號(hào): | G06F17/27;G06Q30/06 |
| 代理公司: | 上海翰信知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 31270 | 代理人: | 張維東 |
| 地址: | 200436 上海*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 互聯(lián) 檢索 關(guān)鍵要素 相關(guān)度 分詞 排序 主體標(biāo)識(shí) 集合 關(guān)鍵詞匹配 相似度匹配 倒排索引 檢索結(jié)果 接收輸入 權(quán)重 匹配 | ||
本發(fā)明涉及一種互聯(lián)對(duì)象的檢索方法及系統(tǒng),包括:準(zhǔn)備數(shù)據(jù),接收輸入的檢索描述并將檢索描述拆分為多個(gè)分詞;將多個(gè)分詞及倒排索引庫(kù)中的倒排關(guān)鍵詞進(jìn)行相似度匹配,獲取與多個(gè)分詞相似的互聯(lián)對(duì)象的主體標(biāo)識(shí)集合;根據(jù)主體標(biāo)識(shí)集合獲取對(duì)應(yīng)互聯(lián)對(duì)象的所有倒排關(guān)鍵詞,由多個(gè)分詞與多個(gè)倒排關(guān)鍵詞匹配計(jì)算得到對(duì)應(yīng)關(guān)鍵要素的相關(guān)值,根據(jù)關(guān)鍵要素的相關(guān)值和權(quán)重值計(jì)算得到關(guān)鍵要素的相關(guān)度分值,進(jìn)而通過(guò)各關(guān)鍵要素的相關(guān)度分值得到互聯(lián)對(duì)象的相關(guān)度分值,從而得到互聯(lián)對(duì)象的綜合排序分值;根據(jù)綜合排序分值對(duì)與檢索描述匹配的互聯(lián)對(duì)象的進(jìn)行排序以得到檢索結(jié)果。本發(fā)明根據(jù)相關(guān)度計(jì)算對(duì)主體標(biāo)識(shí)集合對(duì)應(yīng)的互聯(lián)對(duì)象進(jìn)行排序以提升檢索質(zhì)量。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)檢索技術(shù)領(lǐng)域,特別涉及一種互聯(lián)對(duì)象的檢索方法及系統(tǒng)。
背景技術(shù)
隨著數(shù)據(jù)交易品類的不斷增加,數(shù)據(jù)需方用戶(簡(jiǎn)稱用戶)在成千上萬(wàn)的商品中檢索符合自身需求的商品是不易的。目前,很多檢索方法中可能包含一定的推薦,例如將質(zhì)量好的商品排到比較靠前的位置,以促成交易,提升服務(wù)質(zhì)量。檢索排序的目的是幫助用戶快速的找到需要的商品;從技術(shù)上來(lái)說(shuō),就是將用戶輸入的詞與商品進(jìn)行匹配,把最符合用戶需求的商品排到最前面,其它的依次排在后續(xù)的位置。
然而,互聯(lián)對(duì)象同一般商城上的商品不一樣,互聯(lián)對(duì)象(也可以稱為數(shù)據(jù)互聯(lián)對(duì)象)是數(shù)據(jù)交易中的交易實(shí)體、流通對(duì)象。互聯(lián)對(duì)象具有其獨(dú)特的標(biāo)識(shí)及屬性等,因此需要對(duì)互聯(lián)對(duì)象的標(biāo)識(shí)等進(jìn)行轉(zhuǎn)譯等操作。且目前尚未有一種算法可以較好地支持互聯(lián)對(duì)象的檢索,因此,有必要發(fā)明一種互聯(lián)對(duì)象的檢索方法及系統(tǒng),以滿足用戶需求,并且有效促進(jìn)數(shù)據(jù)交易,提升服務(wù)質(zhì)量。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種互聯(lián)對(duì)象的檢索方法及系統(tǒng),以滿足用戶需求,并且有效促進(jìn)數(shù)據(jù)交易,提升服務(wù)質(zhì)量。
為了解決現(xiàn)有技術(shù)中存在的問(wèn)題,本發(fā)明提供了一種互聯(lián)對(duì)象的檢索方法,所述互聯(lián)對(duì)象具有至少一個(gè)關(guān)鍵要素,包括:
數(shù)據(jù)準(zhǔn)備,建立領(lǐng)域詞庫(kù)數(shù)據(jù)庫(kù)、倒排索引庫(kù)數(shù)據(jù)庫(kù)以及互聯(lián)對(duì)象數(shù)據(jù)庫(kù);
接收輸入的檢索描述,并將所述檢索描述拆分為多個(gè)分詞;
將多個(gè)所述分詞及所述倒排索引庫(kù)中的倒排關(guān)鍵詞進(jìn)行相似度匹配,獲取與多個(gè)所述分詞相似的互聯(lián)對(duì)象的主體標(biāo)識(shí)集合;
根據(jù)所述主體標(biāo)識(shí)集合獲取所述與多個(gè)所述分詞相似的互聯(lián)對(duì)象的所有倒排關(guān)鍵詞,其中所述倒排關(guān)鍵詞對(duì)應(yīng)于所述關(guān)鍵要素,由多個(gè)所述分詞與所有倒排關(guān)鍵詞匹配計(jì)算得到所有倒排關(guān)鍵詞對(duì)應(yīng)的關(guān)鍵要素的相關(guān)值,根據(jù)所述關(guān)鍵要素的相關(guān)值和關(guān)鍵要素對(duì)應(yīng)的權(quán)重值計(jì)算得到所述關(guān)鍵要素的相關(guān)度分值;
各互聯(lián)對(duì)象的相關(guān)度分值根據(jù)其對(duì)應(yīng)的關(guān)鍵要素的相關(guān)度分值得到,各互聯(lián)對(duì)象的綜合排序分值根據(jù)各互聯(lián)對(duì)象的相關(guān)度分值得到;
根據(jù)所述綜合排序分值對(duì)與所述檢索描述匹配的互聯(lián)對(duì)象進(jìn)行排序以得到檢索結(jié)果。
可選的,在所述互聯(lián)對(duì)象的檢索方法中,所述互聯(lián)對(duì)象數(shù)據(jù)庫(kù)包括互聯(lián)對(duì)象;所述領(lǐng)域詞庫(kù)數(shù)據(jù)庫(kù)包括分詞詞庫(kù)以及分詞向量庫(kù);所述倒排索引庫(kù)包括倒排關(guān)鍵詞庫(kù)以及倒排關(guān)鍵詞向量庫(kù),所述倒排關(guān)鍵詞庫(kù)中包括倒排關(guān)鍵詞、倒排關(guān)鍵詞對(duì)應(yīng)的互聯(lián)對(duì)象以及倒排關(guān)鍵詞對(duì)應(yīng)的互聯(lián)對(duì)象的關(guān)鍵要素。
可選的,在所述互聯(lián)對(duì)象的檢索方法中,相似度匹配包括以下步驟:通過(guò)分詞及倒排關(guān)鍵詞得到分詞向量及倒排關(guān)鍵詞向量,并輪詢計(jì)算所述分詞向量與所述倒排關(guān)鍵詞向量的余弦值,根據(jù)預(yù)設(shè)余弦閾值得到所述與多個(gè)所述分詞相似的互聯(lián)對(duì)象的主體標(biāo)識(shí)集合。
可選的,在所述互聯(lián)對(duì)象的檢索方法中,計(jì)算所述關(guān)鍵要素的相關(guān)值包括以下步驟:
通過(guò)分詞及倒排關(guān)鍵詞得到分詞向量及倒排關(guān)鍵詞向量,并輪詢計(jì)算各分詞向量與各倒排關(guān)鍵詞向量的余弦值,根據(jù)預(yù)設(shè)余弦閾值篩選余弦值;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海數(shù)據(jù)交易中心有限公司,未經(jīng)上海數(shù)據(jù)交易中心有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910378932.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種互聯(lián)網(wǎng)電視終端安全訪問(wèn)互聯(lián)網(wǎng)的方法
- 一種互聯(lián)網(wǎng)應(yīng)用交互方法、裝置及系統(tǒng)
- 一種多屏互動(dòng)方法、服務(wù)器、終端及系統(tǒng)
- 一種使用互聯(lián)網(wǎng)移動(dòng)攝像終端進(jìn)行異地圖像拍攝的系統(tǒng)
- 一種復(fù)合式互聯(lián)空氣懸架及其互聯(lián)模式控制方法
- 利用區(qū)塊鏈保護(hù)用于互聯(lián)網(wǎng)資源分配的事務(wù)
- 一種實(shí)現(xiàn)芯片互聯(lián)超高帶寬的方法及芯片互聯(lián)結(jié)構(gòu)
- 一種面向異構(gòu)網(wǎng)絡(luò)的智能互聯(lián)方法及系統(tǒng)
- 中央管理服務(wù)器的互聯(lián)網(wǎng)連接方法及系統(tǒng)
- 互聯(lián)網(wǎng)節(jié)點(diǎn)中信任傳播方法、系統(tǒng)及相關(guān)產(chǎn)品
- 一種基于關(guān)鍵要素的產(chǎn)品協(xié)同設(shè)計(jì)支撐方法
- 一種報(bào)文存儲(chǔ)、轉(zhuǎn)發(fā)方法、裝置及系統(tǒng)
- 意圖識(shí)別方法及裝置
- 一種文檔的地質(zhì)要素標(biāo)注方法
- 煤礦事故預(yù)測(cè)模型確定及監(jiān)測(cè)方法、存儲(chǔ)介質(zhì)和電子設(shè)備
- 測(cè)試用例生成方法、執(zhí)行方法及裝置
- 區(qū)域代表性水文關(guān)鍵要素點(diǎn)的快速識(shí)別方法
- 糾紛案件實(shí)體識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種軌道系統(tǒng)跨域運(yùn)維關(guān)鍵要素辨識(shí)方法
- 語(yǔ)義表達(dá)式生成方法、裝置及設(shè)備
- 一種基于查詢結(jié)果的語(yǔ)義相關(guān)度計(jì)算方法
- 搜索結(jié)果排序方法及系統(tǒng)
- 數(shù)據(jù)相關(guān)度評(píng)估設(shè)備、數(shù)據(jù)相關(guān)度評(píng)估方法和記錄介質(zhì)
- 一種圖像檢索方法
- 一種圖片信息識(shí)別方法及終端
- 一種ElasticSearch搜索相關(guān)度算法優(yōu)化方法及系統(tǒng)
- 一種DDoS攻擊的防御方法及設(shè)備
- 一種數(shù)據(jù)分類方法和系統(tǒng)
- 信息推薦方法、裝置和電子設(shè)備
- 相關(guān)度模型的建立方法、判定方法、站點(diǎn)發(fā)現(xiàn)方法及裝置





