[發(fā)明專(zhuān)利]一種知識(shí)共享平臺(tái)的詞條處理裝置和方法有效
| 申請(qǐng)?zhí)枺?/td> | 201410268830.2 | 申請(qǐng)日: | 2014-06-16 |
| 公開(kāi)(公告)號(hào): | CN104021202B | 公開(kāi)(公告)日: | 2017-11-24 |
| 發(fā)明(設(shè)計(jì))人: | 李永強(qiáng) | 申請(qǐng)(專(zhuān)利權(quán))人: | 百度在線(xiàn)網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類(lèi)號(hào): | G06F17/30 | 分類(lèi)號(hào): | G06F17/30 |
| 代理公司: | 北京銘碩知識(shí)產(chǎn)權(quán)代理有限公司11286 | 代理人: | 王艷嬌 |
| 地址: | 100085 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 知識(shí) 共享 平臺(tái) 詞條 處理 裝置 方法 | ||
1.一種知識(shí)共享平臺(tái)的詞條處理裝置,所述裝置包括:
候選詞條獲取單元,用于根據(jù)目標(biāo)詞條的目錄中第一目錄的目錄名稱(chēng)和所述第一目錄下的目錄內(nèi)容,獲取與所述第一目錄關(guān)聯(lián)的候選詞條及其詞條內(nèi)容;
內(nèi)容比較單元,用于計(jì)算每個(gè)候選詞條的詞條內(nèi)容與所述第一目錄下的目錄內(nèi)容之間的文本相似度;
詞條確定單元,用于根據(jù)內(nèi)容比較單元計(jì)算的文本相似度,從候選詞條中確定與所述第一目錄相關(guān)的詞條,
其中,候選詞條獲取單元選擇所述第一目錄的目錄名加上所述第一目錄的一部分目錄內(nèi)容組成候選文本,從所述候選文本中確定屬于詞條數(shù)據(jù)庫(kù)中的現(xiàn)有詞條,將所述現(xiàn)有詞條確定為所述候選詞條。
2.如權(quán)利要求1所述的裝置,其中,所述候選詞條獲取單元使用trie樹(shù)算法從存儲(chǔ)有詞條的詞條數(shù)據(jù)庫(kù)提取與所述第一目錄關(guān)聯(lián)的候選詞條。
3.如權(quán)利要求1所述的裝置,其中,所述內(nèi)容比較單元使用tf-idf算法來(lái)計(jì)算候選詞條的詞條內(nèi)容與所述第一目錄下的目錄內(nèi)容之間的文本相似度。
4.如權(quán)利要求1所述的裝置,其中,所述詞條確定單元具體用于:將針對(duì)所述候選詞條而計(jì)算的文本相似度與預(yù)設(shè)閾值進(jìn)行比較,如果計(jì)算的文本相似度高于預(yù)設(shè)閾值,則所述詞條確定單元將高于預(yù)設(shè)閾值的候選詞條確定為與所述第一目錄相關(guān)的詞條。
5.如權(quán)利要求4所述的裝置,其中,所述詞條確定單元還用于:確定所述候選詞條是否滿(mǎn)足預(yù)設(shè)的多條后處理規(guī)則;如果滿(mǎn)足預(yù)設(shè)的多條后處理規(guī)則中的第N條,則所述詞條確定單元確定所述第N條后處理規(guī)則對(duì)應(yīng)的閾值,并判斷針對(duì)滿(mǎn)足所述第N條后處理規(guī)則的候選詞條計(jì)算的文本相似度是否高于與所述第N條后處理規(guī)則對(duì)應(yīng)的閾值,如果高于,則所述詞條確定單元將高于與所述第N條后處理規(guī)則對(duì)應(yīng)的閾值的候選詞條確定為與所述第一目錄相關(guān)的詞條,N為自然數(shù)。
6.一種知識(shí)共享平臺(tái)的詞條處理方法,所述方法包括:
根據(jù)目標(biāo)詞條的目錄中第一目錄的目錄名稱(chēng)和所述第一目錄下的目錄內(nèi) 容,獲取與所述第一目錄關(guān)聯(lián)的候選詞條及其詞條內(nèi)容;
計(jì)算每個(gè)候選詞條的詞條內(nèi)容與所述第一目錄下的目錄內(nèi)容之間的文本相似度;
根據(jù)計(jì)算的文本相似度,從候選詞條中確定與所述第一目錄相關(guān)的詞條,
其中,在獲取所述候選詞條的步驟中,選擇所述第一目錄的目錄名加上所述第一目錄的一部分目錄內(nèi)容組成候選文本,從所述候選文本中確定屬于詞條數(shù)據(jù)庫(kù)中的現(xiàn)有詞條,將所述現(xiàn)有詞條確定為所述候選詞條。
7.如權(quán)利要求6所述的方法,其中,使用trie樹(shù)算法從存儲(chǔ)有詞條的詞條數(shù)據(jù)庫(kù)提取與所述第一目錄關(guān)聯(lián)的候選詞條。
8.如權(quán)利要求6所述的方法,其中,使用tf-idf算法來(lái)計(jì)算候選詞條的詞條內(nèi)容與所述第一目錄下的目錄內(nèi)容之間的文本相似度。
9.如權(quán)利要求6所述的方法,其中,確定與所述第一目錄相關(guān)的詞條的步驟具體包括:將針對(duì)所述候選詞條而計(jì)算的文本相似度與預(yù)設(shè)閾值進(jìn)行比較,如果計(jì)算的文本相似度高于預(yù)設(shè)閾值,則將高于預(yù)設(shè)閾值的候選詞條確定為與所述第一目錄相關(guān)的詞條。
10.如權(quán)利要求9所述的方法,其中,確定與所述第一目錄相關(guān)的詞條的步驟進(jìn)一步包括:確定所述候選詞條是否滿(mǎn)足預(yù)設(shè)的多條后處理規(guī)則;如果滿(mǎn)足預(yù)設(shè)的多條后處理規(guī)則中的第N條,則確定所述第N條后處理規(guī)則對(duì)應(yīng)的閾值,并判斷針對(duì)滿(mǎn)足所述第N條后處理規(guī)則的候選詞條計(jì)算的文本相似度是否高于與所述第N條后處理規(guī)則對(duì)應(yīng)的閾值,如果高于,則將高于與所述第N條后處理規(guī)則對(duì)應(yīng)的閾值的候選詞條確定為與所述第一目錄相關(guān)的詞條,N為自然數(shù)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于百度在線(xiàn)網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線(xiàn)網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410268830.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:一體式室內(nèi)外空氣交換機(jī)
- 下一篇:一種鋰離子電池的化成方法
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫(kù)系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)
- 服務(wù)器、系統(tǒng)及信息共享方法
- 一種信息共享系統(tǒng)及信息共享方法
- 一種移動(dòng)終端的數(shù)據(jù)無(wú)線(xiàn)共享方法及該移動(dòng)終端
- 一種桌面共享系統(tǒng)及方法
- 一種用于共享移動(dòng)汽車(chē)電池的方法
- 一種基于物聯(lián)網(wǎng)的移動(dòng)共享方法及移動(dòng)共享系統(tǒng)
- 一種數(shù)據(jù)共享方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 基于云平臺(tái)的數(shù)據(jù)共享方法、裝置、共享平臺(tái)及存儲(chǔ)介質(zhì)
- 確定共享乘坐度量
- 設(shè)備功能共享方法、裝置、終端及存儲(chǔ)介質(zhì)
- 創(chuàng)建詞條的方法及創(chuàng)建詞條的裝置
- 內(nèi)置詞條的顯示方法及顯示系統(tǒng)
- 用于展示候選詞條的方法和裝置
- 一種詞條轉(zhuǎn)化方法及裝置
- 操控句式生成、應(yīng)用操控方法及裝置、存儲(chǔ)介質(zhì)
- 詞條處理方法、移動(dòng)終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種詞條權(quán)重計(jì)算模型訓(xùn)練方法及裝置
- 一種基于區(qū)塊鏈的百科詞條管理系統(tǒng)和實(shí)施方法
- 目標(biāo)概念圖譜的構(gòu)建方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種待翻譯詞條的更新方法、裝置、設(shè)備和介質(zhì)





