[發(fā)明專利]基于互聯(lián)網(wǎng)的術(shù)語定義辨析方法有效
| 申請(qǐng)?zhí)枺?/td> | 201310206190.8 | 申請(qǐng)日: | 2013-05-29 |
| 公開(公告)號(hào): | CN104216880B | 公開(公告)日: | 2017-06-16 |
| 發(fā)明(設(shè)計(jì))人: | 呂學(xué)強(qiáng);吳瑞紅 | 申請(qǐng)(專利權(quán))人: | 北京信息科技大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100192 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 互聯(lián)網(wǎng) 術(shù)語 定義 辨析 方法 | ||
1.一種基于互聯(lián)網(wǎng)的術(shù)語定義辨析方法,其特征在于,包括步驟:
A待辨析術(shù)語定義獲取;
B基于互聯(lián)網(wǎng)的參考釋義獲取;
C術(shù)語定義的表示;
D術(shù)語定義相似度計(jì)算;
E術(shù)語定義模板獲取;
F術(shù)語定義可信度計(jì)算和辨析結(jié)果選擇;
從術(shù)語定義相似度矩陣D12中,選取矩陣D12的一行中的最大值Smax1,并將該值所在的行列刪除;繼續(xù)選取余下矩陣的第二行最大值Smax2,并將該值所在的行列刪除,以此類推,直至矩陣中元素個(gè)數(shù)為零;得到新的最大值矩陣:Smax=(Smax1,Smax2,...,Samxn);則術(shù)語定義def和ref之間的基于句序的語義相似度為:
其中,句序是指在一段文本中,句子出現(xiàn)的先后順序;術(shù)語定義def=(u11,u12,...u1n)和ref=(u21,u22,...u2m)之間相似度的特征矩陣D12由句子間相似度構(gòu)成,可形式化表示為:
其中:u1i(1≤i≤n)為術(shù)語定義def中第i個(gè)出現(xiàn)的句子,u2j(1≤j≤m)為術(shù)語定義ref中第j個(gè)出現(xiàn)的句子;u2j×u1i表示句子u2j與句子u1i間的相似度,即u2j×u1i=SenSim(u2j,u1i)。
2.根據(jù)權(quán)利要求1所述的基于互聯(lián)網(wǎng)的術(shù)語定義辨析方法,其特征在于,所述的術(shù)語參考釋義是指最能反映術(shù)語所指稱概念的釋義。
3.根據(jù)權(quán)利要求1或2所述的基于互聯(lián)網(wǎng)的術(shù)語定義辨析方法,其特征在于,從互聯(lián)網(wǎng)上獲取參考釋義:
獲取術(shù)語在百度百科和百度搜索的前N條摘要信息作為構(gòu)建術(shù)語參考釋義的文本:若百度百科中有該術(shù)語的定義,則取百度百科中的百度名片或百度百科簡介作為該術(shù)語的參考釋義文本;若其在百度百科中沒有定義,則選取其在百度搜索引擎中,該術(shù)語搜索結(jié)果的前N條摘要作為該術(shù)語的參考釋義文本。
4.根據(jù)權(quán)利要求1所述的基于互聯(lián)網(wǎng)的術(shù)語定義辨析方法,其特征在于,術(shù)語定義的特征:術(shù)語定義由描述該術(shù)語所指稱概念的若干個(gè)句子按照一定的順序組成,所述句子指以中文標(biāo)點(diǎn)符號(hào)分割形成的短句,其中每個(gè)句子中詞與詞之間通過一定的關(guān)系聯(lián)系在一起,且每個(gè)詞都有固定的詞性。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京信息科技大學(xué),未經(jīng)北京信息科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310206190.8/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 基于網(wǎng)絡(luò)電視的互聯(lián)網(wǎng)業(yè)務(wù)處理方法和系統(tǒng)
- 互聯(lián)網(wǎng)業(yè)務(wù)接入網(wǎng)關(guān)的實(shí)現(xiàn)方法和系統(tǒng)
- 一種互聯(lián)網(wǎng)電視終端安全訪問互聯(lián)網(wǎng)的方法
- 一種互聯(lián)網(wǎng)應(yīng)用交互方法、裝置及系統(tǒng)
- 一種使用互聯(lián)網(wǎng)移動(dòng)攝像終端進(jìn)行異地圖像拍攝的系統(tǒng)
- 一種網(wǎng)絡(luò)電視終端安全訪問互聯(lián)網(wǎng)的方法
- 利用區(qū)塊鏈保護(hù)用于互聯(lián)網(wǎng)資源分配的事務(wù)
- 互聯(lián)網(wǎng)廣告裝置及方法
- 中央管理服務(wù)器的互聯(lián)網(wǎng)連接方法及系統(tǒng)
- 互聯(lián)網(wǎng)節(jié)點(diǎn)中信任傳播方法、系統(tǒng)及相關(guān)產(chǎn)品
- 一種領(lǐng)域術(shù)語抽取的方法
- 醫(yī)學(xué)術(shù)語識(shí)別方法及裝置
- 術(shù)語抽取方法和裝置
- 一種醫(yī)療術(shù)語知識(shí)庫完善的方法和裝置
- 一種構(gòu)建制造領(lǐng)域術(shù)語庫的方法及系統(tǒng)
- 術(shù)語更新方法以及相關(guān)設(shè)備、裝置
- 一種醫(yī)學(xué)術(shù)語系統(tǒng)的構(gòu)建方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于多特征的術(shù)語檢索方法
- 一種術(shù)語替換方法及系統(tǒng)
- 一種標(biāo)準(zhǔn)術(shù)語確定方法、裝置及存儲(chǔ)介質(zhì)





