[發(fā)明專利]一種用于本體匹配的本體詞法分析方法無效
| 申請?zhí)枺?/td> | 201110290913.8 | 申請日: | 2011-09-29 |
| 公開(公告)號: | CN102508827A | 公開(公告)日: | 2012-06-20 |
| 發(fā)明(設(shè)計)人: | 廖建新;王晶;王純;李煒;劉秀磊;徐童;朱曉民;王敬宇;張磊;張樂劍;沈奇威;樊利民;程莉 | 申請(專利權(quán))人: | 北京郵電大學(xué) |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 本體 匹配 詞法 分析 方法 | ||
1.一種用于本體匹配的本體詞法分析方法,其特征在于:所述方法包括下列操作步驟:
(1)將待匹配的兩個本體分別定為源本體和目標(biāo)本體;
(2)將源本體和目標(biāo)本體中所有實體標(biāo)簽里的字符串以及評論里的字符串切為單詞;
(3)根據(jù)源本體的上下文找到源本體中單詞的合適詞義,根據(jù)目標(biāo)本體的上下文找到目標(biāo)本體中單詞的合適詞義;
(4)對源本體和目標(biāo)本體中單詞的合適詞義進行擴展;
(5)構(gòu)建詞義關(guān)系本體;
(6)根據(jù)源本體和目標(biāo)本體中實體的標(biāo)簽和評論中的單詞的合適詞義及該詞義擴展構(gòu)建所述源本體和目標(biāo)本體中的實體的詞法信息。
2.根據(jù)權(quán)利要求1所述的一種用于本體匹配的本體詞法分析方法,其特征在于:所述步驟2的具體操作內(nèi)容是:將源本體和目標(biāo)本體中實體標(biāo)簽和評論里的字符串分解成單詞,并處理單詞的復(fù)數(shù)、過去時、現(xiàn)在時等情況。
3.根據(jù)權(quán)利要求1所述的一種用于本體匹配的本體詞法分析方法,其特征在于:所述步驟3的具體操作內(nèi)容是:首先獲得本體中每個單詞在詞網(wǎng)WordNet中的所有詞義,檢查任何兩個來自不同單詞的詞義在詞網(wǎng)WordNet里的關(guān)系,如果它們被詞網(wǎng)WordNet里的任何關(guān)系相連接,將這兩個相連接的單詞詞義放到對應(yīng)單詞的相關(guān)詞義集合里,并記錄各單詞詞義被選進對應(yīng)單詞的相關(guān)詞義集合的次數(shù),這說明在目前本體的上下文,單詞的相關(guān)詞義集合里的任何詞義都有可能是這個單詞的合適詞義;在得到單詞的相關(guān)詞義集合后,在這個集合中選取最有最大詞義值的詞義作為該單詞的合適詞義;詞義值計算方法如下:
其中CV(SynsetA)表示單詞的相關(guān)詞義集合里詞義SynsetA的詞義值;WC(SynsetA)是詞義SynsetA被選進相關(guān)詞義集合的次數(shù);FS(SynsetA)是詞義SynsetA在詞網(wǎng)WordNet中的頻率分數(shù),是一個表示權(quán)重值的實數(shù)。
4.根據(jù)權(quán)利要求1所述的一種用于本體匹配的本體詞法分析方法,其特征在于:所述步驟4的具體操作內(nèi)容是:將步驟3所得到的單詞的合適詞義擴展到一組詞義,這組詞義中的每個元素都和該單詞的合適詞義在詞網(wǎng)WordNet中有特殊的關(guān)系,即形容詞起源pertainym關(guān)系、副詞起源derived_from_adj關(guān)系、誘導(dǎo)derivationally關(guān)系或相關(guān)related關(guān)系;單詞的合適詞義和擴展詞義構(gòu)成單詞的可用詞義集合;單詞的擴展詞義支持了實體間的潛在關(guān)系,這有助于在現(xiàn)存的上下文包括單詞的所有可能的詞義,并提高本體匹配過程的覆蓋率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京郵電大學(xué),未經(jīng)北京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110290913.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種基于詞網(wǎng)語言模型的連續(xù)語音識別系統(tǒng)
- 基于人工智能分類語音輸入文本的方法和裝置
- 一種廣告素材數(shù)據(jù)生成方法、裝置及系統(tǒng)
- 網(wǎng)管系統(tǒng)北向監(jiān)控訂購?fù)ㄖ^濾方法
- 詞法分析模型的訓(xùn)練方法、裝置、電子設(shè)備、存儲介質(zhì)
- 一種驗證方法、裝置和存儲介質(zhì)
- 解碼方法、語音識別設(shè)備和系統(tǒng)
- 一種面向神經(jīng)網(wǎng)絡(luò)機器翻譯的英文詞法分析方法及系統(tǒng)
- 用于確定輸出詞法單元的方法和設(shè)備
- 基于Bi-LSTM-CRF的三位一體字標(biāo)注漢語詞法分析方法





