[發明專利]一種基于模糊神經網絡的句子匹配程度計算及對齊方法有效
| 申請號: | 201310604055.9 | 申請日: | 2013-11-25 |
| 公開(公告)號: | CN103617227A | 公開(公告)日: | 2014-03-05 |
| 發明(設計)人: | 戴光榮;宋玉春 | 申請(專利權)人: | 福建工程學院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/28 |
| 代理公司: | 北京市商泰律師事務所 11255 | 代理人: | 陳朝陽 |
| 地址: | 350108 福建省*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 模糊 神經網絡 句子 匹配 程度 計算 對齊 方法 | ||
1.一種基于模糊神經網絡的句子匹配程度計算方法,其特征在于,包括以下步驟:
首先提取英文和中文的匹配特征;
采用模糊神經網絡的形式實現信息融合;
建立計算匹配度模型。
2.如權利要求1所述的基于模糊神經網絡的句子匹配程度計算方法,其特征在于,具體包括以下步驟:
(1)、把英文句子E分解成一個個的單詞,并查字典,求得每個單詞的中文含義,設所有單詞語義的集合為EC;
(2)、把匹配特征CD1清零,查找中文句子中每個字看是否屬于EC,若屬于則CD1加1,求得匹配特征CD1;
(3)、把匹配特征CD2清零,查找中文句子中每個單詞看是否屬于EC,若屬于則CD2加1,求得匹配特征CD2;
(4)、把匹配特征CD3清零,求得英文句子長度LE和中文句子長度LC,則CD3=LE/LC,求得匹配特征CD3;
(5)、將CD1、CD2、CD3模糊化,隸屬度函數均取等腰三角形形式,當CD1、CD2、CD3的實際值已知時,CD1、CD2、CD3的論域上最多有兩個模糊集被激活,CD1對應的隸屬度為hcd1a、hcd1b,CD2對應的隸屬度為hcd2a、hcd2b,CD3對應的隸屬度為hcd3a、hcd3b;
(6)、令h1=min(hcd1a,hcd2a,hcd3a)
h2=min(hcd1a,hcd2a,hcd3b)
h3=min(hcd1a,hcd2b,hcd3a)
h4=min(hcd1a,hcd2b,hcd3b)
h5=min(hcd1b,hcd2a,hcd3a)
h6=min(hcd1b,hcd2a,hcd3b)
h7=min(hcd1b,hcd2b,hcd3a)
h8=min(hcd1b,hcd2b,hcd3b)
其中,函數min(a,b,c)為取a、b、c中最小值運算。
(7)、單層神經網絡實現模糊推理,神經網絡輸出單元有一個S形激活函數,以增強網絡逼近曲面的能力,此函數為:
其中:
式中:θ為閥值;hm為步驟6中求得的隸屬度值;wm為第m個權值,權值由步驟8訓練求得;DEC為英文句子為E和中文句子為C的匹配度;
(8)、選取[0,1]區間的隨機值作為w1,w2....w8的初值(k=0),把已經對齊好的樣本依次輸入到此算法中,那么k+1時刻的權值如下:
wm(k+1)=wm(k)+β·[Dd(k)-D(k)]·hm(k)m=1,2…8
式中:β為學習速率因子;Dd(k)為k時刻希望網絡的輸出,全部取1;D(k)為k時刻網絡的實際輸出,全部取1;hm(k)為步驟6中求得的隸屬度值;經過多次訓練,求得權值w1,w2....w8。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福建工程學院,未經福建工程學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310604055.9/1.html,轉載請聲明來源鉆瓜專利網。





