日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于瓶頸特征的復雜音頻分割聚類方法在審

專利信息
申請?zhí)枺?/td> 201710101550.6 申請日: 2017-02-24
公開(公告)號: CN106952644A 公開(公告)日: 2017-07-14
發(fā)明(設計)人: 李艷雄;王琴;李先苦;張雪;張聿晗 申請(專利權)人: 華南理工大學
主分類號: G10L15/04 分類號: G10L15/04;G10L15/26;G10L25/24;G10L25/30;G10L25/51;G06F17/30
代理公司: 廣州市華學知識產(chǎn)權代理有限公司44245 代理人: 李斌
地址: 510640 廣*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 瓶頸 特征 復雜 音頻 分割 方法
【權利要求書】:

1.一種基于瓶頸特征的復雜音頻分割聚類方法,其特征在于,包括如下步驟:

S1、帶瓶頸層的深度神經(jīng)網(wǎng)絡構造:讀入訓練數(shù)據(jù)并提取梅爾頻率倒譜系數(shù)特征,再通過無監(jiān)督預訓練和有監(jiān)督精確調(diào)整兩個步驟構造一個帶瓶頸層的深度神經(jīng)網(wǎng)絡特征提取器;

S2、端點檢測:讀入復雜音頻流,通過基于門限判決的靜音檢測方法找出音頻流中所有的靜音段和非靜音信號段,并將各個非靜音信號段拼接成一個長信號段;

S3、瓶頸特征提取:提取S1步驟中的梅爾頻率倒譜系數(shù)特征并輸入深度神經(jīng)網(wǎng)絡特征提取器,從深度神經(jīng)網(wǎng)絡特征提取器的瓶頸層提取瓶頸特征;

S4、音頻分割:采用基于貝葉斯信息準則的方法檢測長信號段中的音頻類型改變點,根據(jù)這些改變點把長信號段分割成若干個音頻段,使得每個音頻段只包含一種音頻類型且相鄰音頻段的音頻類型不同;

S5、音頻聚類:采用譜聚類算法對各音頻段進行聚類,得到音頻類型個數(shù),并將相同音頻類型的音頻段合并在一起。

2.根據(jù)權利要求1所述的一種基于瓶頸特征的復雜音頻分割聚類方法,其特征在于,步驟S1中帶瓶頸層的深度神經(jīng)網(wǎng)絡構造具體包括以下步驟:

S1.1、讀入訓練數(shù)據(jù)并提取梅爾頻率倒譜系數(shù)特征,具體步驟如下:

S1.1.1、預加重:設置數(shù)字濾波器的傳遞函數(shù)為H(z)=1-αz-1,其中α為一個系數(shù)且取值為:0.9≤α≤1,讀入的音頻流通過該數(shù)字濾波器后實現(xiàn)預加重;

S1.1.2、分幀:設置音頻幀的幀長為25毫秒、幀移為10毫秒,幀長和幀移所對應的采樣點個數(shù)分別為N=0.025×fs和S=0.01×fs,其中fs為音頻采樣頻率,將讀入的音頻流切分成音頻幀x′t(n),1≤t≤T,0≤n≤N-1,其中T和N分別表示幀數(shù)和每幀的采樣點數(shù);

S1.1.3、窗函數(shù)ω(n)為漢明窗:

將每幀音頻信號x′t(n)與漢明窗ω(n)相乘得到加窗后的音頻信號xt(n):

xt(n)=ω(n)×x′t(n) n=0,1,...,N-1;t=1,2,...,T,

S1.1.4、提取梅爾頻率倒譜系數(shù)特征:

S1.1.4.1、對第t幀音頻信號xt(n)做離散傅立葉變換得到線性頻譜Xt(k):

<mrow><mtable><mtr><mtd><mrow><msub><mi>X</mi><mi>t</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>n</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow></munderover><msub><mi>x</mi><mi>t</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><msup><mi>e</mi><mrow><mo>-</mo><mi>j</mi><mfrac><mrow><mn>2</mn><mi>n</mi><mi>k</mi><mi>&pi;</mi></mrow><mi>N</mi></mfrac></mrow></msup></mrow></mtd><mtd><mrow><mn>0</mn><mo>&le;</mo><mi>n</mi><mo>,</mo><mi>k</mi><mo>&le;</mo><mi>N</mi><mo>-</mo><mn>1</mn></mrow></mtd></mtr></mtable><mo>,</mo></mrow>

S1.1.4.2、將上述線性頻譜Xt(k)通過梅爾頻率濾波器組得到梅爾頻譜,再進行對數(shù)運算得到對數(shù)頻譜St(m),其中梅爾頻率濾波器組為若干個帶通濾波器Hm(k),0≤m<M,M為濾波器的個數(shù),每個濾波器具有三角形濾波特性,其中心頻率為f(m),當m值較小時相鄰f(m)的間隔較小,隨著m的增加相鄰f(m)的間隔逐漸變大,每個帶通濾波器的傳遞函數(shù)為:

<mrow><mtable><mtr><mtd><mrow><msub><mi>H</mi><mi>m</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mn>0</mn></mtd><mtd><mrow><mi>k</mi><mo>&lt;</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mfrac><mrow><mi>k</mi><mo>-</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow><mrow><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>)</mo></mrow><mo>-</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow></mfrac></mtd><mtd><mrow><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>&le;</mo><mi>k</mi><mo>&le;</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mfrac><mrow><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>-</mo><mi>k</mi></mrow><mrow><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>-</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>)</mo></mrow></mrow></mfrac></mtd><mtd><mrow><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>)</mo></mrow><mo>&lt;</mo><mi>k</mi><mo>&le;</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mrow><mi>k</mi><mo>&gt;</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></mrow></mtd></mtr></mtable></mfenced></mrow></mtd><mtd><mrow><mo>(</mo><mn>0</mn><mo>&le;</mo><mi>m</mi><mo>&le;</mo><mi>M</mi><mo>)</mo></mrow></mtd></mtr></mtable><mo>,</mo></mrow>

其中,0≤m<M,f(m)定義如下:

<mrow><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><mfrac><mi>N</mi><msub><mi>f</mi><mi>s</mi></msub></mfrac><mo>)</mo></mrow><msup><mi>B</mi><mrow><mo>-</mo><mn>1</mn></mrow></msup><mrow><mo>(</mo><mi>B</mi><mo>(</mo><msub><mi>f</mi><mi>l</mi></msub><mo>)</mo><mo>+</mo><mi>m</mi><mfrac><mrow><mi>B</mi><mrow><mo>(</mo><msub><mi>f</mi><mi>h</mi></msub><mo>)</mo></mrow><mo>-</mo><mi>B</mi><mrow><mo>(</mo><msub><mi>f</mi><mi>l</mi></msub><mo>)</mo></mrow></mrow><mrow><mi>M</mi><mo>+</mo><mn>1</mn></mrow></mfrac><mo>)</mo></mrow><mo>,</mo></mrow>

其中,fl、fh為濾波器的最低頻率和最高頻率,B-1為B的逆函數(shù):

B-1(b)=700(eb/1125-1),

因此由線性頻譜Xt(k)到對數(shù)頻譜St(m)的變換為:

<mrow><mtable><mtr><mtd><mrow><msub><mi>S</mi><mi>t</mi></msub><mrow><mo>(</mo><mi>m</mi><mo>)</mo></mrow><mo>=</mo><mi>l</mi><mi>n</mi><mrow><mo>(</mo><munderover><mo>&Sigma;</mo><mrow><mi>k</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow></munderover><msup><mrow><mo>|</mo><msub><mi>X</mi><mi>t</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><msub><mi>H</mi><mi>m</mi></msub><mo>(</mo><mi>k</mi><mo>)</mo><mo>)</mo></mrow></mrow></mtd><mtd><mrow><mn>0</mn><mo>&le;</mo><mi>m</mi><mo>&lt;</mo><mi>M</mi></mrow></mtd></mtr></mtable><mo>;</mo></mrow>

S1.1.4.3、將上述對數(shù)頻譜St(m)經(jīng)過離散余弦變換變換到倒譜域,得到第t幀音頻信號的梅爾頻率倒譜系數(shù)特征,即Ct(p):

<mrow><mtable><mtr><mtd><mrow><msub><mi>C</mi><mi>t</mi></msub><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>m</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>M</mi><mo>-</mo><mn>1</mn></mrow></munderover><msub><mi>S</mi><mi>t</mi></msub><mrow><mo>(</mo><mi>m</mi><mo>)</mo></mrow><mi>c</mi><mi>o</mi><mi>s</mi><mrow><mo>(</mo><mfrac><mrow><mo>(</mo><mi>m</mi><mo>+</mo><mn>0.5</mn><mo>)</mo><mi>n</mi><mi>&pi;</mi></mrow><mi>M</mi></mfrac><mo>)</mo></mrow></mrow></mtd><mtd><mrow><mn>0</mn><mo>&le;</mo><mi>p</mi><mo>&lt;</mo><mi>M</mi></mrow></mtd></mtr></mtable><mo>,</mo></mrow>

S1.1.4.4、對每幀音頻信號重復步驟S1.1.4.1-S1.1.4.3,得到所有音頻幀的梅爾頻率倒譜系數(shù)特征,將它們按幀的順序組合成一個梅爾頻率倒譜系數(shù)特征矩陣;

S1.2、預訓練:采用逐層堆疊受限玻爾茲曼機的方法構造一個深度置信網(wǎng),得到預訓練的網(wǎng)絡參數(shù);

受限玻爾茲曼機采用基于能量的通用分布模型去表示任意概率分布,其能量函數(shù)定義為:

<mrow><mi>E</mi><mrow><mo>(</mo><mi>v</mi><mo>,</mo><mi>h</mi><mo>)</mo></mrow><mo>=</mo><mo>-</mo><munder><mo>&Sigma;</mo><mrow><mi>i</mi><mo>&Element;</mo><mi>v</mi><mi>i</mi><mi>s</mi></mrow></munder><munder><mo>&Sigma;</mo><mrow><mi>j</mi><mo>&Element;</mo><mi>h</mi><mi>i</mi><mi>d</mi></mrow></munder><msub><mi>v</mi><mi>i</mi></msub><msub><mi>h</mi><mi>j</mi></msub><msub><mi>w</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>-</mo><munder><mo>&Sigma;</mo><mrow><mi>i</mi><mo>&Element;</mo><mi>v</mi><mi>i</mi><mi>s</mi></mrow></munder><msub><mi>v</mi><mi>i</mi></msub><msub><mi>a</mi><mi>i</mi></msub><mo>-</mo><munder><mo>&Sigma;</mo><mrow><mi>j</mi><mo>&Element;</mo><mi>h</mi><mi>i</mi><mi>d</mi></mrow></munder><msub><mi>h</mi><mi>j</mi></msub><msub><mi>b</mi><mi>j</mi></msub><mo>,</mo></mrow>

其中v,h分別代表可視層單元和隱含層單元的狀態(tài)矢量,wij表示可視層第i個節(jié)點與隱含層第j個節(jié)點的連接權重,vi和ai分別表示可視層的第i個節(jié)點的狀態(tài)和偏移量,hj和bj分別表示隱含層的第j個節(jié)點的狀態(tài)和偏移量,vis和hid分別表示可視層和隱含層的節(jié)點集合;當所有參數(shù)都確定時,可以得到受限玻爾茲曼機能量函數(shù)關于v和h的聯(lián)合概率分布:

<mrow><mi>p</mi><mrow><mo>(</mo><mi>v</mi><mo>,</mo><mi>h</mi><mo>)</mo></mrow><mo>=</mo><mfrac><msup><mi>e</mi><mrow><mo>-</mo><mi>E</mi><mrow><mo>(</mo><mi>v</mi><mo>,</mo><mi>h</mi><mo>)</mo></mrow></mrow></msup><mrow><munder><mo>&Sigma;</mo><mrow><mi>v</mi><mo>,</mo><mi>h</mi></mrow></munder><msup><mi>e</mi><mrow><mo>-</mo><mi>E</mi><mrow><mo>(</mo><mi>v</mi><mo>,</mo><mi>h</mi><mo>)</mo></mrow></mrow></msup></mrow></mfrac><mo>,</mo></mrow>

由聯(lián)合分布得到邊緣概率分布:

<mrow><mi>p</mi><mrow><mo>(</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><munder><mo>&Sigma;</mo><mi>h</mi></munder><msup><mi>e</mi><mrow><mo>-</mo><mi>E</mi><mrow><mo>(</mo><mi>v</mi><mo>,</mo><mi>h</mi><mo>)</mo></mrow></mrow></msup></mrow><mrow><munder><mo>&Sigma;</mo><mrow><mi>v</mi><mo>,</mo><mi>h</mi></mrow></munder><msup><mi>e</mi><mrow><mo>-</mo><mi>E</mi><mrow><mo>(</mo><mi>v</mi><mo>,</mo><mi>h</mi><mo>)</mo></mrow></mrow></msup></mrow></mfrac><mo>,</mo></mrow>

<mrow><mi>p</mi><mrow><mo>(</mo><mi>h</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><munder><mo>&Sigma;</mo><mi>v</mi></munder><msup><mi>e</mi><mrow><mo>-</mo><mi>E</mi><mrow><mo>(</mo><mi>v</mi><mo>,</mo><mi>h</mi><mo>)</mo></mrow></mrow></msup></mrow><mrow><munder><mo>&Sigma;</mo><mrow><mi>v</mi><mo>,</mo><mi>h</mi></mrow></munder><msup><mi>e</mi><mrow><mo>-</mo><mi>E</mi><mrow><mo>(</mo><mi>v</mi><mo>,</mo><mi>h</mi><mo>)</mo></mrow></mrow></msup></mrow></mfrac><mo>,</mo></mrow>

條件概率為:

<mrow><mi>p</mi><mrow><mo>(</mo><mi>v</mi><mo>|</mo><mi>h</mi><mo>)</mo></mrow><mo>=</mo><mfrac><msup><mi>e</mi><mrow><mo>-</mo><mi>E</mi><mrow><mo>(</mo><mi>v</mi><mo>,</mo><mi>h</mi><mo>)</mo></mrow></mrow></msup><mrow><munder><mo>&Sigma;</mo><mi>v</mi></munder><msup><mi>e</mi><mrow><mo>-</mo><mi>E</mi><mrow><mo>(</mo><mi>v</mi><mo>,</mo><mi>h</mi><mo>)</mo></mrow></mrow></msup></mrow></mfrac><mo>,</mo></mrow>

<mrow><mi>p</mi><mrow><mo>(</mo><mi>h</mi><mo>|</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><mfrac><msup><mi>e</mi><mrow><mo>-</mo><mi>E</mi><mrow><mo>(</mo><mi>v</mi><mo>,</mo><mi>h</mi><mo>)</mo></mrow></mrow></msup><mrow><munder><mo>&Sigma;</mo><mi>h</mi></munder><msup><mi>e</mi><mrow><mo>-</mo><mi>E</mi><mrow><mo>(</mo><mi>v</mi><mo>,</mo><mi>h</mi><mo>)</mo></mrow></mrow></msup></mrow></mfrac><mo>,</mo></mrow>

高斯-伯努利受限玻爾茲曼機的條件概率分布可以表示為:

<mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><mi>h</mi><mo>)</mo></mrow><mo>=</mo><mi>N</mi><mrow><mo>(</mo><msub><mi>a</mi><mi>i</mi></msub><mo>+</mo><munder><mo>&Sigma;</mo><mrow><mi>j</mi><mo>&Element;</mo><mi>h</mi><mi>i</mi><mi>d</mi></mrow></munder><msub><mi>h</mi><mi>j</mi></msub><msub><mi>w</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>,</mo><mi>V</mi><mo>)</mo></mrow><mo>,</mo></mrow>

<mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>h</mi><mi>j</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><mi>&sigma;</mi><mrow><mo>(</mo><msub><mi>b</mi><mi>j</mi></msub><mo>+</mo><munder><mo>&Sigma;</mo><mrow><mi>i</mi><mo>&Element;</mo><mi>v</mi><mi>i</mi><mi>s</mi></mrow></munder><msub><mi>v</mi><mi>i</mi></msub><msub><mi>w</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow><mo>,</mo></mrow>

其中表示是均值為方差為V的高斯分布,表示輸入為的Sigmoid函數(shù),Sigmoid函數(shù)σ(x)的表達式為σ(x)=1/[1+exp(-x)];

伯努利-伯努利受限玻爾茲曼機的條件概率分布表示為:

<mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><mi>h</mi><mo>)</mo></mrow><mo>=</mo><mi>&sigma;</mi><mrow><mo>(</mo><msub><mi>a</mi><mi>i</mi></msub><mo>+</mo><munder><mo>&Sigma;</mo><mrow><mi>j</mi><mo>&Element;</mo><mi>h</mi><mi>i</mi><mi>d</mi></mrow></munder><msub><mi>h</mi><mi>j</mi></msub><msub><mi>w</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow><mo>,</mo></mrow>

<mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>h</mi><mi>j</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><mi>&sigma;</mi><mrow><mo>(</mo><msub><mi>b</mi><mi>j</mi></msub><mo>+</mo><munder><mo>&Sigma;</mo><mrow><mi>i</mi><mo>&Element;</mo><mi>v</mi><mi>i</mi><mi>s</mi></mrow></munder><msub><mi>v</mi><mi>i</mi></msub><msub><mi>w</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow><mo>,</mo></mrow>

在給定訓練集其中ns為訓練樣本數(shù)目,訓練一個受限玻爾茲曼機就是通過調(diào)整參數(shù)θ={W,a,b}來表征給定的訓練樣本,使得在該參數(shù)下由相應受限玻爾茲曼機表示的概率分布盡可能地與訓練數(shù)據(jù)相符,其中W表示權重系數(shù),a表示可視層的偏移量,b表示隱含層的偏移量;

訓練受限玻爾茲曼機的目標就是最大化似然函數(shù):

<mrow><msup><mi>&theta;</mi><mo>*</mo></msup><mo>=</mo><munder><mi>argmax</mi><mi>&theta;</mi></munder><munderover><mo>&Pi;</mo><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><mi>s</mi></msub></munderover><mi>p</mi><mrow><mo>(</mo><msup><mi>d</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><mo>,</mo></mrow>

即:

<mrow><msup><mi>&theta;</mi><mo>*</mo></msup><mo>=</mo><munder><mi>argmax</mi><mi>&theta;</mi></munder><munderover><mo>&Sigma;</mo><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><mi>s</mi></msub></munderover><mi>l</mi><mi>n</mi><mi> </mi><mi>p</mi><mrow><mo>(</mo><msup><mi>d</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><mo>,</mo></mrow>

其中p(d(t))為對樣本d(t)的似然估計;

深度置信網(wǎng)的構造過程具體包括如下步驟:

S1.2.1、選取當前幀的前后5幀作為上下文信息,共計11*13=143維作為第一個受限玻爾茲曼機的可視層輸入節(jié)點數(shù),隱含層節(jié)點數(shù)取固定值1024,將輸入特征的每一維進行倒譜均值方差歸一化,采用對比散度算法訓練一個高斯-伯努利受限玻爾茲曼機,具體過程如下:

S1.2.1.1、將連接權重初始化,值為10-3,偏移量、似然函數(shù)對權重的偏導數(shù)、似然函數(shù)對可視層以及隱含層偏移量的偏導數(shù)均初始化為0,迭代次數(shù)設置為30;

S1.2.1.2、對每一次迭代,取初始值d(0),d(0)={di(0)},i∈vis,為訓練樣本集合D中的任意一個樣本d,執(zhí)行k步Gibbs采樣得到d(k),其中在第s步(s=0,2...,k-1)過程如下:

S1.2.1.2.1、隱含層中的每一個節(jié)點的激活概率可以表示為:

<mrow><mi>p</mi><mrow><mo>(</mo><msup><msub><mi>h</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow></msup><mo>=</mo><mn>1</mn><mo>|</mo><msup><mi>d</mi><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><mo>=</mo><mi>&sigma;</mi><mrow><mo>(</mo><msub><mi>b</mi><mi>j</mi></msub><mo>+</mo><munder><mo>&Sigma;</mo><mrow><mi>i</mi><mo>&Element;</mo><mi>v</mi><mi>i</mi><mi>s</mi></mrow></munder><msup><msub><mi>d</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow></msup><msub><mi>w</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow><mo>,</mo></mrow>

S1.2.1.2.2、產(chǎn)生[0,1]區(qū)間的隨機數(shù)rj,得到隱含層狀態(tài)h(s)

<mrow><msup><msub><mi>h</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow></msup><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mrow><mi>i</mi><mi>f</mi><mi> </mi><msub><mi>r</mi><mi>j</mi></msub><mo>&lt;</mo><mi>p</mi><mrow><mo>(</mo><msup><msub><mi>h</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow></msup><mo>=</mo><mn>1</mn><mo>|</mo><msup><mi>d</mi><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mrow><mi>o</mi><mi>t</mi><mi>h</mi><mi>e</mi><mi>r</mi><mi>w</mi><mi>i</mi><mi>s</mi><mi>e</mi></mrow></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>

S1.2.1.2.3、根據(jù)隱含層狀態(tài)h(s),得到可視層每一個節(jié)點的激活概率為:

<mrow><mi>p</mi><mrow><mo>(</mo><msubsup><mi>d</mi><mi>i</mi><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mn>1</mn><mo>|</mo><msup><mi>h</mi><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><mo>=</mo><mi>N</mi><mrow><mo>(</mo><msub><mi>a</mi><mi>i</mi></msub><mo>+</mo><munder><mo>&Sigma;</mo><mrow><mi>j</mi><mo>&Element;</mo><mi>h</mi><mi>i</mi><mi>d</mi></mrow></munder><msup><msub><mi>h</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow></msup><msub><mi>w</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>,</mo><mi>V</mi><mo>)</mo></mrow><mo>,</mo></mrow>

S1.2.1.2.4、產(chǎn)生[0,1]上的隨機數(shù)ri,重構可視層輸入d(s+1)

<mrow><msup><msub><mi>d</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>s</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msup><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mrow><mi>i</mi><mi>f</mi><mi> </mi><msub><mi>r</mi><mi>i</mi></msub><mo>&lt;</mo><mi>p</mi><mrow><mo>(</mo><msup><msub><mi>d</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow></msup><mo>=</mo><mn>1</mn><mo>|</mo><msup><mi>h</mi><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mrow><mi>o</mi><mi>t</mi><mi>h</mi><mi>e</mi><mi>r</mi><mi>w</mi><mi>i</mi><mi>s</mi><mi>e</mi></mrow></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>

S1.2.1.3、經(jīng)過k步Gibbs采樣后得到的d(k)近似估計受限玻爾茲曼機參數(shù)的梯度:

<mrow><mtable><mtr><mtd><mrow><mfrac><mrow><mo>&part;</mo><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><msup><mi>d</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow></mrow><mrow><mo>&part;</mo><msub><mi>w</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub></mrow></mfrac><mo>=</mo><mi>p</mi><mrow><mo>(</mo><msub><mi>h</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><msup><mi>d</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><msup><msub><mi>d</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>-</mo><munder><mo>&Sigma;</mo><mi>d</mi></munder><mi>p</mi><mrow><mo>(</mo><mi>d</mi><mo>)</mo></mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>h</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><mi>d</mi><mo>)</mo></mrow><msub><mi>d</mi><mi>j</mi></msub></mrow></mtd></mtr><mtr><mtd><mrow><mo>&ap;</mo><mi>p</mi><mrow><mo>(</mo><msub><mi>h</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><msup><mi>d</mi><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow></msup><mo>)</mo></mrow><msup><msub><mi>d</mi><mi>j</mi></msub><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow></msup><mo>-</mo><mi>p</mi><mrow><mo>(</mo><msub><mi>h</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><msup><mi>d</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><msup><msub><mi>d</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msup></mrow></mtd></mtr></mtable><mo>,</mo></mrow>

<mrow><mtable><mtr><mtd><mrow><mfrac><mrow><mo>&part;</mo><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><msup><mi>d</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow></mrow><mrow><mo>&part;</mo><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>=</mo><msup><msub><mi>d</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>-</mo><munder><mo>&Sigma;</mo><mi>d</mi></munder><mi>p</mi><mrow><mo>(</mo><mi>d</mi><mo>)</mo></mrow><msub><mi>d</mi><mi>i</mi></msub></mrow></mtd></mtr><mtr><mtd><mrow><mo>&ap;</mo><msup><msub><mi>d</mi><mi>i</mi></msub><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow></msup><mo>-</mo><msup><msub><mi>d</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msup></mrow></mtd></mtr></mtable><mo>,</mo></mrow>

<mrow><mtable><mtr><mtd><mrow><mfrac><mrow><mo>&part;</mo><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><msup><mi>d</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow></mrow><mrow><mo>&part;</mo><msub><mi>b</mi><mi>i</mi></msub></mrow></mfrac><mo>=</mo><mi>p</mi><mrow><mo>(</mo><msub><mi>h</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><msup><mi>d</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><mo>-</mo><munder><mo>&Sigma;</mo><mi>d</mi></munder><mi>p</mi><mrow><mo>(</mo><mi>d</mi><mo>)</mo></mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>h</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><mi>d</mi><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow><mo>&ap;</mo><mi>p</mi><mrow><mo>(</mo><msub><mi>h</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><msup><mi>d</mi><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow></msup><mo>)</mo></mrow><mo>-</mo><mi>p</mi><mrow><mo>(</mo><msub><mi>h</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><msup><mi>d</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow></mrow></mtd></mtr></mtable><mo>,</mo></mrow>

其中p(hi=1|d(k))表示在可視層限定為已知的訓練樣本d(k)時隱含層的激活概率,由于該RBM為高斯-伯努利RBM,則

S1.2.1.4、得到似然函數(shù)對權重的偏導數(shù)、似然函數(shù)對可視層以及隱含層偏移量的偏導數(shù)ΔW,Δa和Δb,其中

<mrow><mtable><mtr><mtd><mrow><msub><mi>&Delta;w</mi><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow></msub><mo>=</mo><msub><mi>&Delta;w</mi><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow></msub><mo>+</mo><mo>&lsqb;</mo><mi>p</mi><mrow><mo>(</mo><msub><mi>h</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><msup><mi>d</mi><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow></msup><mo>)</mo></mrow><msup><msub><mi>d</mi><mi>j</mi></msub><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow></msup><mo>-</mo><mi>p</mi><mrow><mo>(</mo><msub><mi>h</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><msup><mi>d</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><msup><msub><mi>d</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msup><mo>&rsqb;</mo></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>&Delta;a</mi><mi>j</mi></msub><mo>=</mo><msub><mi>&Delta;a</mi><mi>j</mi></msub><mo>+</mo><mo>&lsqb;</mo><msup><msub><mi>d</mi><mi>i</mi></msub><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow></msup><mo>-</mo><msup><msub><mi>d</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msup><mo>&rsqb;</mo></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>&Delta;b</mi><mi>j</mi></msub><mo>=</mo><msub><mi>&Delta;b</mi><mi>i</mi></msub><mo>+</mo><mo>&lsqb;</mo><mi>p</mi><mrow><mo>(</mo><msub><mi>h</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><msup><mi>d</mi><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow></msup><mo>)</mo></mrow><mo>-</mo><mi>p</mi><mrow><mo>(</mo><msub><mi>h</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><msup><mi>d</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><mo>&rsqb;</mo></mrow></mtd></mtr></mtable><mo>;</mo></mrow>

S1.2.1.5、更新參數(shù):

<mrow><mtable><mtr><mtd><mrow><mi>W</mi><mo>=</mo><mi>W</mi><mo>+</mo><mi>&eta;</mi><mrow><mo>(</mo><mfrac><mn>1</mn><msub><mi>n</mi><mi>s</mi></msub></mfrac><mi>&Delta;</mi><mi>W</mi><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow><mi>a</mi><mo>=</mo><mi>a</mi><mo>+</mo><mi>&eta;</mi><mrow><mo>(</mo><mfrac><mn>1</mn><msub><mi>n</mi><mi>s</mi></msub></mfrac><mi>&Delta;</mi><mi>a</mi><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow><mi>b</mi><mo>=</mo><mi>b</mi><mo>+</mo><mi>&eta;</mi><mrow><mo>(</mo><mfrac><mn>1</mn><msub><mi>n</mi><mi>s</mi></msub></mfrac><mi>&Delta;</mi><mi>b</mi><mo>)</mo></mrow></mrow></mtd></mtr></mtable><mo>;</mo></mrow>

式中η為權重學習率,設置為0.01;

S1.2.2、保持上一個受限玻爾茲曼機的權重和偏移量不變,將上一個受限玻爾茲曼機的隱含層作為下一個受限玻爾茲曼機的可視層,并保持隱含層節(jié)點數(shù)與可視層節(jié)點數(shù)相同,迭代訓練一個伯努利-伯努利受限玻爾茲曼機,其步驟與S1.2.1類似,只是在執(zhí)行k步Gibbs采樣得到d(k)時,其可視層每一個節(jié)點的激活概率公式變?yōu)椋?/p>

<mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>d</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><mi>h</mi><mo>)</mo></mrow><mo>=</mo><mi>&sigma;</mi><mrow><mo>(</mo><msub><mi>a</mi><mi>i</mi></msub><mo>+</mo><munder><mo>&Sigma;</mo><mrow><mi>j</mi><mo>&Element;</mo><mi>h</mi><mi>i</mi><mi>d</mi></mrow></munder><msub><mi>h</mi><mi>j</mi></msub><msub><mi>w</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow><mo>,</mo></mrow>

此過程中,權重學習率變?yōu)?.04,迭代次數(shù)降為15次;

S1.2.3、按照S1.2.2中的步驟,重復迭代訓練伯努利-伯努利受限玻爾茲曼機,直到瓶頸層的前一個隱含層;

S1.2.4、將受限玻爾茲曼機的隱含層節(jié)點數(shù)設置為梅爾頻率倒譜系數(shù)特征維數(shù)的2倍,按照S1.2.2中的步驟,迭代訓練伯努利-伯努利受限玻爾茲曼機;

S1.2.5、恢復隱含層節(jié)點數(shù)為1024,按照S1.2.2中的步驟,重復迭代訓練伯努利-伯努利受限玻爾茲曼機,直到最后一個隱含層;

S1.2.6、將所有的受限玻爾茲曼機按照構造時的順序依次堆疊起來,就構成一個帶瓶頸層的深度置信網(wǎng);

S1.3、精確調(diào)整:采用有監(jiān)督訓練方法對預訓練后的深度置信網(wǎng)絡參數(shù)進行精確調(diào)整,具體包括如下步驟:

S1.3.1、在深度置信網(wǎng)的基礎上再增加一個輸出層,并隨機初始化深度置信網(wǎng)最后一層與該增加的輸出層之間的網(wǎng)絡參數(shù),從而構成一個完整的深度神經(jīng)網(wǎng)絡;

S1.3.2、利用反向傳播算法有監(jiān)督地調(diào)整深度神經(jīng)網(wǎng)絡參數(shù),最大迭代次數(shù)設為100,并且當相鄰兩次迭代的損失變化率小于0.01時終止訓練,對于每一次迭代,具體步驟如下:

S1.3.2.1、計算樣本損失函數(shù):

對于單個有標簽的訓練樣本(x,t),其中x為聲學特征,t為樣本標簽,其維度與輸出節(jié)點數(shù)相同,即訓練的音頻類別數(shù),對于音頻類型集合Y={y1,y2,..,yk,..,yK},t={t1,t2,…ti,…,tK},其中ti

<mrow><msub><mi>t</mi><mi>i</mi></msub><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mrow><mi>i</mi><mi>f</mi><mi> </mi><mi>x</mi><mo>&Element;</mo><msub><mi>y</mi><mi>k</mi></msub></mrow></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mrow><mi>o</mi><mi>t</mi><mi>h</mi><mi>e</mi><mi>r</mi><mi>w</mi><mi>i</mi><mi>s</mi><mi>e</mi></mrow></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>

單個樣本損失函數(shù)記為:

<mrow><mi>e</mi><mrow><mo>(</mo><mi>W</mi><mo>,</mo><mi>b</mi><mo>;</mo><mi>x</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><mo>|</mo><mo>|</mo><msub><mi>h</mi><mrow><mi>W</mi><mo>,</mo><mi>b</mi></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>-</mo><mi>t</mi><mo>|</mo><msup><mo>|</mo><mn>2</mn></msup><mo>,</mo></mrow>

其中hW,b(x)為網(wǎng)絡輸出層的激活函數(shù)的輸出值,

給定一個含有n個訓練樣本集{(x(1),t(1)),(x(2),t(2)),...,(x(n),t(n))},則整體損失函數(shù)為:

<mrow><mi>e</mi><mrow><mo>(</mo><mi>W</mi><mo>,</mo><mi>b</mi><mo>)</mo></mrow><mo>=</mo><mo>&lsqb;</mo><mfrac><mn>1</mn><mi>n</mi></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mi>e</mi><mrow><mo>(</mo><mi>W</mi><mo>,</mo><mi>b</mi><mo>;</mo><msup><mi>x</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msup><mo>,</mo><msup><mi>t</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><mo>&rsqb;</mo><mo>+</mo><mfrac><mi>&lambda;</mi><mn>2</mn></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>l</mi><mo>=</mo><mn>1</mn></mrow><mrow><msub><mi>m</mi><mi>l</mi></msub><mo>-</mo><mn>1</mn></mrow></munderover><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>s</mi><mi>l</mi></msub></munderover><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>s</mi><mrow><mi>l</mi><mo>+</mo><mn>1</mn></mrow></msub></munderover><msup><mrow><mo>(</mo><msubsup><mi>W</mi><mrow><mi>j</mi><mi>i</mi></mrow><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><mn>2</mn></msup><mo>,</mo></mrow>

其中ml為網(wǎng)絡總層數(shù),sl為第l層上的節(jié)點總數(shù),為第l層的節(jié)點i與第l+1層的節(jié)點j之間的連接權重,λ為平衡因子;

S1.3.2.2、根據(jù)S1.3.2.1中的整體樣本損失函數(shù),分別對網(wǎng)絡連接權重和偏移量求導,利用反向傳播算法得到偏導數(shù)值,具體過程如下:

S1.3.2.2.1、首先利用前向傳播算法,分別計算隱含層以及輸出層中所有節(jié)點的激活值

<mrow><msubsup><mi>a</mi><mi>i</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mi>&sigma;</mi><mrow><mo>(</mo><msubsup><mi>z</mi><mi>i</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><mo>,</mo></mrow>

其中σ(·)為選取的Sigmoid激活函數(shù),表示第l層第i個單元的加權和,即:

<mrow><msubsup><mi>z</mi><mi>i</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>s</mi><mi>l</mi></msub></munderover><msubsup><mi>W</mi><mrow><mi>i</mi><mi>j</mi></mrow><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>+</mo><msubsup><mi>b</mi><mi>i</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>,</mo></mrow>

S1.3.2.2.2、對于輸出層的每個輸出單元i,其殘差為:

<mrow><msubsup><mi>&delta;</mi><mi>i</mi><mrow><mo>(</mo><msub><mi>m</mi><mi>l</mi></msub><mo>)</mo></mrow></msubsup><mo>=</mo><mo>-</mo><mrow><mo>(</mo><msub><mi>t</mi><mi>i</mi></msub><mo>-</mo><msubsup><mi>a</mi><mi>i</mi><mrow><mo>(</mo><msub><mi>m</mi><mi>l</mi></msub><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><msup><mi>&sigma;</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><msubsup><mi>z</mi><mi>i</mi><mrow><mo>(</mo><msub><mi>m</mi><mi>l</mi></msub><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><mo>,</mo></mrow>

其中ti表示輸出層第i個節(jié)點的標簽,為輸出層第i個節(jié)點的激活值,表示輸出層第i個單元的加權和;

根據(jù)反向傳播算法,對于輸出層前的各個隱含層(l=2,3,…,ml-2,ml-1),依次計算其殘差為:

<mrow><msubsup><mi>&delta;</mi><mi>i</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mrow><mo>(</mo><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>s</mi><mrow><mi>l</mi><mo>+</mo><mn>1</mn></mrow></msub></munderover><msubsup><mi>W</mi><mrow><mi>j</mi><mi>i</mi></mrow><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><msubsup><mi>&delta;</mi><mi>i</mi><mrow><mo>(</mo><mi>l</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><msup><mi>&sigma;</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><msubsup><mi>z</mi><mi>i</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><mo>,</mo></mrow>

其中表示第l個隱含層的第i個節(jié)點與第l+1個隱含層中第j個節(jié)點的連接權重,為第l+1層的殘差,表示第l層第i個單元的加權和,表達式為:

<mrow><msup><mi>&sigma;</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><msubsup><mi>z</mi><mi>i</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><mo>=</mo><msubsup><mi>a</mi><mi>i</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msubsup><mi>a</mi><mi>i</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><mo>,</mo></mrow>

S1.3.2.2.3、單個樣本最終的偏導數(shù)值為:

<mrow><msub><mo>&dtri;</mo><msup><mi>W</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup></msub><mi>e</mi><mrow><mo>(</mo><mi>W</mi><mo>,</mo><mi>b</mi><mo>;</mo><mi>x</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><msup><mo>&part;</mo><mrow><mo>(</mo><mi>l</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msup><msup><mrow><mo>(</mo><msup><mi>a</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><mi>T</mi></msup><mo>,</mo></mrow>

<mrow><msub><mo>&dtri;</mo><msup><mi>b</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup></msub><mi>e</mi><mrow><mo>(</mo><mi>W</mi><mo>,</mo><mi>b</mi><mo>;</mo><mi>x</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><msup><mo>&part;</mo><mrow><mo>(</mo><mi>l</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msup><mo>,</mo></mrow>

其中,δ(l+1)={δi(l+1)},i=1,2,...,sl為第l+1層的殘差向量,a(l)={ai(l)},i=1,2,...,sl為第l層的激活值,T為轉置符號,

對于i=1:n的所有訓練樣本{(x(1),t(1)),(x(2),t(2)),...,(x(n),t(n))},迭代有:

<mrow><msup><mi>&Delta;W</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup><mo>=</mo><munder><mo>&Sigma;</mo><mi>i</mi></munder><mrow><mo>(</mo><msup><mi>&Delta;W</mi><mrow><mo>(</mo><mi>l</mi><mo>,</mo><mi>i</mi><mo>)</mo></mrow></msup><mo>+</mo><msub><mo>&dtri;</mo><msup><mi>W</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup></msub><mi>e</mi><mo>(</mo><mrow><mi>W</mi><mo>,</mo><mi>b</mi><mo>;</mo><msup><mi>x</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msup><mo>,</mo><mi>t</mi></mrow><mo>)</mo><mo>)</mo></mrow><mo>,</mo></mrow>

<mrow><msup><mi>&Delta;b</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup><mo>=</mo><mo>=</mo><munder><mo>&Sigma;</mo><mi>i</mi></munder><mrow><mo>(</mo><msup><mi>&Delta;b</mi><mrow><mo>(</mo><mi>l</mi><mo>,</mo><mi>i</mi><mo>)</mo></mrow></msup><mo>+</mo><msub><mo>&dtri;</mo><msup><mi>b</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup></msub><mi>e</mi><mo>(</mo><mrow><mi>W</mi><mo>,</mo><mi>b</mi><mo>;</mo><msup><mi>x</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msup><mo>,</mo><mi>t</mi></mrow><mo>)</mo><mo>)</mo></mrow><mo>,</mo></mrow>

其中ΔW(l)是一個與矩陣W(l)={Wij(l)}維度相同的矩陣,初始化為0,Δb(l)是一個與矩陣b(l)={bi(l)}維度相同的向量,初始值也為0,ΔW(l,i)和Δb(l,i)分別表示對第i個訓練樣本計算出的ΔW(l)和b(l)

S1.3.2.3、更新網(wǎng)絡的連接權重W(l)和偏移量b(l)

<mrow><msup><mi>W</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup><mo>=</mo><msup><mi>W</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup><mo>-</mo><mi>&alpha;</mi><mo>&lsqb;</mo><mrow><mo>(</mo><mfrac><mn>1</mn><mi>n</mi></mfrac><msup><mi>&Delta;W</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><mo>+</mo><msup><mi>&lambda;W</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup><mo>&rsqb;</mo><mo>,</mo></mrow>

<mrow><msup><mi>b</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup><mo>=</mo><msup><mi>b</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup><mo>-</mo><mi>&alpha;</mi><mo>&lsqb;</mo><mrow><mo>(</mo><mfrac><mn>1</mn><mi>n</mi></mfrac><msup><mi>&Delta;b</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><mo>&rsqb;</mo><mo>,</mo></mrow>

其中α為學習速率,設置為0.01,λ為平衡因子,設為0.08。

下載完整專利技術內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經(jīng)華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710101550.6/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 美国三级日本三级久久99| 91精品一二区| 亚洲四区在线| 欧美亚洲国产日韩| 天天射欧美| 欧美一级片一区| 欧美一区二区三区黄| 国产精品9区| 国产免费第一区| 国产一区免费播放| 性夜影院在线观看| 国产精品高潮在线| 午夜电影院理论片做爰| 91香蕉一区二区三区在线观看| 日本午夜影视| 亚洲二区在线播放视频| 一色桃子av| 国产女性无套免费看网站 | 精品国产品香蕉在线| 国产一区二区三区网站| 91精品一区二区在线观看| 国产精品国外精品| 国产在线观看二区| 亚洲乱玛2021| 91看片片| 午夜免费av电影| 国产伦理精品一区二区三区观看体验| xxxxhd欧美| 秋霞av电影网| 性欧美一区二区| 精品美女一区二区三区| 亚洲国产精品一区二区久久,亚洲午夜 | bbbbb女女女女女bbbbb国产| 香港三日三级少妇三级99| 欧美日韩精品在线一区二区| 亚洲自拍偷拍中文字幕| 99久精品视频| 日韩精品一区二区免费| 91精品久久久久久综合五月天 | 日本一二三区电影| 亚洲精品无吗| 亚洲精品日韩在线| a级片一区| 国产欧美一区二区在线| 999久久久国产| 精品国产乱码久久久久久a丨| 国产在线一区观看| 在线视频国产一区二区| 亚洲国产精品区| 欧美一区二区色| 日韩av一二三四区| 国产麻豆精品久久| 久久伊人色综合| 国产精彩视频一区二区| av午夜在线观看| 免费看片一区二区三区| 91久久国产露脸精品国产| 精品免费久久久久久久苍| 亚洲午夜国产一区99re久久| 精品久久久综合| 国产区91| 999亚洲国产精| 国产目拍亚洲精品区一区| 欧美一区二区三区艳史| 躁躁躁日日躁网站| 久久噜噜少妇网站| 韩国视频一区二区| 亚洲一区二区国产精品| 国产精品一区在线观看你懂的| 国产激情视频一区二区| 精品久久久久久久免费看女人毛片| 中文在线√天堂| 久久久人成影片免费观看| 欧美一区二区色| 制服丝袜视频一区| 特高潮videossexhd| 国产一区二区在线免费| 一区二区欧美视频| 91麻豆精品国产91久久久无限制版| 国产精品电影一区二区三区| 久久综合二区| 国产视频一区二区三区四区| 国产中文字幕91| 91国产一区二区| 亚洲区日韩| 艳妇荡乳欲伦2| 91久久精品久久国产性色也91| 国产日产精品一区二区| 欧美激情片一区二区| 色吊丝av中文字幕| 性刺激久久久久久久久九色| 欧美午夜羞羞羞免费视频app| 国产真裸无庶纶乱视频| 国产性猛交xx乱| 国产精品午夜一区二区三区视频| 亚洲精品日韩色噜噜久久五月| 国产精品一区不卡| 亚洲精品久久久久www| 浪潮av网站| 日本五十熟hd丰满| free性欧美hd另类丰满 | 久久精品—区二区三区| 在线精品国产一区二区三区| 国产日韩欧美中文字幕| 艳妇荡乳欲伦2| 日韩av电影手机在线观看| 91精品久久天干天天天按摩| 亚洲精品456| 狠狠色噜噜狠狠狠狠2021免费| 亚洲国产精品日韩av不卡在线| 久久一区二区三区欧美| 国产三级国产精品国产专区50| 日韩欧美一区精品| 午夜电影院理论片做爰| 国产suv精品一区二区4| 欧美激情在线免费| 欧美极品少妇videossex| 久久精品一二三| 国产在线一二区| 伊人久久婷婷色综合98网| 一级女性全黄久久生活片免费| 国产综合久久精品| 91亚洲精品国偷拍| bbbbb女女女女女bbbbb国产| 国产91久| 狠狠躁日日躁狂躁夜夜躁av| 中文字幕视频一区二区| 欧美视屏一区| 波多野结衣女教师电影| 日本精品一区视频| 91精品丝袜国产高跟在线| 国产一区二区电影| 91麻豆精品国产91久久久更新资源速度超快 | 性欧美激情日韩精品七区| 日本xxxx护士高潮hd| 国产一级自拍| 538在线一区二区精品国产| 久久精品国产综合| 日韩精品一区二区久久| 欧美亚洲视频一区二区| 午夜无遮挡| 国产精品6699| 偷拍自中文字av在线| 欧美日韩亚洲另类| 99久久精品国| 狠狠色狠狠色综合系列| 精品国产九九九| 久久国产精彩视频| 日韩一区免费| 99国产精品一区二区| 欧洲激情一区二区| 岛国黄色av| 素人av在线| 亚洲视频精品一区| 国产婷婷一区二区三区久久| 国产日韩精品一区二区| 国产福利一区在线观看| 91精品综合| 亚洲欧美国产精品久久| 午夜免费网址| 欧美精品亚洲一区| 国产婷婷一区二区三区久久| 亚洲精品456在线播放| 国产69精品福利视频| 亚洲欧洲一区二区| 欧美hdfree性xxxx| 99re6国产露脸精品视频网站| 亚洲欧美日韩综合在线| 精品国产区| 538国产精品一区二区在线| 色午夜影院| 国产一区二区三区精品在线| 欧美一级久久精品| 中文字幕一区三区| 亚洲欧美色一区二区三区| 国产一区二区精品免费| 精品久久久久久亚洲综合网| 精品国产一区在线| 国产精品1区二区| 午夜av片| 亚洲久久在线| 国产国产精品久久久久| 国产区一区| 91精品一区在线观看| 国产欧美亚洲精品第一区软件| 日本高清二区| 亚洲欧美日韩综合在线| 亚洲国产精品日韩av不卡在线 | 欧美日韩久久一区二区 | 高清欧美精品xxxxx在线看| 日本高清一二区| 国产91白嫩清纯初高中在线| 亚洲精品一区二区三区98年| 精品国产亚洲一区二区三区| 狠狠色狠狠色综合系列| 91看片app| 国产一二区在线| 一色桃子av| 中文字幕一二三四五区| 久久aⅴ国产欧美74aaa| 精品国产一区二区三区国产馆杂枝| 玖玖精品国产| 伊人精品一区二区三区| 99精品久久久久久久婷婷| 国产乱一区二区三区视频| 91精品视频一区二区三区| 国产激情视频一区二区| 精品久久久久久久免费看女人毛片| 亚洲w码欧洲s码免费| 国产一卡在线| 午夜肉伦伦| 午夜免费av电影| 国v精品久久久网| 91香蕉一区二区三区在线观看| 国产精品欧美日韩在线| 91精品婷婷国产综合久久竹菊| 性国产videofree极品| 亚洲精品丝袜| 国产www亚洲а∨天堂| 午夜爽爽视频| 精品久久香蕉国产线看观看gif| 国产精品爽到爆呻吟高潮不挺| 91精品第一页| 日韩三区三区一区区欧69国产 | 亚洲欧美自拍一区| 久久国产欧美一区二区三区免费| 欧美日韩一区二区三区不卡| 国产一区日韩一区| 日韩欧美国产精品一区| 久久夜靖品2区| 国产免费一区二区三区网站免费| 久久久99精品国产一区二区三区| 国产精品久久久久久久新郎| 九九视频69精品视频秋欲浓| 国产精品1区二区| 欧美激情在线观看一区| 一区二区免费播放| 亚洲欧洲日韩在线| 欧美在线播放一区| 99久国产| 国产在线观看二区| 天天干狠狠插| 中文字幕久久精品一区| 国产足控福利视频一区| 国产精品久久亚洲7777| 欧美精品日韩|