[發(fā)明專利]一種語用通信方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202210631432.7 | 申請日: | 2022-06-06 |
| 公開(公告)號: | CN115186797B | 公開(公告)日: | 2023-05-30 |
| 發(fā)明(設(shè)計)人: | 郭天昊;孟穎岫;楊禹志;韓兆榮;石嘉;李汶龍;錢宇華 | 申請(專利權(quán))人: | 山西大學(xué) |
| 主分類號: | G06N3/045 | 分類號: | G06N3/045;G06N3/042;G06N3/084;G06N3/063;H04L9/40 |
| 代理公司: | 北京市廣友專利事務(wù)所有限責(zé)任公司 11237 | 代理人: | 張仲波 |
| 地址: | 030091*** | 國省代碼: | 山西;14 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 通信 方法 系統(tǒng) | ||
1.一種語用通信方法,其特征在于,所述方法由語用通信系統(tǒng)實(shí)現(xiàn),所述系統(tǒng)包括訓(xùn)練好的發(fā)送方智能體以及訓(xùn)練好的接收方智能體;所述方法包括:
S1、所述訓(xùn)練好的發(fā)送方智能體根據(jù)語用意圖,得到待傳輸?shù)南ⅲ⑺龃齻鬏數(shù)南⑼ㄟ^神經(jīng)網(wǎng)絡(luò)輸出層傳輸?shù)剿鲇?xùn)練好的接收方智能體;
S2、所述訓(xùn)練好的接收方智能體通過神經(jīng)網(wǎng)絡(luò)輸入層接收所述待傳輸?shù)南ⅲλ龃齻鬏數(shù)南⑦M(jìn)行譯碼,得到譯碼后的消息;
S3、所述訓(xùn)練好的接收方智能體通過神經(jīng)網(wǎng)絡(luò)模型的全連接的權(quán)重矩陣接收所述譯碼后的消息并理解所述消息的意圖,結(jié)合所述訓(xùn)練好的接收方智能體自身信息,做出行為決策;
所述發(fā)送方智能體以及接收方智能體的訓(xùn)練過程包括:
S11、發(fā)送方智能體根據(jù)語用意圖產(chǎn)生神經(jīng)沖動,所述神經(jīng)沖動經(jīng)過神經(jīng)網(wǎng)絡(luò)輸出層輸出,產(chǎn)生待傳遞的消息;
S12、所述待傳遞的消息通過全連接的權(quán)重矩陣傳輸?shù)讲盍客ㄐ畔到y(tǒng)中,所述差量通信系統(tǒng)將所述待傳遞的消息發(fā)送到信道中;
S13、所述接收方智能體通過所述信道接收所述消息,并對所述消息進(jìn)行譯碼,得到譯碼后的消息;
S14、所述譯碼后的消息通過全連接的權(quán)重矩陣發(fā)送到接收方智能體的輸入層;
S15、接收方智能體根據(jù)所述譯碼后的消息以及自身信息,做出環(huán)境動作,獲得獎勵,產(chǎn)生誤差以及損失函數(shù),所述誤差經(jīng)信道反向傳播到所述發(fā)送方智能體;其中,所述損失函數(shù)為消息對接收方智能體行為的影響;
S16、根據(jù)所述誤差對所述發(fā)送方智能體進(jìn)行調(diào)整;
S17、重復(fù)上述S11-S16,直到所述誤差小于或等于預(yù)設(shè)閾值,則結(jié)束調(diào)整,得到訓(xùn)練好的發(fā)送方智能體以及接收方智能體。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述S12中的所述差量通信系統(tǒng)將所述待傳遞的消息發(fā)送到信道中包括:
在所述發(fā)送方智能體以及接收方智能體的訓(xùn)練過程中,所述差量通信系統(tǒng)將所述待傳遞的消息形成可求導(dǎo)的浮點(diǎn)型消息,將所述浮點(diǎn)型消息訓(xùn)練為0和1發(fā)送到信道中。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述S12中的所述差量通信系統(tǒng)將所述待傳遞的消息發(fā)送到信道中包括:
在訓(xùn)練好的發(fā)送方智能體以及接收方智能體消息傳遞中,所述差量通信系統(tǒng)將所述待傳遞的消息形成比特數(shù)據(jù),發(fā)送到信道中。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述待傳輸?shù)南⑼ㄟ^神經(jīng)網(wǎng)絡(luò)輸出層傳輸?shù)剿鲇?xùn)練好的接收方智能體包括:
待傳輸?shù)南⒔?jīng)發(fā)送方智能體神經(jīng)網(wǎng)絡(luò)輸出層的最后一層傳輸?shù)剿鲇?xùn)練好的接收方智能體神經(jīng)網(wǎng)絡(luò)輸入層的第一層。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括根據(jù)對環(huán)境信息的觀測以及結(jié)合語義消息和對過去行為的記憶,更新所述發(fā)送方智能體以及接收方智能體的信息庫,得到最佳的行為決策。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述S1中的待傳輸?shù)南⒌拇笮∮上⑺璧恼Z義狀態(tài)數(shù)量和時間維度的關(guān)系確定。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述訓(xùn)練好的發(fā)送方智能體的輸出層包括通信模塊以及行為模塊;
其中,所述通信模塊通過神經(jīng)網(wǎng)絡(luò)輸出層發(fā)送神經(jīng)沖動;
所述行為模塊用于做出行為決策。
8.一種語用通信系統(tǒng),其特征在于,所述系統(tǒng)用于實(shí)現(xiàn)語用通信方法,所述系統(tǒng)包括訓(xùn)練好的發(fā)送方智能體以及訓(xùn)練好的接收方智能體;其中:
所述訓(xùn)練好的發(fā)送方智能體,用于根據(jù)語用意圖,得到待傳輸?shù)南ⅲ⑺龃齻鬏數(shù)南⑼ㄟ^神經(jīng)網(wǎng)絡(luò)輸出層傳輸?shù)剿鲇?xùn)練好的接收方智能體;
所述訓(xùn)練好的接收方智能體,用于通過神經(jīng)網(wǎng)絡(luò)輸入層接收所述待傳輸?shù)南ⅲλ龃齻鬏數(shù)南⑦M(jìn)行譯碼,得到譯碼后的消息;所述訓(xùn)練好的接收方智能體通過神經(jīng)網(wǎng)絡(luò)模型的全連接的權(quán)重矩陣接收所述譯碼后的消息并理解所述消息的意圖,結(jié)合所述訓(xùn)練好的接收方智能體自身信息,做出行為決策;
所述發(fā)送方智能體以及接收方智能體的訓(xùn)練過程包括:
S11、發(fā)送方智能體根據(jù)語用意圖產(chǎn)生神經(jīng)沖動,所述神經(jīng)沖動經(jīng)過神經(jīng)網(wǎng)絡(luò)輸出層輸出,產(chǎn)生待傳遞的消息;
S12、所述待傳遞的消息通過全連接的權(quán)重矩陣傳輸?shù)讲盍客ㄐ畔到y(tǒng)中,所述差量通信系統(tǒng)將所述待傳遞的消息發(fā)送到信道中;
S13、所述接收方智能體通過所述信道接收所述消息,并對所述消息進(jìn)行譯碼,得到譯碼后的消息;
S14、所述譯碼后的消息通過全連接的權(quán)重矩陣發(fā)送到接收方智能體的輸入層;
S15、接收方智能體根據(jù)所述譯碼后的消息以及自身信息,做出環(huán)境動作,獲得獎勵,產(chǎn)生誤差以及損失函數(shù),所述誤差經(jīng)信道反向傳播到所述發(fā)送方智能體;其中,所述損失函數(shù)為消息對接收方智能體行為的影響;
S16、根據(jù)所述誤差對所述發(fā)送方智能體進(jìn)行調(diào)整;
S17、重復(fù)上述S11-S16,直到所述誤差小于或等于預(yù)設(shè)閾值,則結(jié)束調(diào)整,得到訓(xùn)練好的發(fā)送方智能體以及接收方智能體。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山西大學(xué),未經(jīng)山西大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210631432.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 通信裝置、通信系統(tǒng)、通信方法、通信程序、通信電路
- 通信設(shè)備、通信系統(tǒng)、通信方法、通信程序、通信電路
- 通信設(shè)備、通信系統(tǒng)、通信方法、通信程序、通信電路
- 通信設(shè)備、通信系統(tǒng)、通信方法、通信程序、通信電路
- 通信設(shè)備、通信方法、通信電路、通信系統(tǒng)
- 通信設(shè)備、通信系統(tǒng)、通信方法、通信程序、通信電路
- 通信終端、通信系統(tǒng)、通信方法以及通信程序
- 通信終端、通信方法、通信裝備和通信系統(tǒng)
- 通信裝置、通信程序、通信方法以及通信系統(tǒng)
- 通信裝置、通信系統(tǒng)、通信方法及計算機(jī)可讀取的記錄介質(zhì)





