[發明專利]一種基于社交關系圖譜的垃圾語音識別方法和系統有效
| 申請號: | 201710163581.4 | 申請日: | 2017-03-20 |
| 公開(公告)號: | CN106936997B | 公開(公告)日: | 2019-07-23 |
| 發明(設計)人: | 莫益軍;徐飛;劉謙 | 申請(專利權)人: | 華中科技大學鄂州工業技術研究院 |
| 主分類號: | H04M1/725 | 分類號: | H04M1/725;G06Q50/00 |
| 代理公司: | 武漢臻誠專利代理事務所(普通合伙) 42233 | 代理人: | 宋業斌 |
| 地址: | 436044 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 社交 關系 圖譜 垃圾 語音 識別 方法 系統 | ||
1.一種基于社交關系圖譜的垃圾語音識別方法,其特征在于,包括以下步驟:
(1)為用戶建立垃圾語音庫,提取用戶的歷史通話記錄,基于該歷史通話記錄構建用戶的社交關系圖譜;
(2)判斷用戶新接入的主叫號碼是否處于垃圾語音庫中,如果處于該垃圾語音庫,則轉入步驟(8),否則轉入步驟(3);
(3)根據建立的社交關系圖譜判斷用戶新接入的該主叫號碼是否能通過中間節點與被叫號碼連接起來,如果能夠,則轉入步驟(6),否則轉入步驟(4);
(4)根據建立的社交關系圖譜計算用戶新接入的該主叫號碼的全局信任度,其中全局信任度是指整個社交網絡圖譜中其他用戶對當前用戶的整體信任評價;
(5)判斷步驟(4)得到的該主叫號碼的全局信任度是否大于全局信任度閾值T,如果大于全局信任度閾值,則表示該主叫號碼不是垃圾語音發起號碼,然后過程結束,反之則表示該主叫號碼是垃圾語音發起號碼,然后轉入步驟(8);
(6)使用信任度量算法獲取被叫號碼的用戶對主叫號碼用戶的局部信任度;
(7)判斷步驟(6)得到的被叫號碼對主叫號碼的局部信任度是否大于局部信任度閾值,如果大于閾值,則判定主叫號碼不是垃圾語音發起號碼,然后過程結束,否則判定主叫號碼為垃圾語音發起號碼,然后轉入步驟(8);
(8)被叫號碼用戶判斷是否接聽該垃圾語音發起號碼,并將垃圾語音發起號碼添加到垃圾語音庫中。
2.根據權利要求1所述的垃圾語音識別方法,其特征在于,提取的歷史通話記錄是用戶1星期到1個月之間的歷史通話記錄,提取的關鍵信息包括主叫號碼、被叫號碼、撥號時間、通話時長、是否接聽。
3.根據權利要求1所述的垃圾語音識別方法,其特征在于,步驟(1)包括以下子步驟:
(1-1)建立垃圾語音庫,并初始化該垃圾語音庫,使該垃圾語音庫中的語音號碼為空;
(1-2)從用戶的歷史通話記錄中提取關鍵信息;
(1-3)基于提取的關鍵信息建立用戶的社交關系圖譜,該社交關系圖譜包括彼此間存在通話記錄的所有用戶所構成的節點集合、節點彼此之間存在通話關系所構成的邊、以及每個邊的權重;
(1-4)根據建立的社交關系圖譜計算直接相連的兩個節點i對j的信任度。
4.根據權利要求3所述的垃圾語音識別方法,其特征在于,步驟(1-4)的計算過程是通過以下公式:
其中ti,j表示節點i對與其相連的結點j的信任度,ni,j表示用戶j主動向用戶i撥打電話的次數,ci,j表示用戶i接聽來自用戶j的電話、且通話時長超過閾值的次數。
5.根據權利要求4所述的垃圾語音識別方法,其特征在于,步驟(4)的計算過程是使用以下公式:
其中Sj為用戶j的全局信任度,n為社交關系圖譜中所有節點的數量,a是0到1之間的數,Fu為結點j所直接連接的節點的數量,表示節點j直接連接的節點uk對節點j的信任度,且k為1到n的整數。
6.根據權利要求5所述的垃圾語音識別方法,其特征在于,步驟(6)中使用的信任度量算法是TidalTrust算法,且采用以下公式獲取局部信任度:
其中ti,k表示被叫號碼用戶i對主叫號碼k的局部信任度,adj(i)表示社交關系圖譜中用戶i相鄰的所有節點中用戶i對其信任度大于閾值的節點集合。
7.一種基于社交關系圖譜的垃圾語音識別系統,其特征在于,包括:
第一模塊,用于為用戶建立垃圾語音庫,提取用戶的歷史通話記錄,基于該歷史通話記錄構建用戶的社交關系圖譜;
第二模塊,用于判斷用戶新接入的主叫號碼是否處于垃圾語音庫中,如果處于該垃圾語音庫,則轉入第八模塊,否則轉入第三模塊;
第三模塊,用于根據建立的社交關系圖譜判斷用戶新接入的該主叫號碼是否能通過中間節點與被叫號碼連接起來,如果能夠,則轉入第六模塊,否則轉入第四模塊;
第四模塊,用于根據建立的社交關系圖譜計算用戶新接入的該主叫號碼的全局信任度,其中全局信任度是指整個社交網絡圖譜中其他用戶對當前用戶的整體信任評價;
第五模塊,用于判斷第四模塊得到的該主叫號碼的全局信任度是否大于全局信任度閾值T,如果大于全局信任度閾值,則表示該主叫號碼不是垃圾語音發起號碼,然后過程結束,反之則表示該主叫號碼是垃圾語音發起號碼,然后轉入第八模塊;
第六模塊,用于使用信任度量算法獲取被叫號碼的用戶對主叫號碼用戶的局部信任度;
第七模塊,用于判斷第六模塊得到的被叫號碼對主叫號碼的局部信任度是否大于局部信任度閾值,如果大于閾值,則判定主叫號碼不是垃圾語音發起號碼,然后過程結束,否則判定主叫號碼為垃圾語音發起號碼,然后轉入步驟第八模塊;
第八模塊,用于被叫號碼用戶判斷是否接聽該垃圾語音發起號碼,并將垃圾語音發起號碼添加到垃圾語音庫中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學鄂州工業技術研究院,未經華中科技大學鄂州工業技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710163581.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種防纏繞的錄音防卡型手機耳機
- 下一篇:一種照明和無線播放的兩用音柱





