[發(fā)明專利]一種基于語(yǔ)音語(yǔ)義內(nèi)容分析的防電信電話詐騙方法和系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201310094237.6 | 申請(qǐng)日: | 2013-03-22 |
| 公開(kāi)(公告)號(hào): | CN103179122A | 公開(kāi)(公告)日: | 2013-06-26 |
| 發(fā)明(設(shè)計(jì))人: | 馬博 | 申請(qǐng)(專利權(quán))人: | 馬博 |
| 主分類號(hào): | H04L29/06 | 分類號(hào): | H04L29/06;H04W12/12;G06F17/30 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 750001 寧*** | 國(guó)省代碼: | 寧夏;64 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 語(yǔ)音 語(yǔ)義 內(nèi)容 分析 電信 電話 詐騙 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于語(yǔ)音語(yǔ)義內(nèi)容分析的防電信電話詐騙方法和系統(tǒng),具體涉及基于電話語(yǔ)音語(yǔ)義內(nèi)容識(shí)別判定詐騙或不良內(nèi)容的方法及系統(tǒng)。
背景技術(shù)
美國(guó)的卡耐基梅隆大學(xué)在二十世紀(jì)八十年代制作的S?P?H?I?N?X系統(tǒng)率先實(shí)現(xiàn)了語(yǔ)音識(shí)別中非特定人、連續(xù)語(yǔ)音、大詞匯量的識(shí)別技術(shù)。隨后美國(guó)的IBM?公司的Tangora5000,能夠在其識(shí)別系統(tǒng)的詞選識(shí)別率達(dá)到了97%,同時(shí)其公司的?Via?Voice和Microsoft微軟公司的Speech?SDK?等產(chǎn)品都實(shí)現(xiàn)了中文語(yǔ)音識(shí)別,并且同時(shí)提供中文語(yǔ)音識(shí)別的開(kāi)發(fā)包。同時(shí)在德國(guó)、法國(guó)等歐洲國(guó)家,也建造了許多很有特色的連續(xù)語(yǔ)音識(shí)別系統(tǒng)。????
而在國(guó)內(nèi),中文的語(yǔ)音識(shí)別取得很大的進(jìn)展。國(guó)家“863”計(jì)劃把大詞匯量語(yǔ)音識(shí)別的研究列入其計(jì)劃之內(nèi)。有突出代表的安徽科大訊飛公司在語(yǔ)音識(shí)別方面擁有40多項(xiàng)發(fā)明專利。
具體來(lái)講,在語(yǔ)義解析上,中國(guó)各大高校研究所在研究發(fā)明上都有所建樹(shù),現(xiàn)有的語(yǔ)音和語(yǔ)義解析結(jié)合的公司如蟲(chóng)洞、科大訊飛、搜狗搜索、小i機(jī)器人、神州圖驥等公司的產(chǎn)品。現(xiàn)在主要的語(yǔ)義識(shí)別產(chǎn)品使用的方法大致有三類,有基于傾向向量空間模型表示算法,有利用文本的語(yǔ)法,有語(yǔ)義、語(yǔ)用相結(jié)合的SOVR算法進(jìn)行語(yǔ)句解析的,有通過(guò)SVM支持向量機(jī)和決策樹(shù)算法的中文語(yǔ)法解析的算法。但現(xiàn)在并沒(méi)有把語(yǔ)音語(yǔ)義,云計(jì)算和通信技術(shù)相結(jié)合的防電信欺騙產(chǎn)品問(wèn)世。
在防電信詐騙領(lǐng)域中,只有幾家公司擁有類似專利,這些專利只是單純利用交換機(jī)信令消息或者追溯電話短信來(lái)源的方式對(duì)電信詐騙進(jìn)行防范,并沒(méi)有使用語(yǔ)音語(yǔ)義對(duì)通話內(nèi)容解析,只是單純的對(duì)通話源是否大量呼叫進(jìn)行判斷,也不能自動(dòng)在通話中進(jìn)行防范檢測(cè),并且無(wú)法對(duì)沒(méi)有加入黑名單的詐騙電話準(zhǔn)確檢測(cè),容易產(chǎn)生誤判。
本專利的防電信電話詐騙系統(tǒng)則是把網(wǎng)絡(luò)通信,中文語(yǔ)音解析和語(yǔ)義解析等技術(shù)綜合,從內(nèi)容上切實(shí)分析和防范電信電話詐騙,其檢測(cè)的速度,時(shí)效性和準(zhǔn)確度都較其他方法高。
發(fā)明內(nèi)容
本專利提出的方法擬解決的問(wèn)題,主要是對(duì)識(shí)別到的語(yǔ)音進(jìn)行分析識(shí)別,同時(shí)對(duì)解析到的語(yǔ)句進(jìn)行語(yǔ)句意思的識(shí)別,最后通過(guò)云計(jì)算平臺(tái)和數(shù)據(jù)挖掘技術(shù)進(jìn)行查找匹配并判定是否為詐騙行為從而實(shí)現(xiàn)對(duì)電話詐騙進(jìn)行識(shí)別。
(1)電話輸入的語(yǔ)音輸入到通話語(yǔ)音輸入模塊,這個(gè)模塊負(fù)責(zé)處理收到的通話語(yǔ)音并通過(guò)TCP/IP方式連接語(yǔ)音處理模塊并把語(yǔ)音輸入到后者。
(2)語(yǔ)音處理模塊,主要是進(jìn)行語(yǔ)音片段分割和對(duì)應(yīng)字符匹配的預(yù)處理,該模塊包括形式轉(zhuǎn)換子模塊,聲學(xué)子模塊,語(yǔ)音語(yǔ)法子模塊和預(yù)處理引擎子模塊。其中形式轉(zhuǎn)換子模塊負(fù)責(zé)對(duì)語(yǔ)音進(jìn)行編碼轉(zhuǎn)換。聲學(xué)子模塊和語(yǔ)音語(yǔ)法子模塊負(fù)責(zé)通過(guò)聲學(xué)檢索算法對(duì)聲音進(jìn)行特征匹配,預(yù)處理引擎子模塊負(fù)責(zé)對(duì)匹配到的候選詞通過(guò)本地?cái)?shù)據(jù)導(dǎo)入方式輸入到搜索軌跡中以便進(jìn)行下一步的語(yǔ)義匹配處理。
(3)在搜索軌跡模塊中,把語(yǔ)音處理模塊輸出的匹配結(jié)果備詞進(jìn)行語(yǔ)義解析并且對(duì)詞義進(jìn)行搜索匹配,之后通過(guò)本地?cái)?shù)據(jù)導(dǎo)入方式輸入到語(yǔ)義處理搜索模塊。
(4)語(yǔ)義處理搜索模塊包括聲音段組合子模塊,關(guān)鍵字解析子模塊,和搜索引擎子模塊。其中搜索引擎子模塊把搜索軌跡模塊輸出的數(shù)據(jù)經(jīng)過(guò)組合形成正確的詞或者句子,然后通過(guò)關(guān)鍵字解析子模塊識(shí)別并找出的語(yǔ)句中的敏感詞區(qū)域方便隨后的云處理模塊處理,隨后聲音段組合子模塊負(fù)責(zé)處理檢查找到的敏感詞對(duì)應(yīng)的聲音片段是否和庫(kù)中的聲音樣本組合的片段類似,最后通過(guò)TCP/IP網(wǎng)絡(luò)輸出到云處理模塊進(jìn)行外部處理。
(5)云處理模塊包括語(yǔ)義匹配處理子模塊,業(yè)務(wù)處理引擎子模塊,聲學(xué)數(shù)據(jù)庫(kù)子模塊,外部數(shù)據(jù)庫(kù)匹配子模塊,告警預(yù)處理子模塊和事件備份子模塊。語(yǔ)義匹配處理子模塊把語(yǔ)義處理搜索模塊輸出的信息進(jìn)行語(yǔ)義查找,隨后業(yè)務(wù)處理引擎子模塊對(duì)找到的敏感關(guān)鍵字或者關(guān)鍵句進(jìn)一步識(shí)別出意思,并且識(shí)別到關(guān)鍵字符或數(shù)字輸入到外部匹配子模塊進(jìn)行查找,告警預(yù)處理子模塊和事件備份子模塊負(fù)責(zé)對(duì)用戶,外部系統(tǒng)產(chǎn)生報(bào)警并且記錄事件日志。
附圖說(shuō)明
圖1:防電信電話詐騙處理模塊概要圖。
圖2:語(yǔ)音語(yǔ)義識(shí)別及告警處理流程圖。
具體實(shí)施方式
本專利提出的方法擬解決的問(wèn)題,主要是對(duì)識(shí)別到的語(yǔ)音進(jìn)行分析識(shí)別,同時(shí)對(duì)解析到的語(yǔ)句進(jìn)行語(yǔ)句意思的識(shí)別,最后通過(guò)云計(jì)算平臺(tái)和數(shù)據(jù)挖掘技術(shù)進(jìn)行查找匹配并判定是否為詐騙行為從而實(shí)現(xiàn)對(duì)電話詐騙進(jìn)行識(shí)別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于馬博,未經(jīng)馬博許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310094237.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 面向語(yǔ)義Web服務(wù)程序設(shè)計(jì)的語(yǔ)義數(shù)據(jù)表示和處理方法
- 一種基于語(yǔ)義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語(yǔ)義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語(yǔ)義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語(yǔ)義匹配方法和系統(tǒng)
- 遠(yuǎn)程語(yǔ)義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語(yǔ)義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語(yǔ)義表征和語(yǔ)義計(jì)算的信號(hào)語(yǔ)義識(shí)別方法
- 語(yǔ)義分類方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務(wù)系統(tǒng)、內(nèi)容服務(wù)器、內(nèi)容終端及內(nèi)容服務(wù)方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法





