[發(fā)明專利]一種用于智能對話系統(tǒng)的敏感詞檢測方法在審
| 申請?zhí)枺?/td> | 201810902046.0 | 申請日: | 2018-08-09 |
| 公開(公告)號: | CN109145082A | 公開(公告)日: | 2019-01-04 |
| 發(fā)明(設(shè)計(jì))人: | 韓衛(wèi)強(qiáng);李云彬;權(quán)圣 | 申請(專利權(quán))人: | 北京中關(guān)村科金技術(shù)有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/332;G06F16/335 |
| 代理公司: | 北京華仲龍騰專利代理事務(wù)所(普通合伙) 11548 | 代理人: | 李靜 |
| 地址: | 100089 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 對話系統(tǒng) 敏感詞 敏感詞檢測 用戶問題 智能 狀態(tài)機(jī)定義 節(jié)點(diǎn)定義 檢測 詞庫 詞尾 查找 敏感 | ||
本發(fā)明公開了一種用于智能對話系統(tǒng)的敏感詞檢測方法,包括以下步驟,(1)將所有敏感詞構(gòu)建成trieTree;(2)trieTree中每個節(jié)點(diǎn)定義了該字是否是一個詞的結(jié)束狀態(tài),0表示是一個詞的結(jié)束狀態(tài),1表示還未達(dá)到詞尾;(3)用有限狀態(tài)機(jī)定義一個用戶問題在trieTree上的查找過程。方法能有效快速的檢測智能對話系統(tǒng)中用戶問題是否存在敏感詞,上完的敏感詞庫也能毫秒級的檢測出敏感詞。
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡(luò)通訊領(lǐng)域,具體是一種用于智能對話系統(tǒng)的敏感詞檢測方法。
背景技術(shù)
在對話系統(tǒng)中,用戶有時候會說一些辱罵,政治等相關(guān)的敏感詞。如不進(jìn)行處理,可能會觸發(fā)相關(guān)的法律法規(guī)的風(fēng)險(xiǎn)。所以有必要將敏感詞檢測引入對話系統(tǒng)中,檢測到相關(guān)敏感詞,做特定的回復(fù)處理。
傳統(tǒng)的敏感詞檢測方法主要使用基于規(guī)則的方法(rule based)、基于有限狀態(tài)機(jī)的方法以及基于機(jī)器學(xué)習(xí)的方法。基于規(guī)則的方法主要通過人工定義大量的正則表達(dá)式,使用正則匹配的方式找到敏感詞,使用基于規(guī)則的方法需要人工定義大量正則表達(dá)式,耗費(fèi)人力較多。并且當(dāng)敏感詞較多是,檢測效率也低下。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種用于智能對話系統(tǒng)的敏感詞檢測方法,以解決上述背景技術(shù)中提出的問題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
一種用于智能對話系統(tǒng)的敏感詞檢測方法,包括以下步驟:
(1)將所有敏感詞構(gòu)建成trieTree;
(2)trieTree中每個節(jié)點(diǎn)定義了該字是否是一個詞的結(jié)束狀態(tài),0表示是一個詞的結(jié)束狀態(tài),1表示還未達(dá)到詞尾;
(3)用有限狀態(tài)機(jī)定義一個用戶問題在trieTree上的查找過程。
作為本發(fā)明進(jìn)一步的方案:有限狀態(tài)機(jī)在trieTree上的查找過程包括:首先定義用戶輸入問題為Q=c1c2...cn,ci為Q中第i個字,trieTree根節(jié)點(diǎn)為ROOT,令root=ROOT.(1)首先i=1,(2)判斷ci是否在root中,如果不在,繼續(xù)判斷下一個字,i=i+1,重新轉(zhuǎn)到(2)開始,如果在則轉(zhuǎn)到(3);(3)如果root狀態(tài)為0,則找到該敏感詞,i=i+1,然后轉(zhuǎn)到(2),繼續(xù)檢測接下來的字符串是否存在敏感詞;否則轉(zhuǎn)到(4);(4)root=root[ci]。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:該方法能有效快速的檢測智能對話系統(tǒng)中用戶問題是否存在敏感詞,上完的敏感詞庫也能毫秒級的檢測出敏感詞。
附圖說明
圖1為智能對話系統(tǒng)的結(jié)構(gòu)示意圖。
圖2為一種用于智能對話系統(tǒng)的敏感詞檢測方法中有限狀態(tài)機(jī)在trieTree上的查找過程示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
請參閱圖,本發(fā)明實(shí)施例中,智能對話系統(tǒng)由系統(tǒng)前端模塊、自然語言理解模塊、對話管理模塊及對話生成模塊組成,系統(tǒng)前端模塊接受用戶輸入,然后自然語言理解模塊理解用戶意圖,并通過其中加入的敏感詞檢測模塊檢測用戶輸入問題中的敏感詞,對話管理根據(jù)自然語言理解輸出結(jié)果是否包含敏感詞決定輸出對話結(jié)果,對話生成模塊根據(jù)對話管理的結(jié)果產(chǎn)生對話答案。
所述的自然語言理解模塊中加入敏感詞檢測模塊,用以檢測用戶輸入的敏感詞,一種用于智能對話系統(tǒng)的敏感詞檢測方法,包括以下步驟:
(1)將所有敏感詞構(gòu)建成trieTree;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京中關(guān)村科金技術(shù)有限公司,未經(jīng)北京中關(guān)村科金技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810902046.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于創(chuàng)建可定制對話系統(tǒng)引擎的平臺
- 用于增強(qiáng)對話系統(tǒng)的插件的在線市場
- 經(jīng)由插件市場增強(qiáng)虛擬助理和對話系統(tǒng)的功能性
- 對話系統(tǒng)中的參數(shù)收集和自動對話生成
- 用于提升對話系統(tǒng)對話性能的方法及裝置
- 任務(wù)對話系統(tǒng)中的對話處理方法及裝置
- 一種知識庫構(gòu)建方法、基于對話的參數(shù)設(shè)置方法及裝置
- 用于創(chuàng)建可定制對話系統(tǒng)引擎的平臺
- 用于增強(qiáng)對話系統(tǒng)的插件的在線市場
- 對話管理系統(tǒng)更新方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì)
- 敏感詞編輯器
- 敏感詞替換方法和裝置
- 一種敏感詞過濾方法
- 一種基于文本內(nèi)容的敏感詞過濾方法
- 一種敏感詞實(shí)時監(jiān)控方法、電子設(shè)備、存儲介質(zhì)及系統(tǒng)
- 一種敏感詞匹配方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)
- 基于矩陣的敏感詞過濾方法、裝置、電子設(shè)備、存儲介質(zhì)
- 文本中的敏感詞的檢索方法、裝置、電子設(shè)備及存儲介質(zhì)
- 基于自設(shè)敏感詞的網(wǎng)頁敏感文本處理方法及系統(tǒng)
- 封停敏感詞預(yù)測方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì)
- 一種網(wǎng)站敏感詞屏蔽系統(tǒng)
- 敏感詞編輯器
- 一種敏感詞檢測方法、裝置、設(shè)備及介質(zhì)
- 敏感詞的檢測方法
- 一種敏感詞匹配方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)
- 敏感詞分?jǐn)?shù)檢測方法、裝置、電子設(shè)備及存儲介質(zhì)
- 敏感詞檢測方法、裝置、終端設(shè)備和計(jì)算機(jī)可讀存儲介質(zhì)
- 敏感詞過濾方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及存儲介質(zhì)
- 一種頁面敏感性檢測方法、裝置、電子設(shè)備和存儲介質(zhì)
- 敏感詞檢測、敏感詞樹構(gòu)建方法及裝置





