[發明專利]一種識別信息的方法和設備在審
| 申請號: | 201710703355.0 | 申請日: | 2017-08-16 |
| 公開(公告)號: | CN107506350A | 公開(公告)日: | 2017-12-22 |
| 發明(設計)人: | 王翔 | 申請(專利權)人: | 京東方科技集團股份有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30;G06N3/04 |
| 代理公司: | 北京同達信恒知識產權代理有限公司11291 | 代理人: | 郭潤湘 |
| 地址: | 100015 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 信息 方法 設備 | ||
技術領域
本發明涉及計算機技術處理領域,尤其涉及一種識別信息的方法和設備。
背景技術
句意識別又稱為問答句意識別,其主要是對用戶給出的句子(一般為問句)進行分析、判斷,最終確定用戶意圖。句意識別是回答用戶問題的前提,其主要應用在客服機器人、問答系統和人機交換系統等。
例如在客服機器人工作系統中,當用戶發送自己的問題到系統,客服機器人會對所發送語句進行分析、判斷,確定所問句子的意思,進而來確定用戶的意圖,最終客服機器人會給出一系列其認為正確的答案。
現有的句意識別方法主要是對待識別句子通過字符匹配法、理解法、統計法等分詞技術進行分詞,然后基于詞級別進行句意特征的提取。但是以上通用的分詞方法會對待識別句子中的某些詞容易產生歧義,無法達到較好的分詞準確率,進而導致句意識別的準確率不高。
綜上所述,現有的句意識別技術會導致句子中的某些詞容易產生歧義至而使句意識別的準確率較低。
發明內容
本發明實施例提供了一種識別信息的方法和設備,用以解決現有存在的句意識別技術會導致句子中的某些詞容易產生歧義至而使句意識別的準確率較低的問題。
本發明實施例提供一種識別信息的方法,該方法包括:
針對任意一個信息,確定該信息的字向量矩陣;
針對卷積神經網絡的任意一個卷積核的寬度,分別將所述寬度對應的每個卷積核與所述信息的字向量矩陣進行卷積,得到每個卷積核對應的卷積向量,并對每個所述卷積向量進行最大池化操作得到所述寬度對應的識別特征;
將每個寬度對應的識別特征進行組合得到所述信息的識別特征;
根據不同信息的識別特征的相似度進行信息識別。
本發明實施例提供一種識別信息的設備,該設備包括:
至少一個處理單元、以及至少一個存儲單元,其中,所述存儲單元存儲有程序代碼,當所述程序代碼被所述處理單元執行時,使得所述處理單元執行下列過程:
針對任意一個信息,確定該信息的字向量矩陣;
針對卷積神經網絡的任意一個卷積核的寬度,分別將所述寬度對應的每個卷積核與所述信息的字向量矩陣進行卷積,得到每個卷積核對應的卷積向量,并對每個所述卷積向量進行最大池化操作得到所述寬度對應的識別特征;
將每個寬度對應的識別特征進行組合得到所述信息的識別特征;
根據不同信息的識別特征的相似度進行信息識別。
本發明實施例提供另一種識別信息的設備,該設備包括:
矩陣確定模塊,用于針對任意一個信息,來確定信息的字向量矩陣;
卷積操作模塊,用于針對卷積神經網絡的任意一個卷積核的寬度,分別將所述寬度對應的每個卷積核與所述信息的字向量矩陣進行卷積,得到每個卷積核對應的卷積向量,并對每個所述卷積向量進行最大池化操作得到所述寬度對應的識別特征;
組合特征模塊,用于將每個寬度對應的識別特征進行組合得到所述信息的識別特征;
處理模塊,用于不同信息的識別特征的相似度進行信息識別。
本發明實施例通過卷積神經網絡的卷積核的多個寬度對應的卷積核與信息的字向量矩陣進行卷積,對得到每個卷積核對應的卷積向量進行最大池化操作得到所述寬度對應的識別特征,將每個寬度對應的識別特征進行組合得到所述信息的識別特征;根據不同信息的識別特征的相似度進行信息識別。由于本發明實施例分別根據卷積核的多個寬度對應的卷積核與信息的字向量矩陣進行卷積,并將得到的每個寬度對應的識別特征進行組合,可以有效地提取不同長度的句子關鍵詞(即識別特征),并將多個識別特征相互組合進行句意識別,從而降低了由于句子中容易產生歧義的詞對句意識別的影響,提高了句意識別的準確率。
附圖說明
為了更清楚地說明本發明實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡要介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域的普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發明實施例識別信息的方法流程示意圖;
圖2為本發明實施例確定信息的識別特征流程示意圖;
圖3為本發明實施例第一種識別信息的設備結構示意圖;
圖4為本發明實施例第二種識別信息的設備結構示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東方科技集團股份有限公司,未經京東方科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710703355.0/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





