[發(fā)明專利]一種語義要素提取方法及裝置在審
| 申請?zhí)枺?/td> | 201910477051.6 | 申請日: | 2019-06-03 |
| 公開(公告)號: | CN110362656A | 公開(公告)日: | 2019-10-22 |
| 發(fā)明(設計)人: | 杜劍文;李輝權 | 申請(專利權)人: | 廣東幽瀾機器人科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/332 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 謝泳祥 |
| 地址: | 510000 廣東省廣州市天河區(qū)體育西路*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語義要素 知識庫 會話消息 應答語句 檢索 語音 時態(tài) 相似度計算 二次加工 快速檢索 實時獲取 文本消息 文字信息 用戶體驗 構建 語句 抽取 文本 服務 | ||
本發(fā)明公開了一種語義要素提取方法及裝置,通過實時獲取語音或文字信息構建動詞的時態(tài)相似度計算模型快速、準確的抽取語義要素,通過將該語義要素在知識庫中檢索能夠檢索到正確的應答語句,在音譯文本或者語音質量或者其他情況導致的會話消息數(shù)據(jù)質量較差的情況下,對作為“二次加工”的文本消息或者較差質量的會話消息數(shù)據(jù),能夠準確地提取出語義要素的語句以供在知識庫中快速檢索到準確的應答語句,具有較高的服務質量與用戶體驗。
技術領域
本公開涉及信息處理技術領域,具體涉及一種語義要素提取方法及裝置。
背景技術
智能客服機器人的類型大致分為以文字為介質和以語音智能為介質,以文字為介質的智能客服機器人普遍存在于web網頁端及微信公眾號端;而以語音智能為介質的智能客服機器人,則以音頻流為輸入介質,與機器進行理解交互,在電話終端最為廣泛。針對這兩種交互介質的智能交互,最終都是以標準文本的形式,進行自然語言處理及理解的,而由于“音譯文本”的質量參次,對作為“二次加工”的文本消息的自然語言處理,往往是難以達到較高的服務質量的。目前,現(xiàn)有的智能客服技術通過利用依存分析的開放式中文實體關系抽取語義要素和基于依存分析的中文兼類詞處理,這種“二次加工”的文本消息難以準確的提取出語義要素,并將該語義要素在知識庫中檢索能夠檢索到到正確的應答語句,服務質量均難以提升。
發(fā)明內容
本公開提供一種語義要素提取方法及裝置,通過實時獲取語音或文字信息構建動詞的時態(tài)相似度計算模型快速、準確的抽取語義要素,通過將該語義要素在知識庫中檢索能夠檢索到正確的應答語句。
為了實現(xiàn)上述目的,根據(jù)本公開的一方面,提供一種語義要素提取方法,所述方法包括以下步驟:
步驟1,將樣本中能夠枚舉的關鍵要素枚舉歸納統(tǒng)一的關鍵要素標簽;
步驟2,將樣本中不能枚舉的關鍵要素通過分詞區(qū)分詞性得到關鍵要素標簽;
步驟3,將關鍵要素標簽進行標簽化替換為簡化關鍵要素;
步驟4,將相應的標簽替換后的樣本關聯(lián)到對應的意圖得到意圖表達語句;
步驟5,對意圖表達語句進行分詞處理,將語句的簡化關鍵要素標簽化替換為關鍵要素標簽;
步驟6,進入學習引擎匹配識別獲取用戶意圖;
步驟7,根據(jù)用戶意圖提取關鍵要素標簽的數(shù)據(jù)。
進一步地,在步驟1中,將樣本中能夠枚舉的關鍵要素枚舉歸納統(tǒng)一的關鍵要素標簽的方法為,預先建立的屬性歸納模型是通過對樣本進行歸納總結從而能夠預測關鍵詞所屬屬性的模型,可以包括字典模型、規(guī)則模型和其他模型等,其中字典模型可以包括地址字典模型(地址模型又可細分為省份字典模型和城市字典模型)、品牌字典模型等;規(guī)則模型可以包括身份證號規(guī)則模型、列車號規(guī)則模型等;其他模型可以包括酒店名模型、網吧名模型、餐廳名模型和姓名模型等。假設關鍵詞是:“170cm”、“肥胖”、“北京”,那么通過屬性歸納模型得到的與“170cm”對應的屬性可以是“身高”,與“肥胖”對應的屬性可以是“體型”,與“北京”對應的屬性可以是“地址”和“路徑”。
根據(jù)預先建立的標簽組合與意圖的對應關系,利用獲得的標簽獲取目標意圖。
具體的,意圖是終端支持的查詢意圖,可以是通過人的屬性去查找人、通過事件的屬性去查找人。在查詢場景下,意圖的種類不多,因此可以利用該特點窮舉意圖并生成標簽與意圖的對應關系。
需要說明的是,用戶輸入的信息反映了用戶的意圖,而根據(jù)用戶輸入的信息獲取了關鍵詞,因此根據(jù)獲得的關鍵詞可以獲取用戶的意圖。
步驟104、根據(jù)獲得的關鍵詞和目標意圖生成查詢語句。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東幽瀾機器人科技有限公司,未經廣東幽瀾機器人科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910477051.6/2.html,轉載請聲明來源鉆瓜專利網。





