[發(fā)明專利]一種語義要素提取方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201910477051.6 | 申請(qǐng)日: | 2019-06-03 |
| 公開(公告)號(hào): | CN110362656A | 公開(公告)日: | 2019-10-22 |
| 發(fā)明(設(shè)計(jì))人: | 杜劍文;李輝權(quán) | 申請(qǐng)(專利權(quán))人: | 廣東幽瀾機(jī)器人科技有限公司 |
| 主分類號(hào): | G06F16/33 | 分類號(hào): | G06F16/33;G06F16/332 |
| 代理公司: | 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 44205 | 代理人: | 謝泳祥 |
| 地址: | 510000 廣東省廣州市天河區(qū)體育西路*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語義要素 知識(shí)庫 會(huì)話消息 應(yīng)答語句 檢索 語音 時(shí)態(tài) 相似度計(jì)算 二次加工 快速檢索 實(shí)時(shí)獲取 文本消息 文字信息 用戶體驗(yàn) 構(gòu)建 語句 抽取 文本 服務(wù) | ||
1.一種語義要素提取方法,其特征在于,所述方法包括以下步驟:
步驟1,機(jī)器人客服接收到來自用戶客戶端的會(huì)話消息數(shù)據(jù);
步驟2,將會(huì)話消息數(shù)據(jù)進(jìn)行分詞與詞性標(biāo)注出為動(dòng)詞的詞性類別;
步驟3,構(gòu)建動(dòng)詞的時(shí)態(tài)相似度計(jì)算模型;
步驟4,通過時(shí)態(tài)相似度計(jì)算模型提取語義要素。
2.根據(jù)權(quán)利要求1所述的一種語義要素提取方法,其特征在于,在步驟1中,所述會(huì)話消息數(shù)據(jù)的形式包括以下至少一種:自然語言文字組成的語句、數(shù)據(jù)鏈接、語音,如果是數(shù)據(jù)鏈接、語音則將數(shù)據(jù)鏈接、語音轉(zhuǎn)換為文本形式的語句作為會(huì)話消息數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的一種語義要素提取方法,其特征在于,在步驟2中,將會(huì)話消息數(shù)據(jù)進(jìn)行分詞的方法包括字符串匹配、機(jī)械分詞、正向最大匹配、逆向最大匹配、雙向最大匹配、統(tǒng)計(jì)分詞、字標(biāo)注分詞任意一種。
4.根據(jù)權(quán)利要求1所述的一種語義要素提取方法,其特征在于,在步驟2中,將會(huì)話消息數(shù)據(jù)進(jìn)行詞性標(biāo)注的方法包括viterbi算法、CLAWS算法、VOLSUNGA算法、或基于轉(zhuǎn)換的詞類標(biāo)注POS中任意一種方法標(biāo)注出名詞、動(dòng)詞、動(dòng)詞、形容詞、動(dòng)名詞中任意組合。
5.根據(jù)權(quán)利要求1所述的一種語義要素提取方法,其特征在于,在步驟3中,構(gòu)建動(dòng)詞的時(shí)態(tài)相似度計(jì)算模型的方法包括以下步驟:
步驟3.1,定義時(shí)態(tài)動(dòng)詞:
根據(jù)動(dòng)詞V定義一個(gè)連續(xù)時(shí)間的時(shí)態(tài)動(dòng)詞,εv:T×Ω→Ω,其中,T和Ω分別代表連續(xù)的時(shí)間和狀態(tài)空間,T×Ω→Ω中三個(gè)元素為連續(xù)的時(shí)間、狀態(tài)以及狀態(tài)進(jìn)化,狀態(tài)進(jìn)化即T時(shí)間后的狀態(tài)變化;
根據(jù)動(dòng)詞V定義一個(gè)離散的時(shí)間的時(shí)態(tài)動(dòng)詞,εν:Z×Ω→Ω,Z為離散的時(shí)間,Z×Ω→Ω中三個(gè)元素為離散的時(shí)間、狀態(tài)以及狀態(tài)進(jìn)化,狀態(tài)進(jìn)化即T時(shí)間后的狀態(tài)變化。
步驟3.2,獲取時(shí)態(tài)動(dòng)詞的相似度:
根據(jù)動(dòng)詞定義時(shí)態(tài)動(dòng)詞的進(jìn)化的函數(shù)為εv(t)=(0,Δ0),對(duì)于隨后的各個(gè)觀察空間中的動(dòng)詞V=(0,Δx),時(shí)態(tài)動(dòng)詞的相似度S(V)為:
Δ0為初始的時(shí)間,Δx為隨后的第x個(gè)動(dòng)詞出現(xiàn)的時(shí)間,x取值范圍為1到p,p為會(huì)話消息數(shù)據(jù)的總量,其中,k>0為常數(shù),k=1;
步驟3.3,構(gòu)建動(dòng)詞的時(shí)態(tài)相似度計(jì)算模型:
對(duì)于觀察空間中有多個(gè)動(dòng)詞的訓(xùn)練集SV={V1,...,Vp},給出其中一個(gè)觀察空間的動(dòng)詞Vx=(x0,x0+x),x0為初始的動(dòng)詞位置,x為變化了第x次后的動(dòng)詞位置的偏移量,找出動(dòng)詞V和訓(xùn)練集SV中每個(gè)元素Vi(Vi∈Sv)的相似度,首先把每個(gè)動(dòng)詞Vi∈Sv表示成含有兩個(gè)采樣點(diǎn)的時(shí)間序列的時(shí)態(tài)動(dòng)詞的進(jìn)化的函數(shù)εVi=(xi0,xi0+Δi0),xi0為初始的時(shí)間,Δi0為變化了的動(dòng)詞出現(xiàn)的時(shí)間,則構(gòu)建Vi和Vx間的動(dòng)詞的時(shí)態(tài)相似度計(jì)算模型為,其中,Sc(εVi,Vx)∈[0,1]為Vi和Vx的相似度;其中,其中,k1>0,k2>0為兩個(gè)常數(shù),例如,k1=1,k2=1,Δi0為初始的時(shí)間,Δx為隨后的第x個(gè)動(dòng)詞出現(xiàn)的時(shí)間。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東幽瀾機(jī)器人科技有限公司,未經(jīng)廣東幽瀾機(jī)器人科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910477051.6/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- XML文檔的語義感知處理
- 語義表達(dá)式生成方法、裝置及設(shè)備
- 一種基于語義要素的低資源文本識(shí)別算法
- 基于語義約束的動(dòng)態(tài)環(huán)境激光SLAM方法
- 檢測(cè)模型訓(xùn)練、高精度地圖更新方法、設(shè)備、介質(zhì)及產(chǎn)品
- 一種基于TSS編碼的態(tài)勢(shì)文本消息語義壓縮編碼方法
- 一種圖片中天空區(qū)域的替換方法和裝置以及設(shè)備
- 語義信息提取方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 事件圖譜管理方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于二維語義地圖的車輛視覺定位方法及系統(tǒng)
- 一種專利文本自動(dòng)分析的系統(tǒng)及方法
- 基于知識(shí)的故障恢復(fù)支持系統(tǒng)
- 一種鐵磁諧振故障知識(shí)庫構(gòu)建方法
- 融合知識(shí)庫處理方法和裝置,以及知識(shí)庫管理系統(tǒng)
- 一種基于病理生理路徑的臨床知識(shí)庫系統(tǒng)
- 一種面向網(wǎng)絡(luò)安全的知識(shí)庫構(gòu)建方法
- 基于多知識(shí)庫推理的數(shù)據(jù)匹配決策方法及系統(tǒng)
- 一種語義知識(shí)庫構(gòu)建方法
- 基于人工智能的知識(shí)庫生成方法和智能機(jī)器人應(yīng)答方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)
- 即時(shí)通信工具中同步離線會(huì)話消息的方法及裝置
- 會(huì)話消息的處理方法和裝置
- 會(huì)話消息列表處理方法、設(shè)備和系統(tǒng)
- 會(huì)話消息處理方法和裝置
- 一種會(huì)話消息的顯示方法及移動(dòng)終端
- 會(huì)話處理方法、裝置和存儲(chǔ)介質(zhì)
- 會(huì)話消息顯示方法、裝置、終端及存儲(chǔ)介質(zhì)
- 一種會(huì)話消息顯示方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 會(huì)話消息的定時(shí)發(fā)送方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種會(huì)話消息顯示方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 用于對(duì)話的方法、裝置和程序及其中存儲(chǔ)程序的存儲(chǔ)介質(zhì)
- 會(huì)話控制裝置
- 會(huì)話控制裝置
- 模擬病人問診對(duì)話方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 應(yīng)答語句的生成方法、裝置、計(jì)算機(jī)可讀介質(zhì)及電子設(shè)備
- 人機(jī)交互方法、裝置、智能機(jī)器人和存儲(chǔ)介質(zhì)
- 一種智能應(yīng)答方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 對(duì)話應(yīng)答方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 對(duì)話生成方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種信息處理方法及裝置





