[發(fā)明專利]語義分析方法、裝置、電子設備及計算機可讀存儲介質在審

申請?zhí)枺?/td>	201711230879.9	申請日：	2017-11-29
公開（公告）號：	CN107885879A	公開（公告）日：	2018-04-06
發(fā)明（設計）人：	李澤中	申請（專利權）人：	北京小度信息科技有限公司
主分類號：	G06F17/30	分類號：	G06F17/30;G06F17/27
代理公司：	北京智信四方知識產權代理有限公司11519	代理人：	劉真
地址：	100085 北京市海淀區(qū)***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語義分析方法裝置電子設備計算機可讀存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本公開涉及信息處理技術領域，具體涉及一種語義分析方法、裝置、電子設備及計算機可讀存儲介質。

背景技術

隨著互聯(lián)網技術的發(fā)展，越來越多的商家或者服務提供商通過互聯(lián)網平臺來為用戶提供服務，并力求提高服務質量，增強用戶體驗，爭取更多的用戶訂單，以提升現(xiàn)有資源的利用率，為商家或者服務提供商創(chuàng)造更多的價值。但目前用戶在使用商家或者服務提供商提供的檢索服務時，檢索結果命中率并不能滿足用戶的要求，從而削弱了用戶體驗。

發(fā)明內容

本公開實施例提供一種語義分析方法、裝置、電子設備及計算機可讀存儲介質。

第一方面，本公開實施例中提供了一種語義分析方法。

具體的，所述語義分析方法，包括：

獲取候選詞語集；

計算所述候選詞語集中詞語為預設詞語的概率值；

將所述概率值符合預設條件的詞語確認為目標詞語。

結合第一方面，本公開在第一方面的第一種實現(xiàn)方式中，所述獲取候選詞語集，包括：

獲取輸入字符串；

對所述輸入字符串進行分割，得到候選詞語；

基于得到的候選詞語生成候選詞語集。

結合第一方面，本公開在第一方面的第一種實現(xiàn)方式中，所述計算所述候選詞語集中詞語為預設詞語的概率值，包括：

確定特征數(shù)據(jù)；

獲取訓練詞語數(shù)據(jù)；

基于所述特征數(shù)據(jù)和訓練詞語數(shù)據(jù)訓練得到特征數(shù)據(jù)的權重值；

基于所述特征數(shù)據(jù)的權重值計算候選詞語為預設詞語的概率值。

結合第一方面，本公開在第一方面的第一種實現(xiàn)方式中，所述特征數(shù)據(jù)包括：詞語w在當前輸入字符串中出現(xiàn)的次數(shù)，詞語w在預設歷史時間段內輸入字符串中出現(xiàn)的次數(shù)，詞語w的相鄰詞語，詞語w的詞性，相鄰詞語的詞性，詞語w是否為預設名稱中的一種或多種。

結合第一方面，本公開在第一方面的第一種實現(xiàn)方式中，所述訓練詞語數(shù)據(jù)包括正樣本詞語和負樣本詞語。

結合第一方面，本公開在第一方面的第一種實現(xiàn)方式中，所述獲取訓練詞語數(shù)據(jù)，包括：

對詞語執(zhí)行預設操作，得到預設操作數(shù)據(jù)；

計算所述詞語與預設操作數(shù)據(jù)之間的匹配度；

將匹配度高于或等于預設匹配度閾值的詞語確定為正樣本詞語，將匹配度低于預設匹配度閾值的詞語確定為負樣本詞語。

結合第一方面，本公開在第一方面的第一種實現(xiàn)方式中，所述基于所述特征數(shù)據(jù)和訓練詞語數(shù)據(jù)訓練得到特征數(shù)據(jù)的權重值，包括：

基于所述特征數(shù)據(jù)和訓練詞語數(shù)據(jù)進行訓練，得到特征權重預測模型；

基于所述特征權重預測模型預測所述特征數(shù)據(jù)對應的權重。

結合第一方面，本公開在第一方面的第一種實現(xiàn)方式中，利用下式基于所述特征數(shù)據(jù)的權重值計算候選詞語w為預設詞語的概率值p(w)：

其中，f_i表示特征數(shù)據(jù)中的第i個特征，λ_i表示第i個特征f_i對應的權重值。

結合第一方面，本公開在第一方面的第一種實現(xiàn)方式中，所述將所述概率值符合預設條件的詞語確認為目標詞語，包括：

將所述概率值大于預設概率閾值的詞語確定為目標詞語。

結合第一方面和第一方面的第一種實現(xiàn)方式，本公開在第一方面的第二種實現(xiàn)方式中，所述方法還包括：對所述目標詞語執(zhí)行預設操作。

第二方面，本公開實施例中提供了一種語義分析裝置。

具體的，所述語義分析裝置，包括：

獲取模塊，被配置為獲取候選詞語集；

計算模塊，被配置為計算所述候選詞語集中詞語為預設詞語的概率值；

確認模塊，被配置為將所述概率值符合預設條件的詞語確認為目標詞語。

結合第二方面，本公開在第二方面的第一種實現(xiàn)方式中，所述獲取模塊包括：

第一獲取子模塊，被配置為獲取輸入字符串；

分割子模塊，被配置為對所述輸入字符串進行分割，得到候選詞語；

生成子模塊，被配置為基于得到的候選詞語生成候選詞語集。

結合第二方面，本公開在第二方面的第一種實現(xiàn)方式中，所述計算模塊包括：

確定子模塊，被配置為確定特征數(shù)據(jù)；

第二獲取子模塊，被配置為獲取訓練詞語數(shù)據(jù)；

訓練子模塊，被配置為基于所述特征數(shù)據(jù)和訓練詞語數(shù)據(jù)訓練得到特征數(shù)據(jù)的權重值；

計算子模塊，被配置為基于所述特征數(shù)據(jù)的權重值計算候選詞語為預設詞語的概率值。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京小度信息科技有限公司，未經北京小度信息科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201711230879.9/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：確定全景泊車系統(tǒng)標定時機的方法及裝置
下一篇：一種汽車超員的監(jiān)測方法以及裝置、汽車

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06F 電數(shù)字數(shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計算設備或數(shù)據(jù)處理設備或數(shù)據(jù)處理方法
G06F17-10 .復雜數(shù)學運算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索；及其數(shù)據(jù)庫結構
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計算機輔助設計

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】

[發(fā)明專利]語義分析方法、裝置、電子設備及計算機可讀存儲介質在審

專利文獻下載

[發(fā)明專利]語義分析方法、裝置、電子設備及計算機可讀存儲介質在審