[發明專利]語義分析方法及終端設備有效
| 申請號: | 201711351354.0 | 申請日: | 2017-12-15 |
| 公開(公告)號: | CN109933772B | 公開(公告)日: | 2020-11-13 |
| 發明(設計)人: | 豆澤云 | 申請(專利權)人: | TCL科技集團股份有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/295 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 李艷麗 |
| 地址: | 516006 廣東省惠州市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語義 分析 方法 終端設備 | ||
本發明適用于人工智能技術領域,提供了一種語義分析方法及終端設備,其中,所述方法包括:獲取待處理自然語言語句;提取待處理自然語言語句中的命名實體,確定所述命名實體對應的統一標識符;將待處理自然語言語句中的所述命名實體替換為所述統一標識符;將命名實體替換為統一標識符后的待處理自然語言語句轉化成預設邏輯格式語句;確定轉化成所述預設邏輯格式語句的待處理自然語言語句中的占位符,利用所述命名實體填充確定的占位符;分解填充占位符后的待處理自然語言語句,并根據分解結果執行相應動作,可以減少人力物力投入,加快自然語言分析領域的數據處理速度,提高語義分析輸出結果的可實現性,適合應用。
技術領域
本發明屬于人工智能技術領域,尤其涉及一種語義分析方法及終端設備。
背景技術
隨著人工智能的發展,現階段各個領域都開始了相應的應用,從個人助手,智能音箱,智能電視,智能客服等等方面,都需要使用到自然語義分析相關的技術,目的是為了讓計算機可以理解用戶語言所表達的內容,從而可以對用戶的需求做出響應。
自從神經網絡技術近年取得飛速發展以來,自然語義分析所用的技術和手段也開始轉變,但是從本質上來說,使用神經網絡只是從數據擬合方面提高了其各個階段數據輸出的準確概率,其方法和思想依然是基于“分詞,詞性標注,命名實體識別,詞槽標注”等思想的不同組合來實現自然語義主體思想的提取,其過程涉及到的數據處理、數據標注過程繁多,需要大量人力物力,且最后的輸出結果可實現性不高,因為其詞槽輸出的詞語從數量級來說太大,比如“把音量放大10”這句話來說,這個“增加數值”的動作就可以有很多不同的詞語或短句來表達這一個意思,比如:“增加、放大、大一點、大一些、再大點”……等等,所以基于這種思想的自然語義分析通常只能應用在有限的業務領域中,比如音箱領域。如果放在開放領域來看,那么詞槽的數量級應該在十萬甚至百萬級別,根本無法完全實現。
發明內容
有鑒于此,本發明實施例提供了一種語義分析方法及終端設備,以解決現有語義分析技術其過程涉及到的數據處理、數據標注過程繁多,需要大量人力物力,且最后的輸出結果可實現性不高的問題。
本發明實施例的第一方面提供了一種語義分析方法,包括:
獲取待處理自然語言語句;
提取所述待處理自然語言語句中的命名實體,確定所述命名實體對應的統一標識符;
將所述待處理自然語言語句中的所述命名實體替換為所述統一標識符;
將命名實體替換為統一標識符后的待處理自然語言語句轉化成預設邏輯格式語句;
確定轉化成所述預設邏輯格式語句的待處理自然語言語句中的占位符,利用所述命名實體填充確定的占位符;
分解填充占位符后的待處理自然語言語句,并根據分解結果執行相應動作。
可選的,所述提取所述待處理自然語言語句中的命名實體,確定所述命名實體對應的統一標識符包括:
采用命名實體識別技術提取所述待處理自然語言語句中的命名實體;
根據預存的語句命名實體與語句統一標識符的對應關系,確定所述命名實體對應的統一標識符。
可選的,所述預設邏輯格式語句為S=∑(V,N,∑(C)),C=[N=N/L],其中,S代表所述預設邏輯格式語句,V代表動詞,N代表名詞,C代表條件限定短語,L代表量詞,∑代表范圍內元素可重復,C中包含有占位符。
可選的,所述分解填充占位符后的待處理自然語言語句,并根據分解結果執行相應動作包括:
獲取所述預設邏輯格式語句的語法規則;
根據所述語法規則分解填充占位符后的待處理自然語言語句,并根據分解結果執行相應動作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于TCL科技集團股份有限公司,未經TCL科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711351354.0/2.html,轉載請聲明來源鉆瓜專利網。





