[發明專利]一種語義理解方法及裝置有效
| 申請號: | 201710905504.1 | 申請日: | 2017-09-29 |
| 公開(公告)號: | CN107704559B | 公開(公告)日: | 2020-06-05 |
| 發明(設計)人: | 葉毓平;曾啟文;王虹超 | 申請(專利權)人: | 北京軟通智城科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/30 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 100094 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語義 理解 方法 裝置 | ||
本發明公開了一種語義理解方法及裝置,所述方法包括:獲取待分析的語義文本,基于意象圖式構建語義文本的語義網,獲取語義網的向量空間與本體數據庫中的各標準文本的向量空間的距離差,并根據距離差確定與語義文本對應的標準文本。本發明實施例提供的方案,無需針對同一語義預先存儲多種表達形式,且也不需要預先為不同的場景配置不同的模板,語義理解效率高。
技術領域
本發明涉及智慧城市技術領域,特別是涉及一種語義理解方法及裝置。
背景技術
智慧城市的建設離不開人機的深入交互,更離不開語義理解系統的支撐。智慧城市應用的智慧性對語義理解提出了更高的要求。
目前常見的語義理解方法主要有兩種,一種為基于人理解的統計方法,具體地,預先統計并存儲同一種語義的多種說法,當具有待分析的語義文本時,將語義文本與預先存儲的多種說法進行比對,以確定待分析的語義文本所表達的真實語義;另一種方法基于模板規則配置實現,具體地,為不同的場景設置不同的模板,當具有待分析的語義文本時,將語義文本與各模板匹配,直至確定符合該語義文本的模板,并根據確定的模板確定待分析的語義文本所表達的真實語義。例如,待分析的語義文本為“我要買去長沙的火車票”,配置的場景模板可以為,第一個詞為主語,間隔“買”為動作,第五個詞開始一般為“目的地”地名等,當待分析的語義文本與各模板匹配后,確定與上述場景模板匹配,所以可確定待分析的語義文本所所表達的真實語義為購買目的地為長沙的火車票。
發明人在對現有技術的研究過程中發現,第一種語義理解方法需要預先存儲多種說法,然而由于地域和生活習慣的不同,不可能做到窮舉一個意思的所有說法,所以,該語義理解方法的準確度較低;而第二種語義理解方法,,需要預先為不同的場景配置不同的模板,語義理解效率較低。
發明內容
為解決上述技術問題,本發明實施例提供了一種方法及裝置,以解決現有技術中在線編程時間長的問題,技術方案如下:
一種語義理解方法,包括:
獲取待分析的語義文本;
基于意向圖式構建所述語義文本的語義網;
獲取所述語義網的向量空間與本體數據庫中的各標準文本的向量空間的距離差;
根據所述距離差確定與所述語義文本對應的標準文本。
優選地,基于意向圖構建所述語義文本的語義網之前,還包括:
按照所述本體數據庫中對單個本體的定義規則,對所述語義文本進行分詞,以獲得多個語義子文本;
分別標注所述多個語義子文本的詞性;
相應地,基于意向圖構建所述語義文本的語義網,包括:
根據所述多個語義子文本和所述詞性,基于意向圖構建所述語義文本的語義網。
優選地,根據所述距離差確定與所述語義文本對應的標準文本,包括:
從所述距離差中確定最小距離差;
將與所述最小距離差對應的標準文本作為與所述語義文本對應的標準文本。
優選地,還包括:
輸出與確定的標準文本對應的答案。
優選地,還包括:
預先通過網絡節點上的自動爬蟲從各網站抓取文本信息;
將所述文本信息轉換為符合所述定義規則的本體;
將所述本體存儲至所述本體數據庫中。
一種語義理解裝置,包括:
獲取待分析的語義文本;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京軟通智城科技有限公司,未經北京軟通智城科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710905504.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:汽油割灌機(DY431)
- 下一篇:手動攪拌機





