[發明專利]一種基于模板的語義變量抽取方法有效
| 申請號: | 200910195882.0 | 申請日: | 2009-09-18 |
| 公開(公告)號: | CN102023854A | 公開(公告)日: | 2011-04-20 |
| 發明(設計)人: | 朱勝;張益智;王寶利 | 申請(專利權)人: | 上海智問軟件技術有限公司 |
| 主分類號: | G06F9/44 | 分類號: | G06F9/44 |
| 代理公司: | 上海東創專利代理事務所(普通合伙) 31245 | 代理人: | 馬云;曹立維 |
| 地址: | 201203 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 模板 語義 變量 抽取 方法 | ||
技術領域:
本發明涉及一種計算機信息的處理方法,尤其涉及一種基于語義變量抽取的應用接口的實現方法。
背景技術:
目前的計算機應用程序的接口,絕大多數是基于已有標準規范化的接口的應用,其輸入和輸出都是帶有類型的變量。比如,一個查詢賬戶余額的應用程序接口,可以定義的標準輸入是,字符串類型:賬號名稱,字符串類型:賬號密碼,輸出的是一個浮點數:金額大小。顯然,這樣的接口比較標準化,很容易實現被其他程序調用。
上述的應用接口,人們的自然語言(比如聲音)無法直接調用,因此作為一個完整的面向普通用戶的可應用程序,必須提供UI(user?interface)界面,告訴用戶這里輸入賬號名稱,那里輸入密碼,點擊查詢按鈕以后,你可以看到賬戶余額。如果在人們的自然語言和應用程序接口之間,建立一個中間的語義處理層,使得人們通過自然語言就可以調用各種應用程序接口,就會大大方便很多非電腦技術人員對計算機的使用。同時在一些特殊領域也能開展多種應用,如整合語音模塊,可以實現基于人類自然語言的智能聲控驅動等。
語義處理是計算機信息處理中較難的環節,當前應用教少,僅在部分領域有一些簡單的應用。比如,手機的語音撥號系統,其應用是,首先對手機喊“call”,系統語音提示屬于電話呼叫,然后通過語音輸入電話號碼,語音提示確認,確認后自動撥號。這種實現,其實現流程是固定的,觸發命令也是固定的,每個環節的語義也較單一,實現起來比較簡單。
在當前個性化應用比較多的情形下,基于多應用的考慮,把語義驅動層引入應用系統并提供插件接口,使得各種業務模塊能以插件的形式存在,成為一種新的應用需求。在當前的解決方案中,可以采用語義模板實現技術及反問技術等實現方式。語義模板實現技術主要解決一答多問的情形,語義模板通過抽象到具體數據的映射得到數據,結合數據,就渲染出各種不同的具體語義問法。反向技術主要處理語義中間層遇到沖突和矛盾時的處理。
為了能準確有效地實現基于語義的用戶接口應用,需提出一種能夠根據語義快速分析并提取準確信息的解決方案,根據提取關鍵詞快速驅動應用程序模塊,可大大提高應用系統的擴展性和處理能力,實現多種應用中的自然語言交互接口的綜合業務。
發明內容:
本發明的目的提供一種基于模板的語義變量抽取方法,通過定義語義變量的標識模板,進行模板比對,最終將用戶輸入語句中的關鍵詞進行抽取的一種實現方式,本發明所提出的一種基于模板的語義變量抽取方法包含以下步驟:
1、定義變量標識抽取模板;
變量標識抽取模板由描述性的文本(TEXT,簡稱T)和抽取的變量(VARIABLE,簡稱V)兩部分內容構成。
2、建立變量抽取模板索引鏈表(Template?Index?List);
對變量抽取模板按照文本T和變量V進行抽象化的讀取,其讀取結果為模板索引對象鏈表。做成鏈表的數據結構是便于靈活訪問模板的要素,供后續程序調用。索引列表為簡單的單向鏈表,每個節點包含以下幾個屬性內容:
next字段標識后繼節點是什么;
type字段標識節點類型,為文本和變量;
value字段標記值。對于變量,記錄變量類型;對于text記錄文本信息;
Head?Value:當type為文本的時候有效。一般記錄value分詞后的第一個詞,也可以記錄多個詞;
Tail?Value:當type為文本的時候有效。一般記錄value分詞后的最后一個詞,也可以記錄多個詞;
3、獲取分割注釋列表(Separator?Comment?List);
進一步對模板索引鏈表進行分析,得到一個分割節點的集合,其標明了分割的重要信息,稱為分割的注釋列表。分割注釋列表的每個節點包含分割符和分割類型信息。分割符為分割提取時的標識字符,分割類型分為L、R、B三種:
L表示分割符號的右邊是一個需要抽取的變量V,左側是一個文本T;
R表示分割符號的左邊是一個需要抽取的變量V,右側是一個文本T;
B表示分割符號左右都是需要抽取的變量;
4、根據分割注釋鏈表獲得分割符號對輸入語句進行分割,獲得輸入語句的語句索引鏈表(Sentence?Index?List);
根據步驟3的結果,獲得所有可能的分割符號。輸入語句通過分割符號進行分割,得到基于分割結果輸入語句索引鏈列表(Sentence?Index?List)。每一個語句索引對象都是一個單向的鏈表,包含以下信息:
Place:位置,該分割符號在句子中所處的位置;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海智問軟件技術有限公司,未經上海智問軟件技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910195882.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:濾波電路安裝單元及電源單元
- 下一篇:治療膽結石的中藥制劑





