[發明專利]上下文語音查詢擴大方法和系統有效
| 申請號: | 201310174325.7 | 申請日: | 2013-05-13 |
| 公開(公告)號: | CN103425727B | 公開(公告)日: | 2017-12-12 |
| 發明(設計)人: | N·拉伊布;K·什里瓦斯塔瓦 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市中咨律師事務所11247 | 代理人: | 張亞非,于靜 |
| 地址: | 美國*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 上下文 語音 查詢 擴大 方法 系統 | ||
技術領域
本發明的實施例一般地涉及信息技術。更具體地說,本發明涉及語音Web搜索。
背景技術
語音Web搜索涉及將語音查詢作為輸入并判定作為對查詢的適合或相關響應的內容。但是在使用現有方法時,由于例如語音識別系統質量和/或精確性等方面的因素,將語音查詢轉換為文本可能會引發歧義。如果查詢轉換不準確,搜索結果會變得不正確。此外,許多現有語音識別系統的語音查詢精確性很低,尤其是對于無法實施語法句法的開放式查詢和孤立詞。
因此,需要改進的語音Web搜索技術。
發明內容
在本發明的一方面,提供了用于上下文語音查詢擴大的技術。一種用于在語音Web搜索中的上下文語音查詢擴大的示例性計算機實現的方法包括以下步驟:判定創建語音查詢的上下文,根據所述上下文以及語音識別組件得出的與所述語音查詢相關的信息產生多個查詢詞的集合,以及使用至少一個擴大算子(operator)處理所述查詢詞集合以產生擴大的查詢集合。
在本發明的另一方面,還提供了針對語音查詢執行搜索的技術,包括以下步驟:根據處理語音查詢的語音識別組件得出的信息產生多個查詢詞的集合;使用多個擴大算子處理所述查詢詞的集合以產生多個擴大的查詢詞子集;從每個擴大的子集選擇至少一個查詢詞以構成查詢集合;以及針對所述查詢集合執行搜索。
本發明的另一方面或其元素可以通過有形地包含計算機可讀指令的制造品的形式實現,所述計算機可讀指令當被實現時,可使計算機執行這里所述的多個方法步驟。此外,本發明的另一方面或其元素可以通過裝置的形式實現,所述裝置包括存儲器和至少一個與所述存儲器相連并可操作以執行所述方法步驟的處理器。
更進一步地,本發明的另一方面或其元素可以通過執行此處描述的方法步驟或其元素的裝置的形式實現;所述裝置可以包括:(i)硬件模塊,(ii)軟件模塊,或(iii)硬件和軟件模塊的組合;(i)-(iii)中的任一項實現此處描述的具體技術,并且所述軟件模塊存儲在有形計算機可讀存儲介質(或多個此類介質)中。
通過結合附圖閱讀下面對本發明的示例性實施例的詳細描述,本發明的這些和其它目標、特征和優點將變得顯而易見。
附圖說明
圖1是示出根據本發明的實施例的系統體系結構的圖;
圖2是示出根據本發明的實施例的擴大機制的圖;
圖3是示出根據本發明的實施例用于在語音Web搜索中的上下文語音查詢擴大的技術的流程圖;
圖4是上面可實現本發明的至少一個實施例的示例性計算機系統的系統圖。
具體實施方式
如此處描述的那樣,本發明的一方面包括上下文語音查詢擴大以改進語音Web搜索。本發明的至少一個實施例包括判定創建語音查詢的上下文以及使用該上下文和對語音識別組件的了解產生多個語音查詢。具有大量查詢將便利獲取更多搜索結果并增加產生用戶感興趣結果的可能性。
如此處所述,本發明的至少一個實施例包括通過指定產生查詢的多個可能變形且因此根據查詢詞或短語創建查詢向量估計的機制來消除搜索對一個查詢詞識別的依賴。因此,在給定查詢q的情況下,此處詳細描述的技術可以包括產生對查詢向量{q’1,q’2,...,q’L}的估計。
本發明的至少一個實施例包括通過語音識別器產生相似(此處稱為n最佳)結果列表,由于語音識別器提供一種概率性輸出,因此其可被配置為提供一個以上可能結果。n最佳列表指語音識別器可針對給定語音輸入提供的n個可能文本結果。在本發明的至少一個實施例中,這樣的列表可以用每個可能結果是正確響應的概率分數進行排列。此外,這樣的列表可以通過擴大算子進行過濾,下面將進一步描述。如果輸出結果較少(例如,如果結果為三個或更少),則本發明的至少一個實施例包括判定擴大算子詞與n最佳列表匹配之間的編輯距離(edit-distance)。
此外,結果列表或子集可從每個擴大過濾器的輸出進行選擇并用于組成查詢集合。例如,每個擴大算子可以產生可能的查詢詞,并且可以根據閾值選擇每個此類擴大算子的前k個輸出以跨所有擴大算子組成查詢集合。可以針對此查詢集合執行搜索,且在本發明的至少一個實施例中,可對結果進行排列以便在擴大輸出的更多元素中出現的結果排序更高。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310174325.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:控制系統、控制裝置及程序執行控制方法
- 下一篇:檢索裝置和檢索方法





