[發明專利]基于語音的媒體搜索有效
| 申請號: | 201380044924.5 | 申請日: | 2013-09-17 |
| 公開(公告)號: | CN104584010B | 公開(公告)日: | 2018-01-19 |
| 發明(設計)人: | S·巴達斯卡 | 申請(專利權)人: | 蘋果公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市金杜律師事務所11256 | 代理人: | 王茂華,龐淑敏 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語音 媒體 搜索 | ||
技術領域
本發明所公開的具體實施整體涉及數字助理系統,并且更具體地涉及用于基于語音的媒體搜索的方法和系統。
背景技術
在相機技術、圖像處理和圖像存儲技術中的進步已使得人類能夠通過數字照片來與其周圍環境無縫地進行交互并“捕獲”其周圍環境。此外,圍繞手持式設備(例如,移動電話和數字助理系統)的技術中的最近的進步已提高了手持式設備的圖像捕獲和圖像存儲能力。這已導致用于照片采集和數字照片存儲的手持式設備的使用顯著增加。
在電子設備上采集和存儲的數字照片的日益增加產生對照片的系統分類和有效組織的需求,從而能夠便于查看和搜索。照片的加標簽例如通過與人或地點的照片名稱相關聯有助于易于組織和搜索照片。其他信息諸如時間、日期和GPS坐標數據也被越來越多地與照片相關聯,從而允許高效的分類和組織。
雖然照片捕獲和數字圖像存儲技術在過去十年里已顯著進步,但是用于照片搜索的傳統方法可能是不直觀的、費力的和耗時的。
發明內容
因此,需要一種簡單、直觀、容易使用的方式來搜索照片。本發明提供了用于在電子設備處實施的基于語音的照片搜索的系統和方法。
下述具體實施提供了通過使用自然語言處理技術進行基于語音的照片搜索的方法和系統。自然語言處理技術被部署以使得用戶能夠以口頭或文本的形式來與手持式設備以及數字助理系統進行交互,由此數字助理系統可解釋用戶的輸入以推斷用戶的意圖,將所推斷出的意圖轉化成可執行的任務和參數,執行操作或部署服務以執行任務,并且產生用戶可理解的輸出。
基于語音的照片搜索顯著地增加了照片搜索的速度和便利性。例如,通過將語音識別技術與智能自然語言處理組合,本發明所公開的具體實施使得用戶能夠簡單地說出對他們想要搜索的照片的描述,例如“把我的假期照片顯示給我”,并且自動地識別照片并將其返回給用戶以用于進行查看、編輯等。本發明所公開的技術能夠處理這種基于語音的輸入,以便查找和檢索相關的照片,甚至在照片先前尚未與用戶生成的文本標簽諸如“假期”或“海灘”相關聯的情況下。相反,當數字照片被捕獲或保存時,與數字照片存儲在一起的元數據與其他用戶信息交叉引用以促進搜索。例如,指示用戶的假期跨越某組天數的日歷條目可用于創建搜索查詢以查找在這些日期拍攝或保存的照片。又如,可查詢使地理代碼與位置相關聯的表以確定與在搜索查詢中所識別的位置對應的地理代碼范圍。用戶的照片然后可被搜索以查找其地理代碼對應于所識別的位置的那些照片。
因此,本文所公開的具體實施提供了實現基于語音的自然語言照片搜索的方法、系統和計算機可讀存儲介質。
一些具體實施提供了一種用于使用基于語音的數字助理來搜索媒體項的方法。該方法在具有處理器和存儲用于由處理器執行的指令的存儲器的電子設備處執行。該方法包括提供多個媒體項。媒體項可包括照片、視頻和/或音頻。媒體項中的至少一些媒體項各自與相應標簽相關聯,該相應標簽包括時間標簽、日期標簽或地理代碼標簽中的至少一個。在一些具體實施中,將標簽與媒體項存儲在一起作為元數據。
該方法還包括提供與針對一個或多個媒體項的搜索查詢對應的自然語言文本串,其中搜索查詢包括一個或多個查詢詞。在一些具體實施中,文本串對應于來自用戶的語音輸入。在一些具體實施中,語音輸入使用語音至文本處理被轉化為文本。
該方法還包括搜索至少一個信息源以識別與一個或多個查詢詞中的至少一個查詢詞相關聯的至少一個參數。在一些具體實施中,信息源為日歷、電子郵件/文本消息、社交網絡帖子、通信錄、和/或類似物。至少一個參數包括時間參數、日期參數或地理代碼參數中的至少一個。至少一個參數和與所述多個媒體項相關聯的標簽是分開的,例如,該參數不是媒體項的元數據的一部分。
該方法還包括將相應標簽與至少一個參數進行比較以識別至少一個其標簽與所識別的參數相匹配的媒體項;以及促進向用戶呈現所述至少一個媒體項。在一些具體實施中,促進呈現包括將所述至少一個媒體項顯示給用戶。
根據一些實施例,一種電子設備包括存儲器、一個或多個處理器以及一個或多個程序,所述一個或多個程序存儲在存儲器中并被配置為由該一個或多個處理器執行,并且所述一個或多個程序包括用于執行上述方法中的任一方法的操作的指令。根據一些實施例,非暫態計算機可讀存儲介質在其中存儲有指令,該指令當由電子設備執行時,使得該設備執行上述方法中的任一方法的操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘋果公司,未經蘋果公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380044924.5/2.html,轉載請聲明來源鉆瓜專利網。





