[發明專利]通過拼音進行搜索的方法、服務器及系統在審
| 申請號: | 201310727117.5 | 申請日: | 2013-12-25 |
| 公開(公告)號: | CN103678675A | 公開(公告)日: | 2014-03-26 |
| 發明(設計)人: | 喬磊 | 申請(專利權)人: | 樂視網信息技術(北京)股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 許志勇 |
| 地址: | 100089 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 通過 拼音 進行 搜索 方法 服務器 系統 | ||
技術領域
本申請涉及流媒體播放領域,具體涉及一種通過拼音進行搜索的方法、服務器及系統。
背景技術
如今,視頻網站普遍都支持用戶在搜索框直接輸入拼音來搜索視頻結果。視頻網站的服務器會根據輸入的拼音來自動適配拼音所反應出的文字,再根據這些文字來搜索對應的視頻結果。因此只要用戶輸入的拼音正確,往往就可以找到想搜索的視頻。
但是在漢字中存在大量的多音字,一個多音字對應有多個讀音,這些不同的讀音不能混用,而不同的語境搭配需要使用相應的讀音,否則會發生錯亂,無法獲得真正要表達的意思。在用戶搜索時輸入的拼音關鍵字中如果包含這種錯亂使用的多音字拼音,顯然就會發生很多的誤差。例如,如果用戶希望搜索“甄嬛傳”,需要輸入拼音“zhen?huan?zhuan”,但是“傳”本身具有兩個讀音,分別是“zhuan”(音“撰”)和“chuan”(音“船”),而對于一些普通話發音掌握不太好的用戶來說,極容易發生將多音字混淆輸入的問題,例如這些用戶希望輸入的是“甄嬛傳”,但是有可能因為多音字混淆將拼音輸入成“zhuan?huan?chuan”,這樣就無法正確找到用戶希望的結果。
因此,在用戶輸入的拼音關鍵字中包含錯亂使用的多音字拼音時,如何準確獲取與拼音關鍵字對應的正確的搜索結果就成為了亟待解決的技術問題。
發明內容
本申請所要解決的技術問題在于提供一種通過拼音進行搜索的方法、服務器及系統,在用戶輸入的拼音關鍵詞中包含錯亂使用的多音字拼音時,依然可以準確地獲取與拼音關鍵字對應的正確的搜索結果。
為了解決上述問題,本申請揭示了一種通過拼音進行搜索的方法,包括:接收包括至少一個拼音詞語的拼音關鍵詞,根據所述拼音關鍵詞在拼音詞庫進行匹配,其中,所述拼音詞庫中具有多個群組,每個群組對應一文字,每個群組包括至少一個拼音詞語,對于包括兩個以上拼音詞語的群組,所述兩個以上拼音詞語之間具有相關的多音字拼音;根據與所述拼音關鍵詞匹配的群組,獲取所述匹配的群組對應的文字,根據所述匹配到的群組對應的文字組成所述拼音關鍵詞對應的文字關鍵詞,其中,對于匹配到兩個以上群組的所述拼音關鍵詞,所述拼音關鍵詞中的每個拼音詞語匹配到一個群組;根據所述文字關鍵詞形成提示信息并發送至客戶端顯示,或者,根據所述文字關鍵詞搜索與所述文字關鍵詞對應的資源。
進一步地,所述拼音詞庫,包括:詞語拼音子庫和單字拼音子庫,其中,所述詞語拼音子庫中的群組為詞語群組,每個詞語群組對應一詞語文字;所述單字拼音子庫中的群組為單字群組,每個單字群組對應一單個文字。
進一步地,根據所述拼音關鍵詞在拼音詞庫進行匹配的操作,具體包括:按照所述拼音關鍵詞由左向右的排列方向,在所述詞語拼音子庫中對所述拼音關鍵詞進行匹配,匹配到第一數目的詞語群組;按照所述拼音關鍵詞由右向左的排列方向,在所述詞語拼音子庫中對所述拼音關鍵詞進行匹配,匹配到第二數目的詞語群組;如果所述第一數目大于第二數目,將所述拼音關鍵詞中未被所述第一數目的詞語群組匹配到的剩余部分組成第一剩余部分,在所述單字拼音子庫中對所述第一剩余部分進行匹配,匹配到與所述第一剩余部分中的拼音詞語對應的第三數目的單字群組,將所述第一數目的詞語群組以及所述第三數目的單字群組作為所述拼音關鍵詞匹配到的群組;如果所述第二數目大于第一數目,對所述拼音關鍵詞中未被所述第二數目的詞語群組匹配到的剩余部分組成第二剩余部分,在所述單字拼音子庫中對所述第二剩余部分進行匹配,匹配到與所述第二剩余部分中的拼音詞語對應的第四數目的單字群組,將所述第二數目的詞語群組以及所述第四數目的單字群組作為所述拼音關鍵詞匹配到的群組。
進一步地,根據與所述拼音關鍵詞匹配的群組,獲取所述匹配的群組對應的文字,根據所述匹配到的群組對應的文字組成所述拼音關鍵詞對應的文字關鍵詞的操作,具體包括:當所述拼音關鍵詞匹配到的群組包括所述第一數目的詞語群組以及所述第三數目的單字群組時,根據所述第一數目的詞語群組獲取相應的第一數目的詞語文字,根據所述第三數目的單字群組獲取第三數目的單個文字,根據所述第一數目的詞語文字和第三數目的單個文字組成所述拼音關鍵詞的文字關鍵詞;當所述拼音關鍵詞匹配到的群組包括所述第二數目的詞語群組以及所述第四數目的單字群組時,根據所述第二數目的詞語群組獲取相應的第二數目的詞語文字,根據所述第四數目的單字群組獲取第四數目的單個文字,根據所述第二數目的詞語文字和第四數目的單個文字組成所述拼音關鍵詞的文字關鍵詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于樂視網信息技術(北京)股份有限公司,未經樂視網信息技術(北京)股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310727117.5/2.html,轉載請聲明來源鉆瓜專利網。





