[發明專利]視頻搜索方法及系統有效
| 申請號: | 201010600040.1 | 申請日: | 2010-12-13 |
| 公開(公告)號: | CN102063476A | 公開(公告)日: | 2011-05-18 |
| 發明(設計)人: | 陳海坤 | 申請(專利權)人: | 百度時代網絡技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 何青瓦;李慶波 |
| 地址: | 100080 北京市海淀區東*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 搜索 方法 系統 | ||
技術領域
本發明涉及搜索引擎技術,尤其涉及一種視頻搜索方法及系統。
背景技術
隨著互聯網上信息的飛速增長,網絡上充斥了越來越多的冗余信息,而對于在網絡上搜尋自己所需要信息的互聯網用戶而言,面對這些漫無邊際的信息無疑像大海撈針。搜索引擎的出現無疑在一定程度上為用戶的搜索需求帶來了很大便利。搜索引擎是一種在網絡上應用的軟件系統,其以一定的策略在網絡上搜集和發現信息,并在對信息進行處理和組織后,為用戶提供互聯網上的信息搜索服務。通常,這種軟件系統提供一個網頁界面,讓用戶在客戶端通過瀏覽器軟件提交搜索詞,然后很快返回一個可能和用戶輸入的搜索內容相關的信息列表。這個列表通常會包括上萬個條目,每個條目代表一篇搜索到的相關網頁。
過去十幾年以來,相應地,眾多的互聯網搜索引擎及對應的網站應運而生,這中間的佼佼者包括百度公司的百度搜索(www.baidu.com)和谷歌公司的谷歌搜索(www.google.cn)。
隨著網絡技術的不斷發展,用戶對搜索引擎的要求已經不再滿足于只是對文本的搜索,很多用戶還希望可以通過搜索引擎對網絡視頻進行搜索。然而,在目前的視頻搜索中,存在以下幾個問題:
首先,用戶在客戶端通過瀏覽器軟件提交搜索詞后,其是通過該搜索詞在視頻標題中進行搜索,并返回搜索結果,即是:只能返回標題文本中包含所述搜索詞的視頻,例如:如圖1所示,當用戶在客戶端通過瀏覽器軟件提交“恐怖片”為搜索詞后,通過搜索引擎的搜索,返回只有標題文本中包含“恐怖片”的視頻,搜索形式單一;
其次,在現有技術中,用戶在客戶端通過瀏覽器軟件提交搜索詞后,搜索引擎會將各大視頻網站的不同上傳者的不同版本進行搜索并返回給用戶,并不是以作品為單位去組織搜索結果,這樣,會導致返回的搜索結果重復地、無序地出現,影響視覺。
另外,在現有技術中,對于視頻的搜索結果,一般地只是展示出視頻鏈接和視頻圖片,展現形式較為單一,不能使用戶全方位的了解搜索結果的質量。
發明內容
本發明的目的在于提供一種改進的視頻搜索方法,其不僅可以在標題文本信息中搜索視頻,還可在視頻作品信息中搜索視頻,同時,本發明的視頻搜索方法還可無重復地、有序地將視頻搜索結果展示給用戶。
本發明的目的還在于提供一種實現上述視頻搜索方法的視頻搜索系統。
為實現上述發明目的之一,本發明的一種視頻搜索方法,包括以下步驟:
作品信息建構步驟:獲取作品信息,并建立作品信息數據庫;
視頻對象分類步驟:將視頻對象和作品ID進行映射;
索引生成步驟:將所述作品信息數據庫中的作品信息生成索引;
接收搜索詞步驟:接收搜索詞;
搜索步驟:將所述搜索詞在所述索引中進行搜索,并得到搜索結果;
搜索結果輸出步驟:輸出所述搜索結果。
作為本發明的進一步改進,所述作品信息建構步驟包括:
獲取作品信息步驟:獲取作品信息;
保存作品信息步驟:將所述作品信息存入所述作品信息數據庫。
作為本發明的進一步改進,在所述獲取作品信息步驟中是通過SPIDER定向從網絡抓取所述作品信息。
作為本發明的進一步改進,所述視頻對象分類步驟包括:
識別視頻對象類型步驟:識別一個視頻對象的類型;
提取作品名步驟:提取與所述視頻對象對應的作品名;
匹配步驟:將所述視頻對象通過所述作品名與所述作品信息數據庫中的視頻進行匹配,獲取作品ID,完成所述視頻對象與所述作品ID的映射。
作為本發明的進一步改進,一個所述作品ID可映射到多個所述視頻對象。
作為本發明的進一步改進,所述接收搜索詞步驟包括:
接收用戶輸入的搜索詞;
判斷所述搜索詞是否屬于概括詞;
若該搜索詞為概括詞,則進入搜索步驟。
作為本發明的進一步改進,所述接收搜索詞步驟還包括:
若該搜索詞為未概括詞,則直接搜索視頻對象。
作為本發明的進一步改進,所述搜索步驟包括:
去重步驟:將所述作品ID重復的視頻對象統一為一部視頻;
排序步驟:根據所述作品ID的屬性進行排序。
作為本發明的進一步改進,所述作品ID的屬性包括:所述作品ID的類型、時間、用戶歡迎程度。
作為本發明的進一步改進,所述排序步驟還包括:
判斷搜索詞中是否包括含有時間定義的關鍵字;
若含有時間定義的關鍵字,則按照時間維度進行排序。
作為本發明的進一步改進,所述排序步驟還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度時代網絡技術(北京)有限公司,未經百度時代網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010600040.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:模塊化構造的變流器系統
- 下一篇:無級變速器的控制裝置





