[發明專利]視頻節目的搜索方法和裝置有效
| 申請號: | 201611019485.4 | 申請日: | 2016-11-18 |
| 公開(公告)號: | CN106708929B | 公開(公告)日: | 2020-06-26 |
| 發明(設計)人: | 李賢 | 申請(專利權)人: | 廣州視源電子科技股份有限公司 |
| 主分類號: | G06F16/783 | 分類號: | G06F16/783;G06F16/71 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 麥小嬋;郝傳鑫 |
| 地址: | 510530 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 節目 搜索 方法 裝置 | ||
1.一種視頻節目的搜索方法,其特征在于,包括:
接收用戶輸入的描述視頻節目的描述詞條和所述視頻節目所屬的視頻類別;
選取與所述視頻類別相對應的潛在語義索引模型,并根據所述語義索引模型的索引矩陣的構建方式,構建所述描述詞條的查詢向量;其中,所述潛在語義索引模型是對由描述同一視頻類別的視頻節目的描述文檔所構建成的索引矩陣進行奇異值分解而獲得的;
根據所述潛在語義索引模型,計算所述索引矩陣的每一列向量與所述查詢向量的余弦相似度;
對計算獲得的余弦相似度進行從大到小的排序,并選取排序號屬于排序區間的余弦相似度的列向量對應的視頻節目提供給所述用戶;
其中,由描述視頻節目的描述文檔構建成索引矩陣的過程包括:將第i個關鍵詞在第j個視頻節目的描述文檔中出現的詞頻作為索引矩陣的第j列的第i個元素的數值;
構建所述描述詞條的查詢向量的過程包括:設置所述查詢向量的第i個元素代表的關鍵詞與所述索引矩陣的第i行元素代表的關鍵詞相同,并將第i個元素對應的關鍵詞在所述描述詞條中出現的詞頻作為所述查詢向量的第i個元素的數值;其中,所述查詢向量為列向量。
2.如權利要求1所述的視頻節目的搜索方法,其特征在于,由描述同一視頻類別的視頻節目的描述文檔構建成索引矩陣的過程,具體為:
對于數據庫存儲的描述同一視頻類別的視頻節目的所有描述文檔,根據標準詞條格式,對所述所有描述文檔包含的詞條進行格式調整;其中,所述數據庫存儲有多種視頻類別的描述文檔,一個描述文檔描述一個視頻節目,不同的描述文檔描述的視頻節目互不相同;
調用分詞工具;
利用所述分詞工具對格式調整后的所述所有描述文檔的詞條進行分詞,獲得第一詞語集;
根據TF-IDF算法從所述第一詞語集中提取關鍵詞;
根據所提取的每一個關鍵詞在每一個描述文檔中出現的詞頻,構建索引矩陣;其中,所述索引矩陣的行順序是根據關鍵詞在所述所有描述文檔出現的總詞頻進行由高到低的排列,所述索引矩陣的列順序根據關鍵詞在每一個描述文檔中出現的詞頻進行由高到低的排列。
3.如權利要求1所述的視頻節目的搜索方法,其特征在于,所述構建所述描述詞條的查詢向量,具體為:
根據標準詞條格式,對所述描述詞條進行格式調整;
調用分詞工具;
利用所述分詞工具對格式調整后的所述描述詞條進行分詞,獲得第二詞語集;
根據TF-IDF算法從所述第二詞語集中提取關鍵詞;
根據所提取的每一個關鍵詞在所述描述詞條中出現的詞頻,構建所述描述詞條的查詢向量。
4.如權利要求2所述的視頻節目的搜索方法,其特征在于,所述索引矩陣為H,則對所述索引矩陣進行奇異值分解所獲得的所述潛在語義索引模型為:H=T*S*DT;其中,T為正交矩陣,矩陣T的每一列是所述索引矩陣H的左奇異向量;S為對角矩陣,矩陣S的對角線元素是所述索引矩陣H的奇異值;D為正交矩陣,矩陣D的每一列為所述索引矩陣H的右奇異向量;所述查詢向量為Q;
所述根據所述潛在語義索引模型,計算所述索引矩陣的每一列向量與所述查詢向量的余弦相似度,具體為:
選取TK、SK和DK矩陣,修訂所述潛在語義索引模型為HK=TK*SK*DKT;其中,TK為由矩陣T的前K列形成的矩陣,SK為由矩陣S的前K個對角線元素形成的對角矩陣,DK為由矩陣D的前K列形成的矩陣;K的數值大于所述排序區間包含的最大排序號;
對于修訂后的所述潛在語義索引模型的索引矩陣HK,計算所述查詢向量的轉置矩陣QT與所述矩陣TK相乘所得的行向量和所述矩陣DK與所述矩陣SK相乘所得矩陣的第j行向量的兩行向量之間的余弦相似度,作為所述索引矩陣HK的第j列向量與所述查詢向量Q的余弦相似度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州視源電子科技股份有限公司,未經廣州視源電子科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611019485.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:切削刀具及其制造方法
- 下一篇:一種合成碳酸二甲酯的方法





