[發(fā)明專利]一種網(wǎng)上信息匯聚的方法有效
| 申請?zhí)枺?/td> | 201110390958.2 | 申請日: | 2011-11-30 |
| 公開(公告)號: | CN102750299B | 公開(公告)日: | 2018-03-16 |
| 發(fā)明(設(shè)計(jì))人: | 張峰 | 申請(專利權(quán))人: | 新奧特(北京)視頻技術(shù)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京挺立專利事務(wù)所(普通合伙)11265 | 代理人: | 葉樹明 |
| 地址: | 100195 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 網(wǎng)上 信息 匯聚 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明主要涉及媒體制作領(lǐng)域,尤其涉及一種網(wǎng)上信息匯聚的方法。
背景技術(shù)
隨著互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)上的信息越來越豐富。有文本信息、圖片信息、視音頻信息等。現(xiàn)在媒體制作系統(tǒng)的制作過程中,大量的制作素材需要從網(wǎng)絡(luò)上獲取。傳統(tǒng)的方式是在外網(wǎng)上網(wǎng)下載,再通過人工拷貝或通過高安全區(qū)拷貝到內(nèi)網(wǎng)使用。
這種靠人工的方式,手續(xù)繁瑣嚴(yán)重影響了節(jié)目的制作效率。
發(fā)明內(nèi)容
本申請?zhí)峁┮环N網(wǎng)上信息匯聚的方法,通過資訊線索自動采集資訊信息,并與主題事件相關(guān)聯(lián),實(shí)現(xiàn)了自動搜索資訊內(nèi)容,不再依靠人工進(jìn)行,提高了節(jié)目制作的效率。
為了達(dá)到上述目的,本實(shí)施例提供一種網(wǎng)上信息匯聚的方法,包括以下步驟:
接收資訊線索采集條件;
根據(jù)所述資訊線索采集條件采集相應(yīng)的資訊線索和資訊內(nèi)容;
將所述相應(yīng)的資訊線索和資訊內(nèi)容分類存儲到結(jié)構(gòu)化數(shù)據(jù)庫,所述結(jié)構(gòu)化數(shù)據(jù)庫包括資訊線索庫和媒體資產(chǎn)庫;
對所述媒體內(nèi)容進(jìn)行聚合分析,得到當(dāng)前熱門主題;
根據(jù)所述當(dāng)前熱門主題創(chuàng)建主題事件;
檢索所述資訊線索庫和媒體資產(chǎn)庫中的內(nèi)容,得到與所述主題事件相關(guān)的內(nèi)容;
將所述與主題事件相關(guān)的內(nèi)容進(jìn)行記錄并與所述主題事件建立關(guān)聯(lián)關(guān)系;
將所述主題事件進(jìn)行分類存儲并進(jìn)行分詞索引,并與電視臺制播網(wǎng)相掛接。
本實(shí)施例通過接收資訊線索采集條件;根據(jù)所述資訊線索采集條件采集相應(yīng)的資訊線索和資訊內(nèi)容;將所述相應(yīng)的資訊線索和資訊內(nèi)容分類存儲到結(jié)構(gòu)化數(shù)據(jù)庫,所述結(jié)構(gòu)化數(shù)據(jù)庫包括資訊線索庫和媒體資產(chǎn)庫;對所述媒體內(nèi)容進(jìn)行聚合分析,得到當(dāng)前熱門主題;根據(jù)所述當(dāng)前熱門主題創(chuàng)建主題事件;檢索所述資訊線索庫和媒體資產(chǎn)庫中的內(nèi)容,得到與所述主題事件相關(guān)的內(nèi)容;將所述與主題事件相關(guān)的內(nèi)容進(jìn)行記錄并與所述主題事件建立關(guān)聯(lián)關(guān)系;將所述主題事件進(jìn)行分類存儲并進(jìn)行分詞索引,并與電視臺制播網(wǎng)相掛接,實(shí)現(xiàn)了自動搜索資訊內(nèi)容,不再依靠人工進(jìn)行,提高了節(jié)目制作的效率。
附圖說明
為了更清楚地說明本申請或現(xiàn)有技術(shù)的技術(shù)方案,下面將對本申請或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本申請實(shí)施例一種網(wǎng)上信息匯聚的方法的流程圖。
具體實(shí)施方式
下面將結(jié)合本申請實(shí)施例中的附圖,對本申請中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請的一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾堉械膶?shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本申請保護(hù)的范圍。
本申請實(shí)施例公開一種網(wǎng)上信息匯聚的方法,如圖1所示,包括以下步驟:
步驟101,接收資訊線索采集條件;
資訊線索采集條件,具體包括:
所述資訊線索的類別;
采集所述資訊線索的目標(biāo)地址;
所述資訊線索的最低采集標(biāo)準(zhǔn),至少包括:發(fā)布時(shí)間、展示次數(shù)、點(diǎn)擊率以及回復(fù)次數(shù)。
網(wǎng)上信息匯聚實(shí)質(zhì)對網(wǎng)絡(luò)新媒體數(shù)據(jù)的采集、搜索、線索發(fā)現(xiàn)、新媒體信息發(fā)布等。
基于網(wǎng)絡(luò)新媒體數(shù)據(jù)的不同特點(diǎn),分為非微博類資訊匯聚和微博類資訊匯聚。非微博類主要是包括:新聞網(wǎng)站、論壇、博客等非結(jié)構(gòu)化的網(wǎng)絡(luò)新媒體數(shù)據(jù)的采集和分析;而微博類主要是包括新浪、騰訊、網(wǎng)易、搜狐、twitter等半結(jié)構(gòu)化的媒體數(shù)據(jù)的采集和分析、發(fā)布等功能。
步驟102,根據(jù)所述資訊線索采集條件采集相應(yīng)的資訊線索和資訊內(nèi)容;
非微博類資訊線索匯聚
采用語義分析算法,進(jìn)一步提高分類分析的質(zhì)量;
采用全文分詞和聚類算法,自動發(fā)現(xiàn)熱門關(guān)鍵詞和熱點(diǎn)事件
微博類資訊線索匯聚
將話題、博文、用戶三者信息實(shí)現(xiàn)關(guān)聯(lián);
對于轉(zhuǎn)發(fā)的微博和原文實(shí)現(xiàn)關(guān)聯(lián);
微博信息的分詞、搜索、熱點(diǎn)發(fā)現(xiàn),數(shù)據(jù)分析等功能。
信息提取
一般網(wǎng)頁的信息提取辦法相對簡單,網(wǎng)絡(luò)爬蟲是最常用的手段。
對于娛樂網(wǎng)站的資訊信息,可能是考慮到這類的信息受眾的特點(diǎn),很少有網(wǎng)站提供RSS,這和IT類資訊形成了鮮明的對比,幾乎所有主流IT類網(wǎng)站或板塊都提供了RSS服務(wù)。
博客
目前主流博客都提供RSS形式的訪問接口,通過定期輪詢,可以方便獲取博主最新的言論。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于新奧特(北京)視頻技術(shù)有限公司,未經(jīng)新奧特(北京)視頻技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110390958.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:文件夾
- 下一篇:輔助殺蟲網(wǎng)罩
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





