[發(fā)明專利]一種基于微博分析電視節(jié)目收視情況的方法有效
| 申請(qǐng)?zhí)枺?/td> | 201310328471.0 | 申請(qǐng)日: | 2013-07-31 |
| 公開(kāi)(公告)號(hào): | CN103425755A | 公開(kāi)(公告)日: | 2013-12-04 |
| 發(fā)明(設(shè)計(jì))人: | 王永恒;杜凱;王樂(lè);袁志堅(jiān);付偉;陳穎文 | 申請(qǐng)(專利權(quán))人: | 王永恒 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06F17/27 |
| 代理公司: | 深圳市興科達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 44260 | 代理人: | 王翀 |
| 地址: | 410008 湖南省長(zhǎng)沙*** | 國(guó)省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 分析 電視節(jié)目 收視 情況 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,尤其是涉及一種基于微博分析電視節(jié)目收視情況的方法。
背景技術(shù)
電視作為一種經(jīng)典傳媒,對(duì)社會(huì)及人們的生活有重大的影響。當(dāng)前,我國(guó)電視產(chǎn)業(yè)蓬勃發(fā)展,電視臺(tái)尤其是衛(wèi)視之間競(jìng)爭(zhēng)激烈。各衛(wèi)視紛紛推出自己的王牌節(jié)目來(lái)吸引觀眾,如湖南衛(wèi)視的“我是歌手”、江蘇衛(wèi)視的“非誠(chéng)勿擾”、浙江衛(wèi)視的“中國(guó)好聲音”等。對(duì)電視節(jié)目的收視情況、觀眾意見(jiàn)進(jìn)行全面的分析,對(duì)于電視臺(tái)的發(fā)展戰(zhàn)略、節(jié)目制作、觀眾互動(dòng)等,有著重要的價(jià)值。
隨著互聯(lián)網(wǎng)、智能手機(jī)、移動(dòng)設(shè)備的普及,電視行業(yè)進(jìn)入了一個(gè)新的時(shí)代—社交電視時(shí)代。除了使用傳統(tǒng)的電視機(jī),越來(lái)越多的觀眾使用電腦、手機(jī)、平板電腦等新型手段來(lái)收看電視節(jié)目。例如湖南衛(wèi)視的“快樂(lè)大本營(yíng)”,每期網(wǎng)上點(diǎn)播的次數(shù)平均達(dá)到5千萬(wàn)次。同時(shí),電視觀眾喜歡在觀看電視節(jié)目時(shí)或觀看節(jié)目后,通過(guò)微博、社交網(wǎng)絡(luò)等手段來(lái)分享自己的感受。根據(jù)英國(guó)ThinkBox公司的最新調(diào)查,有60%的觀眾在看電視的同時(shí)上網(wǎng),44%的人看電視時(shí)使用社交網(wǎng)絡(luò),19%的人在社交網(wǎng)絡(luò)中分享電視內(nèi)容。在倫敦奧運(yùn)會(huì)期間,騰訊奧運(yùn)視頻日均播放量超2億,新浪微博上奧運(yùn)話題討論量突破3.9億次。社交電視的新特征使電視節(jié)目的收視評(píng)價(jià)面臨新的挑戰(zhàn),同時(shí)也提供了新的機(jī)遇讓電視臺(tái)去更深入地了解他們的觀眾。
尼爾森收視率調(diào)查是評(píng)價(jià)電視節(jié)目收視率的經(jīng)典方法,通過(guò)特定的設(shè)備連接到電視,或者問(wèn)卷調(diào)查的方式來(lái)統(tǒng)計(jì)收視率。這種方法的缺陷是調(diào)查樣本小,結(jié)果容易受調(diào)查人群特征的影響。同時(shí),在社交電視的新時(shí)代,尼爾森方法無(wú)法覆蓋新型的收視手段,從而難以獲得合理的結(jié)果。例如“絕命毒師”(Breaking?Bad)和“廣告狂人”(Mad?Men)等劇,尼爾森調(diào)查的收視率很低,但從微博等其它媒體看,這些電視劇的收視情況很好。同時(shí),尼爾森收視調(diào)查只能調(diào)查收視率,而無(wú)法對(duì)觀眾的特征、評(píng)價(jià)、感受等做進(jìn)一步了解。
目前,對(duì)電視節(jié)目全面分析的相關(guān)工作主要基于Twitter,獲取電視節(jié)目相關(guān)的微博主要依賴于關(guān)鍵詞搜索。在進(jìn)行微博分析時(shí)主要采用的是傳統(tǒng)的英文分類、聚類等方法;基于關(guān)鍵詞搜索的方法容易遺漏大量的相關(guān)微博,而抓取到的微博又常常有很多是和節(jié)目無(wú)關(guān)的,缺乏針對(duì)電視節(jié)目進(jìn)行微博分析的系統(tǒng)化方法。同時(shí),英文微博分析使用的WordNet,SentiWordNet等詞典,無(wú)法在中文微博分析中使用。
專利201280000300.9公開(kāi)了一種調(diào)查收視率的方法,接收正在播放的電視節(jié)目錄音指令;對(duì)所述電視節(jié)目錄音;向所述服務(wù)器發(fā)送錄音的電視節(jié)目音頻流,使服務(wù)器根據(jù)所述錄音的電視節(jié)目音頻流統(tǒng)計(jì)出所述電視節(jié)目的收視率。此方法雖能提高收視率的準(zhǔn)確性,但此方法存在兩點(diǎn)缺陷:(1)對(duì)于電腦、手機(jī)等收視手段,無(wú)法獲取錄音;(2)只能獲取收視率,無(wú)法獲取不同節(jié)目的用戶特征、用戶對(duì)節(jié)目的評(píng)價(jià)等信息。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是,克服現(xiàn)有技術(shù)存在的上述缺陷,提供一種基于微博分析電視節(jié)目收視情況的方法。
本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是,一種基于微博分析電視節(jié)目收視情況的方法,包括以下步驟:
(1)構(gòu)建詞庫(kù):從搜狗細(xì)胞詞庫(kù)下載詞庫(kù),將下載的詞庫(kù)組合在一起構(gòu)成電視領(lǐng)域基本詞庫(kù),并定期更新;
(2)建立微博-電視節(jié)目映射:首先建立節(jié)目樣本庫(kù),根據(jù)樣本特征詞提取每日微博,對(duì)獲取的微博進(jìn)行過(guò)濾,采用數(shù)據(jù)分析開(kāi)源工具中的文本處理包進(jìn)行文本分類,由于文本處理包不支持中文,先把中文分詞加入空格,“模擬”英文來(lái)實(shí)現(xiàn)分類;
(3)數(shù)據(jù)分析:對(duì)步驟(2)建立的微博-電視節(jié)目映射分別進(jìn)行每日分析和多維分析,所述每日分析包括情感分析、詞語(yǔ)特征分析和主題分析、每日基本統(tǒng)計(jì)以及網(wǎng)絡(luò)特征分析。
(4)可視化結(jié)果展現(xiàn):通過(guò)報(bào)表形式和圖形形式將步驟(2)分析的結(jié)果展現(xiàn)出來(lái);
步驟(2)中,所述建立節(jié)目樣本庫(kù)的方法,首先根據(jù)節(jié)目關(guān)鍵詞,使用微博的搜索接口進(jìn)行搜索,獲取初始節(jié)目樣本庫(kù);然后采用人工的方式,對(duì)初始節(jié)目樣本庫(kù)進(jìn)行過(guò)濾,將過(guò)濾出的微博標(biāo)注為“相關(guān)”和“不相關(guān)”兩類,并將“相關(guān)”和“不相關(guān)”兩類微博建立節(jié)目樣本庫(kù)微博,每個(gè)節(jié)目的樣本庫(kù)中要求“相關(guān)”的微博不少于2萬(wàn)條,“不相關(guān)”的微博不少于5000條;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于王永恒,未經(jīng)王永恒許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310328471.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 節(jié)目收視信息的處理方法和處理系統(tǒng)
- 一種用于識(shí)別收視人員的收視儀
- 一種嵌入式收視儀系統(tǒng)
- 基于IPTV的收視評(píng)估方法及系統(tǒng)
- 一種實(shí)現(xiàn)收視信息處理的方法及裝置
- 廣播電視用戶收視行為預(yù)測(cè)方法及系統(tǒng)
- 收視檢測(cè)方法及裝置
- 收視時(shí)長(zhǎng)的統(tǒng)計(jì)方法及裝置
- 一種用于收視數(shù)據(jù)處理的方法、裝置及系統(tǒng)以及數(shù)據(jù)處理設(shè)備
- 收視行為數(shù)據(jù)的處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





