[發(fā)明專(zhuān)利]基于眼動(dòng)儀的高質(zhì)量用戶生成內(nèi)容的識(shí)別方法和系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202110099262.8 | 申請(qǐng)日: | 2021-01-25 |
| 公開(kāi)(公告)號(hào): | CN113011244A | 公開(kāi)(公告)日: | 2021-06-22 |
| 發(fā)明(設(shè)計(jì))人: | 谷煒;張婷婷;金家華;石美珠 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京科技大學(xué) |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00;G06K9/20;G06F40/109 |
| 代理公司: | 北京久誠(chéng)知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 11542 | 代理人: | 翟麗紅 |
| 地址: | 100083*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 眼動(dòng)儀 質(zhì)量 用戶 生成 內(nèi)容 識(shí)別 方法 系統(tǒng) | ||
本發(fā)明提供了一種基于眼動(dòng)儀的高質(zhì)量用戶生成內(nèi)容的識(shí)別方法和系統(tǒng),涉及用戶生成內(nèi)容分類(lèi)技術(shù)領(lǐng)域。本發(fā)明利用眼動(dòng)儀獲取注視區(qū)域,并根據(jù)注視區(qū)域?qū)ξ恼逻M(jìn)行重排版,重排版后的字符更加適配使用場(chǎng)景,能夠使后續(xù)閱讀時(shí)長(zhǎng)的計(jì)時(shí)更加準(zhǔn)確。用戶打開(kāi)文章瀏覽頁(yè)面后,通過(guò)眼動(dòng)儀實(shí)時(shí)獲取用戶的注視區(qū)域,并計(jì)算注視區(qū)域在各個(gè)段落顯示區(qū)域的停留時(shí)長(zhǎng)作為段落的閱讀時(shí)長(zhǎng),再基于所述停留時(shí)長(zhǎng),計(jì)算文章的評(píng)論的可信值B,基于可信值篩選高質(zhì)量評(píng)論;同時(shí)基于所述高質(zhì)量評(píng)論,計(jì)算文章的質(zhì)量值Q,基于質(zhì)量值篩選高質(zhì)量文章,使機(jī)器人和水軍的評(píng)論不會(huì)被收入評(píng)判數(shù)據(jù),最終實(shí)現(xiàn)高準(zhǔn)確度的高質(zhì)量用戶生成內(nèi)容的識(shí)別。
技術(shù)領(lǐng)域
本發(fā)明涉及用戶生成內(nèi)容分類(lèi)技術(shù)領(lǐng)域,具體涉及一種基于眼動(dòng)儀的高質(zhì)量用戶生成內(nèi)容的識(shí)別方法和系統(tǒng)。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展和社交媒體的廣泛應(yīng)用,越來(lái)越多的虛擬社區(qū)建立起來(lái),由用戶創(chuàng)造傳播的信息在網(wǎng)絡(luò)社會(huì)中發(fā)揮著越來(lái)越重要的作用,用戶生成內(nèi)容(UGC,User-Generated Content)成為了Web2.0環(huán)境下眾多學(xué)者的研究熱點(diǎn)。但UGC信息質(zhì)量良莠不齊,需要投入大量的時(shí)間和精力才能從中尋找出高質(zhì)量的UGC信息。
現(xiàn)有的UGC質(zhì)量研究通常僅基于信息質(zhì)量和用戶屬性進(jìn)行識(shí)別。
但上述方法無(wú)法很好應(yīng)對(duì)水軍、機(jī)器人等問(wèn)題,導(dǎo)致高質(zhì)量用戶生成內(nèi)容的識(shí)別準(zhǔn)確度不高。
發(fā)明內(nèi)容
(一)解決的技術(shù)問(wèn)題
針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種基于眼動(dòng)儀的高質(zhì)量用戶生成內(nèi)容的識(shí)別方法和系統(tǒng),解決了現(xiàn)有高質(zhì)量用戶生成內(nèi)容識(shí)別方法無(wú)法很好應(yīng)對(duì)水軍、機(jī)器人的問(wèn)題。
(二)技術(shù)方案
為實(shí)現(xiàn)以上目的,本發(fā)明通過(guò)以下技術(shù)方案予以實(shí)現(xiàn):
第一方面,提供了一種基于眼動(dòng)儀的高質(zhì)量用戶生成內(nèi)容的識(shí)別方法,該方法包括:
基于上傳的文章,獲取所述文章的段落信息其中,表示第n個(gè)段落的字符信息,N表示文章的總段落數(shù)量;
基于眼動(dòng)儀獲取的注視區(qū)域,計(jì)算各個(gè)段落的重排版信息Set={s1,s2,…,sn,…,sN};
其中,表示第n個(gè)段落的重排版信息,dp表示段落間距,sizeword表示字符尺寸,numcpl表示每行預(yù)設(shè)字符數(shù),表示第n個(gè)段落的行數(shù),表示第n個(gè)段落的顯示尺寸;
基于各個(gè)段落的重排版信息,對(duì)所述文章進(jìn)行重排版;
基于重排版后的文章,生成包含多個(gè)段落的段落顯示區(qū)域的文章瀏覽頁(yè)面;所述段落顯示區(qū)域包括第n個(gè)段落在顯示設(shè)備上的位置及尺寸信息;
用戶打開(kāi)文章瀏覽頁(yè)面后,眼動(dòng)儀實(shí)時(shí)獲取用戶的注視區(qū)域,并計(jì)算注視區(qū)域在各個(gè)段落顯示區(qū)域的停留時(shí)長(zhǎng)其中,表示注視區(qū)域在第n個(gè)段落的段落顯示區(qū)域的停留時(shí)長(zhǎng);
基于所述停留時(shí)長(zhǎng),計(jì)算文章的評(píng)論的可信值B,將所述可信值高于第一預(yù)設(shè)閾值的評(píng)論標(biāo)記為高質(zhì)量評(píng)論;
基于所述高質(zhì)量評(píng)論,計(jì)算文章的質(zhì)量值Q,并將所述質(zhì)量值大于第二預(yù)設(shè)閾值的文章標(biāo)記為高質(zhì)量文章。
進(jìn)一步的,所述基于眼動(dòng)儀獲取的注視區(qū)域,計(jì)算第n個(gè)段落的重排版信息包括:
對(duì)注視區(qū)域進(jìn)行圓擬合,獲取注視區(qū)域的中心和直徑R;設(shè)置字符尺寸sizeword中的字符高度pixelh≥R;段落間距dp≥R;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京科技大學(xué),未經(jīng)北京科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110099262.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





