[發(fā)明專利]基于眼球跟蹤的英文文本自動(dòng)摘要方法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 200910096060.7 | 申請(qǐng)日: | 2009-02-06 |
| 公開(kāi)(公告)號(hào): | CN101567004A | 公開(kāi)(公告)日: | 2009-10-28 |
| 發(fā)明(設(shè)計(jì))人: | 徐頌華;江浩;劉智滿 | 申請(qǐng)(專利權(quán))人: | 浙江大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 | 代理人: | 杜 軍 |
| 地址: | 310027浙*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 眼球 跟蹤 英文 文本 自動(dòng) 摘要 方法 | ||
1.基于眼球跟蹤的英文文本自動(dòng)摘要方法,其特征在于該方法的具 體步驟是:
步驟1)獲取用戶在閱讀電子文檔時(shí)對(duì)文中所有詞的關(guān)注時(shí)間,具體 方法是:
(a)將文中所有詞的用戶關(guān)注時(shí)間初始化為0;
(b)每間隔0.1秒,通過(guò)眼球跟蹤儀或攝像頭獲取到用戶眼球在屏幕 上的聚焦位置(x,y);
(c)文中的每個(gè)詞wi在當(dāng)前屏幕上的位置為(xi,yi),則該詞在間隔 時(shí)刻后,其用戶關(guān)注時(shí)間的增加量AT(wi)為:
其中kx和ky分別是文中每個(gè)詞在屏幕上的平均寬度和平均高度;
(d)重復(fù)步驟(b)和(c)至用戶閱讀完該電子文檔,獲得文中每個(gè)詞的 用戶關(guān)注時(shí)間;
步驟2)基于文本相似度預(yù)測(cè)文中所有句子的用戶興趣度,具體方法 是:
(e)計(jì)算文中任意兩個(gè)詞wi和wj之間的語(yǔ)義相似度Sim(wi,wj);該 相似度是一個(gè)取值范圍在[0,1]之間的實(shí)數(shù);
(f)對(duì)文檔中的任意詞w,挑選出文檔中與其相似度最大的k個(gè)詞,k 取值為min(10,n),其中n是文檔中所有不同詞的個(gè)數(shù);設(shè)定挑選出的k 個(gè)詞為w1,w2,…,wk,通過(guò)式(1)預(yù)測(cè)詞w的用戶興趣度:
其中γ為常量、ε為正整數(shù)常量,函數(shù)δ(,)定義為:
(g)文檔中的任意句子s中所有不同單詞的用戶興趣度之和為該句子 的用戶興趣度I(s);
步驟3)利用用戶興趣度結(jié)合文本自動(dòng)摘要算法生成個(gè)性化的自動(dòng)摘 要結(jié)果,具體方法是:
(h)設(shè)定用戶需要的文本摘要長(zhǎng)度為文檔長(zhǎng)度的c%,利用基于語(yǔ)義分 析的文本自動(dòng)摘要算法得到壓縮率為c%的文本摘要結(jié)果;
(i)對(duì)文檔中的每個(gè)句子s,計(jì)算其用戶興趣度的偏移量Ioffset(s):
其中I(si)為句子si的用戶興趣度,s1,s2,…,sm為文檔中所有的句子, m為文檔中的句子總數(shù);如果句子s出現(xiàn)在步驟(h)所得到的摘要結(jié)果 中,則λ(s)取值為1;如果句子s未出現(xiàn)在步驟(h)所得到的摘要結(jié)果 中,則λ(s)取值為0;k為自由參數(shù),取值范圍為0~1;
(j)計(jì)算文檔中的每個(gè)句子s調(diào)整后的用戶興趣度Iadj(s):
Iadj(s)=I(s)+Ioffset(s)
(k)對(duì)文檔中的所有句子s按其調(diào)整后的用戶興趣度從高到低選出前 c%的句子作為該文檔的摘要結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910096060.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 移動(dòng)通信系統(tǒng)中標(biāo)準(zhǔn)接口的消息跟蹤方法及其系統(tǒng)
- 網(wǎng)絡(luò)跟蹤系統(tǒng)及跟蹤控制方法
- 同步跟蹤自動(dòng)調(diào)節(jié)裝置
- 業(yè)務(wù)信令跟蹤方法、系統(tǒng)及裝置
- 超聲波診斷裝置
- 一種自動(dòng)跟蹤方法、自動(dòng)跟蹤設(shè)備及自動(dòng)跟蹤系統(tǒng)
- 多目標(biāo)跟蹤方法、系統(tǒng)、計(jì)算設(shè)備及存儲(chǔ)介質(zhì)
- 一種軌跡跟蹤方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種目標(biāo)跟蹤方法、裝置及存儲(chǔ)介質(zhì)
- 信號(hào)跟蹤方法、濾波方法、裝置及醫(yī)療設(shè)備





