[發(fā)明專利]基于推薦系統(tǒng)的互動繪本生成系統(tǒng)在審
| 申請?zhí)枺?/td> | 201710593429.X | 申請日: | 2017-07-20 |
| 公開(公告)號: | CN107506377A | 公開(公告)日: | 2017-12-22 |
| 發(fā)明(設(shè)計)人: | 曹先;宋佳慧;陳杰;戴舟 | 申請(專利權(quán))人: | 南開大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 天津耀達律師事務(wù)所12223 | 代理人: | 侯力 |
| 地址: | 300071*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 推薦 系統(tǒng) 互動 生成 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于圖書及教育領(lǐng)域,特別涉及一種基于短文本語義相似度計算的繪本資源推薦方法,以及基于推薦系統(tǒng)的互動繪本生成系統(tǒng)。
背景技術(shù)
繪本是以圖文并茂的形式的少兒圖書。繪本的主要特色是提供讀者在視覺方面的真實的或是美感的經(jīng)驗,現(xiàn)已廣泛用于教育領(lǐng)域。
繪本的內(nèi)容常具有簡單的故事大綱,有時候也會集中呈現(xiàn)某種簡單的意義和結(jié)構(gòu)。隨著繪本學(xué)習(xí)及個性化需求程度的增加,繪本應(yīng)用于線上線下教育的應(yīng)用逐年增加。傳統(tǒng)繪本內(nèi)容生成完全基于固定的文案及圖片。手工繪制生成故事較為單一,圖片及故事內(nèi)容固定,不能滿足各個年齡段兒童的個性化需求和教育訴求,已不再滿足當(dāng)今個性化教育的趨勢。
國內(nèi)的定制化繪本概念還停留在或者只是簡單地更換姓名、頭像的階段,或者只是簡單地信息展現(xiàn)而不能與繪本內(nèi)容完美結(jié)合,尚沒有類型項目能夠做到將讀者的個人信息直接嵌入繪本內(nèi)容且富于變化的水平。
在文本匹配方面,常通過設(shè)定一定的字段來進行確定性的搜索或采用長文本匹配。繪本圖片資源均配有相應(yīng)的短文本描述信息。這些圖片資源描述及繪本文本資源均屬于一種短文本類型,而短文本的信息處理方法又區(qū)別于長文本的信息處理的一般方法,其最大的不同點在于短文本具有非常稀疏的特征。在短文本上直接應(yīng)用傳統(tǒng)的文本表示模型表現(xiàn)效果不佳。向量空間模型是文本建模一般情況下最常用的模型之一,由于短文本特征稀疏的這一特性,使用原始待測文本的詞語作為特征項使得文本內(nèi)容表現(xiàn)力不足,衡量文本間的相似度效果不佳。
發(fā)明內(nèi)容
本發(fā)明目的是解決繪本信息短文本的特征稀疏造成的相似度計算精度不高的問題,提供一種基于推薦系統(tǒng)的互動繪本生成系統(tǒng)。
本發(fā)明對文本特征使用顯性特征和隱性特征相結(jié)合的方法進行了有效擴展,從而使繪本資源在生成繪本過程中具有更精確的關(guān)聯(lián)性。通過前期繪制和編纂工作,本發(fā)明已經(jīng)擁有大量手繪繪本圖片資源(包含背景,圖片塊等),及大量短文本信息。本系統(tǒng)挖掘這些資源的相關(guān)性將其生成為一本完整的繪本。
基于推薦系統(tǒng)的在繪本生成系統(tǒng)中運用兼容內(nèi)容搜索、語義分析、邏輯匹配、大數(shù)據(jù)分析的智能文檔格式對繪本進行在線生成。系統(tǒng)采用短文本語義相似度計算及推薦算法對素材庫中文字及圖片源進行推薦,并在線整合資源生成獨一無二的個性化繪本。
本發(fā)明的技術(shù)方案:
基于推薦系統(tǒng)的互動繪本生成系統(tǒng),主要包括用戶信息采集模塊、繪本資源管理模塊、繪本資源推薦模塊和繪本生成模塊;
用戶信息采集模塊,通過收集用戶在平臺交互的信息,完成用戶信息的存儲與交互;
繪本資源管理模塊,管理所有繪本資源信息的增刪和更新,繪本資源包含圖片及文本兩個部分,每部分資源均有200字以內(nèi)的短文本對資源進行相應(yīng)的描述;具體包含繪本背景資源、繪本圖片塊資源、繪本短文本資源和繪本故事線資源;該模塊極大地方便了大量繪本資源的維護和管理;
繪本資源推薦模塊,通過與前兩個模塊的交互,完成對特定用戶繪本資源的推薦工作;
繪本生成模塊,將繪本資源進行整合拼接,根據(jù)其坐標(biāo)的動態(tài)調(diào)整和內(nèi)容的適配,完成最終的個性化繪本。
所述繪本資源推薦模塊提供了一種為用戶提供個性化繪本資源的基于短文本語義相似度計算的繪本資源推薦方法。該方法針對繪本信息的短文本的特征稀疏造成的相似度計算精度不高的缺點對繪本資源相關(guān)文本特征使用顯性特征和隱性特征相結(jié)合的方法進行了有效擴展,從而使繪本資源在應(yīng)用過程中具有更精確的關(guān)聯(lián)性,在資源推薦應(yīng)用中的體驗得到優(yōu)化。該方法通過采集用戶在平臺的行為產(chǎn)生的相關(guān)短文本數(shù)據(jù),對該類數(shù)據(jù)進行數(shù)據(jù)清洗后,基于短文本語義相似度計算的方法將用戶交互信息特征和繪本資源文本特征兩部分進行相似度計算,從而推薦出最優(yōu)的繪本資源即繪本文本及圖片資源,然后存入數(shù)據(jù)庫中組成該用戶的繪本資源庫用于后續(xù)定制化繪本的生成,以減少操作人員負擔(dān),滿足用戶個性化定制化的需求。
基于短文本語義相似度計算的繪本資源推薦方法,包括以下步驟:
第1、資源推薦開始;
第2、讀取用戶基本信息及相關(guān)短文本信息;
第3、用戶信息與背景資源計算文本相似度進行匹配;
第4、用戶信息與圖片塊資源計算文本相似度進行匹配;
第5、用戶信息與文本資源計算文本相似度進行匹配;
第6、檢查第3步至第5步三步匹配結(jié)果是否符合相關(guān)性,經(jīng)過人工校驗后判斷是否符合邏輯關(guān)聯(lián),若為否則返回第3步進行循環(huán),若為是將匹配資源存儲至數(shù)據(jù)庫,進行下一步;
第7、結(jié)束。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南開大學(xué),未經(jīng)南開大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710593429.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





