[發明專利]課程先后序計算方法和設備有效
| 申請號: | 201710398841.6 | 申請日: | 2017-05-31 |
| 公開(公告)號: | CN107274077B | 公開(公告)日: | 2020-07-31 |
| 發明(設計)人: | 李涓子;李成江;潘亮銘;唐杰;張鵬 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q50/20;G06F40/30 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王瑩 |
| 地址: | 100084 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 課程 先后 計算方法 設備 | ||
1.一種課程先后序計算方法,其特征在于,包括步驟:
S201、根據輔助語料,獲得第一語料中的概念實體的向量表示;
S202、計算概念實體對之間的語義關系特征、平均位置距離特征、分布不對稱特征和復雜程度距離特征;
S203、根據獲得的概念實體對之間的語義關系特征、平均位置距離特征、分布不對稱特征和復雜程度距離特征,采用隨機森林方法訓練獲得概念的先后序關系;
S204、通過概念實體的先后順序,獲得課程的先后順序;
或課程先后序計算方法包括步驟:
S101、根據輔助語料,獲得第一語料中的概念實體的向量表示;
S102、計算概念實體對之間的復雜程度距離特征;以及計算以下6種特征中的至少5種:語義關系特征、視頻引用距離特征、通用句子引用距離特征、輔助文本引用距離、平均位置距離特征、分布不對稱特征;
S103、根據獲得的概念實體對之間的復雜程度距離特征,以及根據在步驟S102中獲得5種特征,采用隨機森林方法訓練獲得概念的先后序關系;
S104、通過概念實體的先后順序,獲得課程的先后順序;
其中,有序概念實體向量a,b之間的通用句子引用距離特征通過下述方法獲得:GSrd(a,b)=GSrw(b,a)-GSrw(a,b);
Srd(a,b)=Srw(b,a)-Srw(a,b);
其中,D表示輸入的第一語料中的所有課程,C表示第一語料中的某一課程,V表示是課程C的某一視頻字幕,s表示字幕V中的一個句子;r(s,x)∈{0,1}表示概念實體x是否出現在句子s中,出現則r(s,x)的值為1,否則為0;ai∈e1~eM,e1~eM是在輔助語料上與概念實體a語義關系最為接近的M個實體;M為預設值;va、vb分別為a、b的詞向量嵌入表示,ω(a,b)即a和b之間的語義關系特征;GSrd(a,b)即通用句子引用距離特征,GSrw(a,b)即通用句子引用權重,Srw(a,b)即a和b之間的句子引用權重,Srd(a,b)即a和b之間的句子引用距離。
2.根據權利要求1所述的方法,其特征在于,對于有序概念實體向量a,b之間的復雜程度距離特征通過下述方式計算獲得:
Cld(a,b)=avc(a)·ast(a)-avc(b)·ast(b);
其中,max(I(C,a))和min(I(C,a))分別指a在課程C中最后一次和第一次出現的視頻序號;包含概念實體a的課程為C(a),|C(a)|的值等于第一語料中包含概念實體a的課程的個數,|C|的值等于第一語料中課程的個數,Cld(a,b)即復雜程度距離特征,avc(a)和avc(b)分別指a和b的平均視頻覆蓋率,ast(a)和ast(b)分別指a和b的平均覆蓋長度,I(C,a、)指a在課程C中的索引。
3.根據權利要求1所述的方法,其特征在于,對于有序概念實體向量a,b之間的語義關系特征通過下述方式計算獲得:
其中,va、vb分別為a、b的詞向量嵌入表示,ω(a,b)即a和b之間的語義關系特征。
4.根據權利要求1所述的方法,其特征在于,有序概念實體向量a,b之間的視頻引用距離特征通過下述方式獲得:
Vrd(a,b)=Vrw(b,a)-Vrw(a,b);
其中,D表示輸入的第一語料中的所有課程,C表示第一語料中的某一課程,V表示是課程C的某一視頻字幕;f(x,V)表示概念實體x在視頻V中的頻數;r(V,x)表示概念實體x是否出現在視頻V中出現,函數值為1,否則為0;Vrd(a,b)即視頻引用距離特征,Vrw(a,b)即a和b之間的視頻引用權重。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710398841.6/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





