[發明專利]一種提取論文標題中的問題方法對的方法有效
| 申請號: | 201810219012.1 | 申請日: | 2018-03-16 |
| 公開(公告)號: | CN108460021B | 公開(公告)日: | 2021-10-12 |
| 發明(設計)人: | 趙姝;王炤宇;陳潔;段震;陳喜;張燕平 | 申請(專利權)人: | 安徽大學 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/253 |
| 代理公司: | 合肥市長遠專利代理事務所(普通合伙) 34119 | 代理人: | 段曉微;葉美琴 |
| 地址: | 230000*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提取 論文 標題 中的 問題 方法 | ||
1.一種提取論文標題中的問題方法對的方法,其特征在于,包括:
S1、對論文標題進行標準化處理,在論文標題中進行論文關鍵詞匹配,得到初步問題方法概念集合;
S2、利用黑名單、白名單對初步問題方法概念集合進行調整,得到有效問題方法概念集合;
S3、構建用于分隔問題和方法的目標語法模式集合;
S4、根據目標語法模式集合和有效問題方法概念集合從論文標題中提取出問題概念集合和方法概念集合;
S5、利用笛卡爾積搭配問題概念集合和方法概念集合,得到論文標題中的問題方法對;
步驟S3,具體包括:
S31、獲取語法模式串集合中的一個語法模式串;
S32、解析出該語法模式串包含的語法模式,得到語法模式列表;
S33、重復執行步驟S31、S32,直到語法模式串集合中所有語法模式串均執行步驟S31、S32操作后,合并所有的語法模式列表,得到用于分隔問題和方法的目標語法模式集合,其中,目標語法模式集合包括位置標記和分隔標記,位置標記用于標明該位置所屬的概念屬于問題還是方法;分隔標記用于標明何種語法模式可以用來指示問題和方法的位置;
步驟S4,具體包括:
S41、從目標語法模式集合中抽取所有的分隔標記生成第一列表;
S42、根據一個論文標題中是否含有第一列表中的分隔標記,將語法模式編號按位進行或運算,得到指示符x;
S43、判斷x是否為0,當判斷結果為是時,獲取下一個論文標題,執行S42;否則,執行步驟S44;
S44、從論文標題中按順序抽取出有效問題方法概念集合中的概念和語法模式中的分隔符,生成第二列表,第二列表包括詞組和其類別,其中,類別0表示該組為概念,類別1表示該組為分隔符;
S45、將位置標記初始化為-1,將第二列表位置標記為起始位置;
S46、對于x每一位所代表的每一個語法模式,從語法模式開頭判斷語法模式中的標記是否為位置標記,當判斷結果為是時,執行S47;當判斷結果為否時,執行步驟S48;當到達語法模式結尾時,執行步驟S491;
S47、設置位置標記為語法模式中的位置標記,問題設置為0,方法設置為1,執行步驟S46;
S48、判斷抽取列表位置是否超出抽取列表長度,當判斷結果為是時,獲取下一個個論文標題執行步驟S42;否則,按抽取列表位置從抽取列表中選擇詞組,抽取列表位置自增,執行步驟S49;
S49、判斷詞組是否為概念,若詞組為概念,則按位置標記的指示加入到相應的概念集合中,執行步驟S48;否則,抽取列表位置自增,并判斷分隔標記和分隔符是否一致,若不一致執行步驟S48;若一致,執行步驟S46;
S491、對從當前抽取列表位置到抽取列表結束的每一個概念詞組,按位置標記的指示加入到相應的問題概念集合或方法概念集合。
2.根據權利要求1所述的提取論文標題中的問題方法對的方法,其特征在于,步驟S1,具體包括:
S11、將論文標題文本轉換為小寫,并對其進行分詞、詞性標注和詞性還原;
S12、在論文標題中進行論文關鍵詞匹配,得到初步問題方法概念集合。
3.根據權利要求1所述的提取論文標題中的問題方法對的方法,其特征在于,步驟S2,具體包括:
S21、根據預設的停用概念列表建立黑名單,根據預設的定向抽取概念列表建立白名單;
S22、從初步問題方法概念集合中刪除黑名單中的概念,得到微調初步問題方法概念集合;
S23、向微調初步問題方法概念集合中添加白名單中的概念,得到有效問題方法概念集合。
4.根據權利要求1所述的提取論文標題中的問題方法對的方法,其特征在于,步驟S5,具體包括:
S51、判斷問題概念集合是否不為空,當判斷結果為是時,執行步驟S52;否則,執行步驟S53;
S52、判斷方法概念集合是否不為空,當判斷結果為是時,執行步驟S54;否則,執行步驟S55;
S53、判斷方法概念集合是否不為空,當判斷結果為是時,對方法概念集合中的每一個方法利用笛卡爾積搭配問題“*”,結束;否則,執行步驟S56;
S54、對問題概念集合中的每一個問題利用笛卡爾積搭配方法概念集合中的每一個方法,結束;
S55、對問題概念集合中的每一個問題利用笛卡爾積搭配方法“*”,結束;
S56、返回空集,結束。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽大學,未經安徽大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810219012.1/1.html,轉載請聲明來源鉆瓜專利網。





