[發明專利]閱讀機器人的標題選擇方法及系統有效
| 申請號: | 201711092902.2 | 申請日: | 2017-11-08 |
| 公開(公告)號: | CN107832295B | 公開(公告)日: | 2021-06-04 |
| 發明(設計)人: | 李茹;關勇;郭少茹;張旗;王智強;柴清華 | 申請(專利權)人: | 山西大學 |
| 主分類號: | G06F40/258 | 分類號: | G06F40/258 |
| 代理公司: | 蘇州市中南偉業知識產權代理事務所(普通合伙) 32257 | 代理人: | 李廣 |
| 地址: | 030006 山*** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 閱讀 機器人 標題 選擇 方法 系統 | ||
本發明屬于自然語言處理研究領域,具體公開了一種閱讀機器人的標題選擇方法及系統;包括如下步驟:一、篇章要點抽取單元;二、標題與篇章要點相關性分析單元;三、標題結構單元;四、相關度矩陣和標題結構融合單元;五、答案選取單元,對選項進行排序,選取最適合的答案。本發明首次提出了標題與篇章要點相關性分析方法,該方法通過分析標題與篇章要點的相關性,構建了基于標題和篇章要點的相關度矩陣,在此基礎上融入標題結構特征,選取與篇章最相關的標題。本方法遵循解題規律,解決了閱讀機器人的標題選擇題目解答的問題。本發明有效填補了中文閱讀理解標題選擇題型智能解答方面的空白。
技術領域
本發明屬于自然語言處理研究領域,具體地說,涉及一種閱讀機器人的標題選擇方法及系統。
背景技術
閱讀機器人的研發近年來已經成為一個研究熱點,受到國內外學者、公司越來越多的關注,并取得了良好的發展。
2011年,IBM超級電腦(Watson)在智力競猜節目(Jeopardy)中戰勝了該節目中最杰出的兩位人類選手。日本國立情報學研究所(National Institute of Informatics)開發的人工智能機器人Todai Robot已經可以通過大學入學考試,在2015年的日本大學入學考試中,Todai Robot取得了511分,比考生平均分高出90多分。2016年,谷歌人工智能機器人“AlphaGo”以總比分4比1的成績戰勝人類代表圍棋九段棋手李世石。
上述閱讀機器人系統中問題求解都有大量的詞典、語法、資料等組成知識庫作為支撐,許多問題的分析、解答工作都是基于知識庫的查找和檢索。閱讀機器人的智能解答仍然是一個巨大的挑戰,并且在中文閱讀理解標題選擇題型智能解答方面仍然是一個空白。目前,針對閱讀機器人的閱讀理解任務,提出的相關技術可以分為兩種:基于特征的方法和基于深度學習的方法。
基于特征的方法通常使用特征工程、語言工具、外部資源來解決這類問題。例如:郭少茹.面向高考閱讀理解的句子語義相關度,清華大學學報自然科學版,2017,57(6):575-579.針對高考語文中科技文題型進行分析,提出一種多維度投票算法,該算法將Word2Vec,HowNet,詞袋模型,框架語義場景四個方面作為度量標準,運用投票算法的思想,選取最佳答案。李茹.閱讀理解答案預測[J/OL].山西大學學報(自然科學版):1-8.(2017-05-27)[2017-09-28].針對高考語文閱讀理解,通過對篇章、題干、選項三者的關系進行建模,制定聯合打分函數,加入句子相似度特征、反義匹配特征、否定特征三個語義特征信息,提出基于題干與選項一致性判別模型。
基于深度學習的方法主要是通過構建神經網絡模型,在基于詞向量表示基礎上,利用深度神經網絡模型學習句子的向量表示,然后把任務轉換成一個分類或排序問題。例如:Wenpeng Yin.Attention-Based Convolutional Neural Network for MachineComprehension[EB/OL].[2016].http://arxiv.org/abs/1602.04341.針對機器理解任務,構建一個基于Attention機制的分層的卷積神經網絡模型,通過對文章、問題、答案進行建模,發現與回答問題相關的關鍵短語、關鍵句和關鍵片斷。Iyyer M.A Neural Network forFactoid Question Answering over Paragraphs[C]//EMNLP.2014:633-644.針對閱讀理解任務提出了一個循環神經網絡模型,學習詞和短語的向量表示進行實體推理,并用邏輯回歸分類器對篇章預測類別,類別標簽就是問題的答案。
基于特征的方法需要人工構建大量不同的特征,耗費大量的時間,而基于端到端的神經網絡模型雖然可以自動學習特征,但是由于數據的稀疏性、問題的復雜性,效果提升不是很明顯。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山西大學,未經山西大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711092902.2/2.html,轉載請聲明來源鉆瓜專利網。





