[發(fā)明專利]一種基于人工智能專家系統(tǒng)的摘要提取方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202010586099.3 | 申請(qǐng)日: | 2020-06-24 |
| 公開(公告)號(hào): | CN111767394A | 公開(公告)日: | 2020-10-13 |
| 發(fā)明(設(shè)計(jì))人: | 李冰;晏欣衛(wèi);王蔚 | 申請(qǐng)(專利權(quán))人: | 中國(guó)工商銀行股份有限公司 |
| 主分類號(hào): | G06F16/34 | 分類號(hào): | G06F16/34;G06F40/211;G06F16/33;G06N5/02 |
| 代理公司: | 北京三友知識(shí)產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 王濤;任默聞 |
| 地址: | 100140 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 人工智能 專家系統(tǒng) 摘要 提取 方法 裝置 | ||
一種基于人工智能專家系統(tǒng)的摘要提取方法及裝置,所述方法包括:對(duì)獲取的待處理資訊文本進(jìn)行依存句法分析,得到資訊初始詞素;將所述資訊初始詞素輸入至預(yù)先訓(xùn)練得到的專家知識(shí)庫(kù)模型得到資訊關(guān)鍵詞素;根據(jù)所述資訊關(guān)鍵詞素得到對(duì)應(yīng)句子的句子向量;根據(jù)所述句子向量計(jì)算對(duì)應(yīng)的句子的權(quán)重;根據(jù)所述權(quán)重篩選出預(yù)設(shè)數(shù)量的句子,組成摘要文本。本申請(qǐng)能夠快速、精準(zhǔn)地自動(dòng)提取資訊文本摘要的方法,彌補(bǔ)了人工提取摘要的不足,能夠?qū)①Y訊文本的摘要快速、精準(zhǔn)地展示或推送給讀者,從而提升讀者的閱讀效率。
技術(shù)領(lǐng)域
本申請(qǐng)涉及人工智能領(lǐng)域,具體的是一種基于人工智能專家系統(tǒng)的摘要提取方法及裝置。
背景技術(shù)
人工智能專家系統(tǒng)是一個(gè)智能計(jì)算機(jī)程序系統(tǒng),其內(nèi)部含有大量的某個(gè)領(lǐng)域?qū)<宜降闹R(shí)與經(jīng)驗(yàn),能夠利用人類專家的知識(shí),模擬人類專家解決問(wèn)題的方法來(lái)處理該領(lǐng)域的問(wèn)題。
文本摘要技術(shù)能夠?qū)Y訊文本進(jìn)行信息壓縮,從而提取出資訊文本中比較重要的信息,以摘要的形式展現(xiàn)給讀者。由于摘要往往較為簡(jiǎn)短,從而能夠提高讀者獲取信息的效率。
目前,很多情況下,資訊文本僅包含正文,不包含摘要。對(duì)于需要做資訊文本信息推送的場(chǎng)景來(lái)說(shuō),制作摘要成為必須。然而,在現(xiàn)有技術(shù)中,摘要的制作往往依靠人工操作實(shí)現(xiàn),耗時(shí)耗力,受主觀因素影響大,信息推送的時(shí)效性也難以保證。因此,急需一種能夠快速、精準(zhǔn)地自動(dòng)提取資訊文本摘要的方法,彌補(bǔ)人工提取摘要的不足,將資訊文本的摘要快速、精準(zhǔn)地展示或推送給讀者,提升讀者的閱讀效率。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中存在的問(wèn)題,本申請(qǐng)?zhí)峁┮环N基于人工智能專家系統(tǒng)的摘要提取方法,能夠快速、精準(zhǔn)地提取資訊文本的摘要,以便展示或推送給讀者,從而提升讀者的閱讀效率。
為解決上述技術(shù)問(wèn)題,本申請(qǐng)?zhí)峁┮韵录夹g(shù)方案:
第一方面,本申請(qǐng)?zhí)峁┮环N基于人工智能專家系統(tǒng)的摘要提取方法,包括:
對(duì)獲取的待處理資訊文本進(jìn)行依存句法分析,得到資訊初始詞素;
將所述資訊初始詞素輸入至預(yù)先訓(xùn)練得到的專家知識(shí)庫(kù)模型,得到資訊關(guān)鍵詞素;
根據(jù)所述資訊關(guān)鍵詞素得到對(duì)應(yīng)句子的句子向量;
根據(jù)所述句子向量計(jì)算對(duì)應(yīng)的句子的權(quán)重;
根據(jù)所述權(quán)重篩選出預(yù)設(shè)數(shù)量的句子,組成摘要文本。
進(jìn)一步地,預(yù)先訓(xùn)練得到專家知識(shí)庫(kù)模型的步驟包括:
利用獲取的歷史資訊文本對(duì)CBOW模型進(jìn)行訓(xùn)練,得到所述專家知識(shí)庫(kù)模型。
進(jìn)一步地,所述將所述資訊初始詞素輸入至預(yù)先訓(xùn)練得到的專家知識(shí)庫(kù)模型,得到資訊關(guān)鍵詞素,包括:
根據(jù)摘要提取需求構(gòu)建規(guī)則庫(kù),所述規(guī)則庫(kù)存儲(chǔ)了用于增強(qiáng)或過(guò)濾所述資訊初始詞素的規(guī)則;
利用所述專家知識(shí)庫(kù)模型對(duì)所述資訊初始詞素進(jìn)行分析,得到資訊初始關(guān)鍵詞素;
根據(jù)所述規(guī)則庫(kù)中的規(guī)則對(duì)所述資訊初始關(guān)鍵詞素進(jìn)行信息處理,得到最終的所述資訊關(guān)鍵詞素。
進(jìn)一步地,所述根據(jù)所述資訊關(guān)鍵詞素得到對(duì)應(yīng)句子的句子向量,包括:
將獲取的歷史資訊文本輸入至word2vec模型,得到詞向量;
從所述詞向量中選擇所述資訊關(guān)鍵詞素對(duì)應(yīng)的詞向量;
將所述資訊關(guān)鍵詞素對(duì)應(yīng)的詞向量組成句子;
將各句子中所述資訊關(guān)鍵詞素對(duì)應(yīng)的詞向量分別進(jìn)行累加平均計(jì)算,得到所述資訊關(guān)鍵詞素對(duì)應(yīng)句子的句子向量。
進(jìn)一步地,所述根據(jù)所述句子向量計(jì)算對(duì)應(yīng)的句子的權(quán)重,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)工商銀行股份有限公司,未經(jīng)中國(guó)工商銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010586099.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 使用基于云端的度量迭代訓(xùn)練人工智能的系統(tǒng)
- 一種人工智能轉(zhuǎn)人工智能再轉(zhuǎn)人工方案
- O-RAN系統(tǒng)中的人工智能模型處理方法和裝置
- 人工智能傷口評(píng)估方法及智能終端
- 人工智能倫理風(fēng)險(xiǎn)與防范虛擬仿真方法、系統(tǒng)和機(jī)器人
- 一種基于人工智能基礎(chǔ)資源與技術(shù)調(diào)控系統(tǒng)及方法
- 基于人工智能倫理備選規(guī)則的人工智能倫理風(fēng)險(xiǎn)防范方法
- 人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范虛擬仿真實(shí)驗(yàn)方法和機(jī)器人
- 基于人工智能體決策的人工智能倫理風(fēng)險(xiǎn)辨識(shí)和防范方法
- 基于算法選擇的人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范方法和機(jī)器人
- 一種基于即時(shí)消息的肝病專家系統(tǒng)
- 專家系統(tǒng)開發(fā)平臺(tái)
- 基于電網(wǎng)故障智能識(shí)別及治理系統(tǒng)的故障信息傳送方法
- 基于Web的汽車遠(yuǎn)程故障診斷專家系統(tǒng)
- 一種基于Weka軟件的專家系統(tǒng)知識(shí)獲取方法
- 一種基于繼承模式的故障診斷專家系統(tǒng)及故障診斷方法
- 端到端云服務(wù)的專家系統(tǒng)及其數(shù)據(jù)挖掘方法
- 一種基于專家系統(tǒng)的多客戶端智慧水務(wù)管理平臺(tái)
- 專家系統(tǒng)的更新方法、業(yè)務(wù)處理方法及裝置
- 專家系統(tǒng)的更新方法、業(yè)務(wù)處理方法及裝置





