[發(fā)明專利]信息提取方法、模型訓(xùn)練方法及相關(guān)設(shè)備有效
| 申請?zhí)枺?/td> | 202110753704.6 | 申請日: | 2021-07-02 |
| 公開(公告)號: | CN113343714B | 公開(公告)日: | 2022-06-07 |
| 發(fā)明(設(shè)計(jì))人: | 羅通;蔣寧;王洪斌;吳海英 | 申請(專利權(quán))人: | 馬上消費(fèi)金融股份有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/242;G06F40/216;G06F40/211;G06N3/04;G06N3/08 |
| 代理公司: | 北京同立鈞成知識產(chǎn)權(quán)代理有限公司 11205 | 代理人: | 張娜;黃健 |
| 地址: | 401120 重慶市渝北區(qū)*** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信息 提取 方法 模型 訓(xùn)練 相關(guān) 設(shè)備 | ||
本申請實(shí)施例提供一種信息提取方法、模型訓(xùn)練方法及相關(guān)設(shè)備,該方法包括:獲取待處理文本;將所述待處理文本輸入至實(shí)體對象識別模型,輸出所述待處理文本中的N個實(shí)體詞,所述N為正整數(shù);分別將所述N個實(shí)體詞中的每個實(shí)體詞和所述待處理文本作為輸入量輸入至情感信息提取模型,輸出所述N個實(shí)體詞一一對應(yīng)的N個情感信息。采用本申請實(shí)施例提供的方法,提高了在文本中提取情感信息的準(zhǔn)確率。
技術(shù)領(lǐng)域
本申請實(shí)施例涉及自然語言處理技術(shù)領(lǐng)域,尤其涉及一種信息提取方法、模型訓(xùn)練方法及相關(guān)設(shè)備。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,人們既可以通過互聯(lián)網(wǎng)獲取信息資源,也可以針對一些人物、事件、產(chǎn)品等分享一些有價值的信息資源,以便于他人參考。比如,用戶在網(wǎng)絡(luò)上購買某種產(chǎn)品后,可以在網(wǎng)上發(fā)表一些對于產(chǎn)品的評價、使用心得等內(nèi)容,方便其他人更全面的了解產(chǎn)品。或者,針對當(dāng)前熱門事件發(fā)表一些自己的看法等。這些具有主觀色彩的信息通常能在一定程度上反應(yīng)大眾輿論對某一件事情或產(chǎn)品的看法,因此對這些信息資源進(jìn)行情感分析具有非常重要的社會價值。
相關(guān)技術(shù)中,情感分析可以在多個粒度上實(shí)現(xiàn),包括文檔級、語句級和實(shí)體目標(biāo)級。而現(xiàn)有很多應(yīng)用場景都需要在實(shí)體目標(biāo)級別上進(jìn)行更細(xì)致的情感分析。在實(shí)體目標(biāo)級別上進(jìn)行情感分析首先需要使用命名實(shí)體識別模型識別出文本中的實(shí)體目標(biāo),然后依據(jù)實(shí)體詞典、情感詞典和依存句法分析等方法構(gòu)建句法依賴樹,根據(jù)句法依賴樹查找文本中的情感信息。
但是,現(xiàn)有提取情感信息的方法依賴于實(shí)體詞典和情感詞典,僅僅考慮了實(shí)體詞語與文本中每個詞的詞性之間的依存關(guān)系,當(dāng)文本中出現(xiàn)實(shí)體詞典和情感詞典中不包含的新的實(shí)體詞和新的情感詞時,或者,當(dāng)文本中不包含實(shí)體目標(biāo)時,會導(dǎo)致無法從文本中提取出實(shí)體目標(biāo)對應(yīng)有效情感信息或者情感信息提取準(zhǔn)確率非常低。
發(fā)明內(nèi)容
本申請實(shí)施例提供一種信息提取方法、模型訓(xùn)練方法及相關(guān)設(shè)備,以提高情感信息提取準(zhǔn)確率。
第一方面,本申請實(shí)施例提供一種信息提取方法,包括:
獲取待處理文本;
將所述待處理文本輸入至實(shí)體對象識別模型,輸出所述待處理文本中的N個實(shí)體詞,所述N為正整數(shù);
分別將所述N個實(shí)體詞中的每個實(shí)體詞和所述待處理文本作為輸入量輸入至情感信息提取模型,輸出所述N個實(shí)體詞一一對應(yīng)的N個情感信息。
可以看出,在本申請實(shí)施例中,先通過實(shí)體對象識別模型對待處理文本進(jìn)行實(shí)體識別,以識別出該待處理文本中的實(shí)體詞,然后將該待處理文本和識別出的實(shí)體詞一同輸入到情感信息提取模型,使得在進(jìn)行情感信息提取時,能夠從語義的角度找出實(shí)體對應(yīng)的情感信息,進(jìn)而提高情感信息提取的準(zhǔn)確率。另外,由于輸入情感信息提取模型的輸入信息除了實(shí)體詞還有待處理文本,如果實(shí)體對象識別模型沒有識別出實(shí)體詞,情感信息提取模型也能在該文本中提取出情感信息,進(jìn)一步提高了情感信息提取的準(zhǔn)確性。
第二方面,本申請實(shí)施例提供一種模型訓(xùn)練方法,包括:
確定實(shí)體識別訓(xùn)練集和情感信息訓(xùn)練集;所述實(shí)體識別訓(xùn)練集包括多個實(shí)體識別訓(xùn)練樣本,每個實(shí)體識別訓(xùn)練樣本包括一個文本以及所述一個文本的P個實(shí)體詞,所述P為大于或等于1的整數(shù);所述情感信息訓(xùn)練集包括多個情感信息訓(xùn)練樣本,每個情感信息訓(xùn)練樣本包括一個文本、所述一個文本的一個實(shí)體詞以及所述一個實(shí)體詞對應(yīng)的情感信息;
將所述實(shí)體識別訓(xùn)練集輸入至第一神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,得到實(shí)體對象識別模型,以及,將所述情感信息訓(xùn)練集輸入至第二神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到情感信息提取模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于馬上消費(fèi)金融股份有限公司,未經(jīng)馬上消費(fèi)金融股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110753704.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





