[發明專利]目標對象的關鍵信息的提取方法、裝置、介質及電子設備在審
| 申請號: | 202011272208.0 | 申請日: | 2020-11-13 |
| 公開(公告)號: | CN112288548A | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 李浩然 | 申請(專利權)人: | 北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06;G06F40/242;G06F40/194 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 孫寶海;袁禮君 |
| 地址: | 100176 北京市大興區北京經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 對象 關鍵 信息 提取 方法 裝置 介質 電子設備 | ||
本發明實施例提供了一種目標對象的關鍵信息的提取方法、裝置、介質和電子設備,所述提取方法包括以下步驟:步驟S1,獲取第一語句集合;步驟S2,對所述第一語句集合中的各個語句按照設定的評分策略進行評分;步驟S3,根據各個語句對應的評分分數選取所述第一語句集合中評分分數最最高的目標語句,將所述目標語句加入到第二語句集合;步驟S4,重復執行步驟S2和S3循環,直到所述步驟S3選取的目標語句包含的詞的數量大于等于設定的第一閾值;步驟S5,將步驟S4得到的所述第二語句集合中的目標語句作為所述目標對象的關鍵信息。本發明實施例的技術方案可以得到較為精準的目標對象的關鍵信息。
技術領域
本發明涉及計算機技術領域,具體而言,涉及一種目標對象的關鍵信息的提取方法、裝置、計算機可讀存儲介質及電子設備。
背景技術
在商品營銷等場景下,需要對商品的關鍵信息進行提取,例如從商品的詳細文本介紹中抽取關鍵文本。具體來說,商品的詳細文本可以來自于商品的詳情頁圖片,將該商品的詳情頁圖片中的文本識別出來后,在這些大批量的文本中提取關鍵的文本,用于表示這個商品的特點。這些關鍵的文本信息還可以用于下游任務,例如商品營銷文本自動生成以及電商客服問答與對話。
商品的關鍵信息提取任務實際上一個抽取式自動摘要任務,即在輸入文本中按照某些需求抽取出一些文本,作為輸出的摘要文本。
在針對商品營銷文本自動生成的下游任務中,需要抽取出來的摘要針對性較強,從而使得商品更加具有吸引力,但是傳統的抽取式自動摘要技術不能夠滿足商品營銷文本自動生成的任務需求。
如何較為精準地抽取目標對象的關鍵信息是當前亟需解決的技術問題。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本發明的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
本發明實施例的目的在于提供一種目標對象的關鍵信息的提取方法、裝置、計算機可讀存儲介質及電子設備,進而至少在一定程度上較為精準地抽取目標對象的關鍵信息。
本發明的其他特性和優點將通過下面的詳細描述變得顯然,或部分地通過本發明的實踐而習得。
根據本發明實施例的第一方面,提供一種目標對象的關鍵信息的提取方法,所述提取方法包括以下步驟:步驟S1,獲取第一語句集合,所述第一語句集合由對所述目標對象的圖像進行識別得到的語句組成;步驟S2,對所述第一語句集合中的各個語句按照設定的評分策略進行評分,得到評分分數;步驟S3,根據各個語句對應的評分分數選取所述第一語句集合中評分分數最最高的目標語句,將所述目標語句從所述第一語句集合中刪除并加入到第二語句集合;步驟S4,以依次執行的步驟S2、步驟S3作為一個循環,重復執行所述循環,直到所述步驟S3選取的目標語句包含的詞的數量大于等于設定的第一閾值;步驟S5,將步驟S4得到的所述第二語句集合中除最末次執行步驟S3得到的目標語句以外的目標語句作為所述目標對象的關鍵信息。
在一些實施例中,所述步驟S1之前,所述提取方法還包括:通過OCR技術對所述目標對象的圖像進行文本識別,得到所述第一語句集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司,未經北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011272208.0/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





