[發明專利]用于生成魚骨圖的方法和裝置有效
| 申請號: | 201810750811.1 | 申請日: | 2018-07-10 |
| 公開(公告)號: | CN110706309B | 公開(公告)日: | 2023-05-23 |
| 發明(設計)人: | 沈之銳 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06T11/60 | 分類號: | G06T11/60 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 生成 魚骨 方法 裝置 | ||
本申請實施例公開了用于生成魚骨圖的方法和裝置。該方法的一具體實施方式包括:獲取待處理的論文,其中,論文包括:論文名稱、至少一個論文關鍵詞和至少一個標題;從論文中提取出論文名稱和至少一個論文關鍵詞,基于論文名稱和至少一個論文關鍵詞生成待生成的魚骨圖的魚頭的內容;從論文中提取至少一個標題,基于至少一個標題生成待生成的魚骨圖的魚骨的內容;根據魚頭的內容和魚骨的內容生成魚骨圖。該實施方式能夠以魚骨圖的方式展示論文的主要內容,幫助用戶更快的獲得該論文的重要信息。
技術領域
本申請實施例涉及計算機技術領域,具體涉及用于生成魚骨圖的方法和裝置。
背景技術
目前人們在閱讀論文時,論文都是以整篇或者部分的方式,全篇展示給讀者的。讀者要了解整篇文章的主旨,如果只看摘要,獲得的信息過少,若通讀全文會浪費很多時間。當用戶無法判斷論文中是否會講到自己需要了解的知識點細節時,經常要么必須通讀全文才能知道里面是否有自己需要的知識。要么得不斷向下翻,尋找論文的小標題。標題之間因為有很多文字,經常導致會漏過某些小標題。導致對文章理解不全等等缺陷。如果一篇論文中有很多標題,而里面根本沒有用戶需要的細節信息。讀者跳讀完文章后也浪費了時間。
當前的摘要技術會使論文總結不足,對論文里面知識的展現也不夠,無法一目了然的獲得關于文章的總結性知識。關鍵詞技術雖然簡短,但是卻無法體現關鍵詞之間的結構特點。
發明內容
本申請實施例提出了用于生成魚骨圖的方法和裝置。
第一方面,本申請實施例提供了一種用于生成魚骨圖的方法,包括:獲取待處理的論文,其中,論文包括:論文名稱、至少一個論文關鍵詞和至少一個標題;從論文中提取出論文名稱和至少一個論文關鍵詞,基于論文名稱和至少一個論文關鍵詞生成待生成的魚骨圖的魚頭的內容;從論文中提取至少一個標題,基于至少一個標題生成待生成的魚骨圖的魚骨的內容;根據魚頭的內容和魚骨的內容生成魚骨圖。
在一些實施例中,從論文中提取至少一個標題,包括:對于論文中的至少一行文字中的一行文字,響應于確定出該行文字的格式滿足預定的標題格式,將該行文字確定為標題。
在一些實施例中,至少一個標題包括至少一個一級標題,一級標題對應至少一個二級標題;以及基于至少一個標題生成待生成的魚骨圖的魚骨的內容,包括:對于至少一個一級標題中的一級標題,將該一級標題作為大骨的內容,以及將該一級標題對應的至少一個二級標題作為連接到該大骨的中骨的內容。
在一些實施例中,二級標題對應至少一個三級標題;以及基于至少一個標題生成待生成的魚骨圖的魚骨的內容,還包括:對于至少一個二級標題中的二級標題,將該二級標題對應的至少一個三級標題作為連接到該二級標題對應的中骨的小骨的內容。
在一些實施例中,將該一級標題對應的至少一個二級標題作為連接到該大骨的中骨的內容,包括:響應于確定出該一級標題對應的至少一個二級標題的數量大于預定數量閾值,將該一級標題對應的至少一個二級標題分成至少一個分組,為至少一個分組中的每個分組生成與該一級標題對應的大骨的內容,將同一分組中的二級標題作為連接到同一個大骨的中骨的內容,其中,每個分組中二級標題的數量不大于預定數量閾值。
在一些實施例中,基于至少一個標題生成待生成的魚骨圖的魚骨的內容,包括:對于至少一個標題中的標題,從論文中提取出該標題對應的章節內容,將該標題作為大骨的內容,以及從該標題對應的章節內容中提取關鍵詞作為連接到該標題對應的大骨的中骨的內容。
在一些實施例中,該方法還包括:對于至少一個標題中的標題,響應于確定出該標題的長度大于預設第一長度閾值,將該標題作為魚骨的內容以至少一排的方式顯示。
在一些實施例中,基于至少一個標題生成待生成的魚骨圖的魚骨的內容,包括:對于至少一個標題中的標題,響應于確定出該標題的長度大于預設第二長度閾值,從該標題中抽取出主語作為魚骨的內容,其中,第二長度閾值大于第一長度閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810750811.1/2.html,轉載請聲明來源鉆瓜專利網。





