[發(fā)明專利]用于更新信息的方法及裝置在審
| 申請?zhí)枺?/td> | 201810998037.6 | 申請日: | 2018-08-29 |
| 公開(公告)號: | CN109254973A | 公開(公告)日: | 2019-01-22 |
| 發(fā)明(設(shè)計)人: | 伍志鵬;王志華;楊天行 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F16/23 | 分類號: | G06F16/23;G06F17/27 |
| 代理公司: | 北京英賽嘉華知識產(chǎn)權(quán)代理有限責(zé)任公司 11204 | 代理人: | 王達(dá)佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 詞條 初始信息 更新信息 待處理信息 獲取信息 匹配結(jié)果 預(yù)先獲取 排序 匹配 更新 申請 | ||
本申請實施例公開了用于更新信息的方法及裝置。該方法的一具體實施方式包括:從待處理信息中獲取至少一條主體名稱詞條;對于上述至少一條主體名稱詞條中的主體名稱詞條,將該主體名稱詞條與預(yù)先獲取的至少一條初始信息源主體名稱詞條進(jìn)行匹配,并根據(jù)匹配結(jié)果為該主體名稱詞條設(shè)置權(quán)值;根據(jù)權(quán)值對上述至少一條主體名稱詞條中主體名稱詞條和上述至少一條初始信息源主體名稱詞條中初始信息源主體名稱詞條進(jìn)行排序,得到更新后的至少一條初始信息源主體名稱詞條。該實施方式提高了用戶獲取信息的準(zhǔn)確性和效率。
技術(shù)領(lǐng)域
本申請實施例涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及用于更新信息的方法及裝置。
背景技術(shù)
隨著信息化程度的提高,多個領(lǐng)域都積累了海量的數(shù)據(jù),網(wǎng)絡(luò)小說就屬于其中的一個領(lǐng)域。通常,網(wǎng)絡(luò)小說可以在不同的時間、按照小說內(nèi)容的先后順序發(fā)布在網(wǎng)絡(luò)上。用戶通過網(wǎng)絡(luò)可以獲取到網(wǎng)絡(luò)小說最新發(fā)布的小說內(nèi)容。
發(fā)明內(nèi)容
本申請實施例提出了用于更新信息的方法及裝置。
第一方面,本申請實施例提供了一種用于更新信息的方法,該方法包括:從待處理信息中獲取至少一條主體名稱詞條;對于上述至少一條主體名稱詞條中的主體名稱詞條,將該主體名稱詞條與預(yù)先獲取的至少一條初始信息源主體名稱詞條進(jìn)行匹配,并根據(jù)匹配結(jié)果為該主體名稱詞條設(shè)置權(quán)值,其中,上述初始信息源主體名稱詞條和待處理信息與同一信息源對應(yīng),上述權(quán)值用于表征主體名稱詞條對應(yīng)的主體為上述信息源的信息源主體的概率;根據(jù)權(quán)值對上述至少一條主體名稱詞條中主體名稱詞條和上述至少一條初始信息源主體名稱詞條中初始信息源主體名稱詞條進(jìn)行排序,得到更新后的至少一條初始信息源主體名稱詞條。
在一些實施例中,上述從待處理信息中獲取至少一條主體名稱詞條,包括:查詢上述待處理信息中語句的語法關(guān)系;根據(jù)語法關(guān)系對上述待處理信息包含的語句進(jìn)行修正,得到更新待處理信息;對上述更新待處理信息進(jìn)行信息提取,得到至少一條主體名稱詞條。
在一些實施例中,上述根據(jù)語法關(guān)系對上述待處理信息包含的語句進(jìn)行修正,得到更新待處理信息,包括:查詢上述待處理信息中的至少一條待處理語句,上述待處理語句為缺少主體名稱詞條的語句;對于上述至少一條待處理語句中的待處理語句,根據(jù)對應(yīng)該待處理語句的語法關(guān)系為該待處理語句增加主體名稱詞條,得到修正后的更新待處理信息。
在一些實施例中,上述根據(jù)對應(yīng)該待處理語句的語法關(guān)系為該待處理語句增加主體名稱詞條,包括:根據(jù)該語法關(guān)系為該待處理語句添加對應(yīng)的主體名稱詞條。
在一些實施例中,上述待處理語句包含主體名稱代詞,以及,上述根據(jù)對應(yīng)該待處理語句的語法關(guān)系為該待處理語句增加主體名稱詞條,包括:根據(jù)該語法關(guān)系將該待處理語句中的主體名稱代詞替換為對應(yīng)的主體名稱詞條。
在一些實施例中,上述初始信息源主體名稱詞條通過以下步驟獲?。簭墨@取的待處理摘要信息中獲取至少一條初始主體名稱詞條;對于上述至少一條初始主體名稱詞條中初始主體名稱詞條,確定該初始主體名稱詞條在上述待處理摘要信息中出現(xiàn)的次數(shù),并根據(jù)該次數(shù)為該初始主體名稱詞條設(shè)置初始權(quán)值;根據(jù)初始權(quán)值從上述至少一條初始主體名稱詞條中確定至少一條初始信息源主體名稱詞條。
第二方面,本申請實施例提供了一種用于更新信息的裝置,該裝置包括:主體名稱詞條提取單元,被配置成從待處理信息中獲取至少一條主體名稱詞條;權(quán)值設(shè)置單元,對于上述至少一條主體名稱詞條中的主體名稱詞條,被配置成將該主體名稱詞條與預(yù)先獲取的至少一條初始信息源主體名稱詞條進(jìn)行匹配,并根據(jù)匹配結(jié)果為該主體名稱詞條設(shè)置權(quán)值,其中,上述初始信息源主體名稱詞條和待處理信息與同一信息源對應(yīng),上述權(quán)值用于表征主體名稱詞條對應(yīng)的主體為上述信息源的信息源主體的概率;信息更新單元,被配置成根據(jù)權(quán)值對上述至少一條主體名稱詞條中主體名稱詞條和上述至少一條初始信息源主體名稱詞條中初始信息源主體名稱詞條進(jìn)行排序,得到更新后的至少一條初始信息源主體名稱詞條。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810998037.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





