[發明專利]在內容中添加鏈接的方法和設備有效
| 申請號: | 201310414978.8 | 申請日: | 2013-09-12 |
| 公開(公告)號: | CN103455620A | 公開(公告)日: | 2013-12-18 |
| 發明(設計)人: | 王維維 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 張川緒;薛義丹 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 內容 添加 鏈接 方法 設備 | ||
技術領域
本發明涉及計算機網絡領域。更具體地講,涉及一種在內容中添加鏈接的方法和設備。
背景技術
隨著信息技術的發展,越來越多的內容出現在網絡中,供網絡用戶進行瀏覽。然而,用戶在瀏覽內容時,可能遇到一些不熟悉的信息,或者希望對一些信息做進一步了解。這時,通常需要將這些信息復制或輸入到搜索引擎,然后通過搜索引擎來檢索這些信息。
解決上述問題的一個方案是在內容中對這些信息添加鏈接(例如,超級鏈接),從而用戶可以通過這些鏈接來訪問相應的信息,而不需要另外進行搜索。
然而,在現有技術中,為了在內容中添加鏈接,通常需要人工來完成鏈接的添加,成本較高,并且效率較低。另外,人工添加鏈接受添加操作的執行人員的主觀因素和背景知識的影響也較大,導致添加的鏈接的質量參差不齊,并且無法準確反映網絡用戶對鏈接的一般需要。因此,需要一種能夠在內容中自動添加鏈接并且添加的鏈接能夠反映網絡用戶對鏈接的需要的鏈接添加技術。
發明內容
本發明的目的在于提供一種能夠在內容中自動添加鏈接的技術,從而不要用人工進行鏈接的添加,并且能夠反映網絡用戶對鏈接的需要。
本發明的一方面提供一種在內容中添加鏈接的方法,所述方法包括:對內容進行切詞,以獲得詞語;從獲得的詞語確定待添加鏈接的候選;確定候選的類別;確定候選的上下文模式;當候選的類別與候選的上下文模式對應時,向候選添加鏈接。
可選地,上下文模式是指候選與候選在內容中的上下文之間的語法結構和/或語意結構。
可選地,從獲得的詞語確定待添加鏈接的候選的步驟包括:根據在內容中的原始次序對獲得的詞語進行組合,以得到至少一個第一組合,并且將獲得的各個詞語分別作為一個第一組合;從得到的第一組合之中選擇存在于預定數據庫中的第一組合作為候選。
可選地,從得到的第一組合之中選擇存在于預定數據庫中的第一組合作為候選的步驟還包括:當在選擇的第一組合之中存在位置上重疊的第一組合時,從重疊的第一組合之中選擇最長的第一組合作為候選。
可選地,向候選添加鏈接的步驟包括:當候選的類別與候選的上下文模式對應時,確定候選在內容中的上下文與候選在其他內容中的上下文的相似度;當確定的相似度大于預定閾值時,向候選添加鏈接。
可選地,向候選添加鏈接的步驟還包括:當確定的相似度不大于預定閾值時,不向候選添加鏈接。
可選地,確定候選在內容中的上下文與候選在其他內容中的上下文的相似度的步驟包括:獲取候選在內容中的上下文與候選在其他內容中的上下文的重復詞語;確定每個重復詞語的語意表達能力;確定的語意表達能力之中最高的語意表達能力作為所述相似度。
可選地,所述其他內容具有所述候選并且所述候選已經在所述其他內容中被添加了鏈接。
本發明的另一方面提供一種在內容中添加鏈接的設備,包括:切詞單元,對內容進行切詞,以獲得詞語;候選確定單元,從獲得的詞語確定待添加鏈接的候選;類別分析單元,確定候選的類別;上下文模式確定單元,確定候選的上下文模式;鏈接添加單元,當確定的類別與確定的上下文模式對應時,向候選添加鏈接。
可選地,上下文模式是指候選與候選在內容中的上下文之間的語法結構和/或語意結構。
可選地,候選確定單元包括:組合單元,根據在內容中的原始次序對獲得的詞語進行組合,以得到至少一個第一組合,并且將獲得的各個詞語分別作為一個第一組合;選擇單元,從得到的第一組合之中選擇存在于預定數據庫中的第一組合作為候選。
可選地,當在選擇的第一組合之中存在位置上重疊的第一組合時,選擇單元從重疊的第一組合之中選擇最長的第一組合作為候選。
可選地,所述設備還包括:相似度確定單元,當候選的類別與候選的上下文模式對應時,確定候選在內容中的上下文與候選在其他內容中的上下文的相似度,其中,當確定的相似度大于預定閾值時,鏈接添加單元向候選添加鏈接。
可選地,當確定的相似度不大于預定閾值時,鏈接添加單元不向候選添加鏈接。
可選地,所述相似度表示候選在內容中的上下文與候選在其他內容中的上下文之間的重復詞語的語意表達能力之中的最高語意表達能力。
可選地,所述其他內容具有所述候選并且所述候選已經在所述其他內容中被添加了鏈接。
根據本發明的在內容中添加鏈接的方法和設備,可以實現自動在內容中添加鏈接,從而可以避免了人工進行鏈接的添加,提高了效率。此外,根據本發明的在內容中添加鏈接的方法和設備在內容中所添加的鏈接能夠反映網絡用戶對鏈接的需要。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310414978.8/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





