[發明專利]用于輸出信息的方法和裝置有效
| 申請號: | 201910738514.X | 申請日: | 2019-08-12 |
| 公開(公告)號: | CN110457325B | 公開(公告)日: | 2022-05-03 |
| 發明(設計)人: | 秦華鵬;程健一;趙岷 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/28 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 輸出 信息 方法 裝置 | ||
1.一種用于輸出信息的方法,包括:
基于從目標知識體系獲得的至少一對上下位詞擴展概念體系,其中,所述概念體系是預先構建的有向無環圖結構的樹狀概念層次網絡,所述有向無環圖中的節點是概念,節點間的邊是可傳遞的概念上下位關系;
基于擴展后的概念體系構造訓練樣本,其中,將外部數據作為虛節點引入概念體系,外部數據不參與向量計算,虛節點指的是不作為概念轉向量模型的輸入但作為概念轉向量模型的輸出的類別標簽,虛節點編號在概念體系已有節點的索引值范圍之外,且不同節點的虛節點集沒有交集;
基于擴展后的概念體系構建概念轉向量模型;
基于所述訓練樣本訓練所述概念轉向量模型,輸出訓練好的每個概念的特征向量。
2.根據權利要求1所述的方法,其中,所述基于從目標知識體系獲得的至少一對上下位詞擴展概念體系,包括:
將百科數據的上位體系與概念體系直接映射,構造至少一對上下位詞直接補充到所述概念體系中。
3.根據權利要求1所述的方法,其中,所述基于從目標知識體系獲得的至少一對上下位詞擴展概念體系,包括:
從專業資料中獲取垂直領域的知識體系,利用上位預測模型或文本匹配等方式關聯到概念體系的節點上,將之補充到所述概念體系中。
4.根據權利要求1所述的方法,其中,所述基于從目標知識體系獲得的至少一對上下位詞擴展概念體系,包括:
從搜索文本中挖掘詞匯,使用序列標注模型預測這些詞匯的概念上位,并去掉命名實體,篩選結果補充到概念體系中。
5.根據權利要求1所述的方法,其中,所述基于擴展后的概念體系構造訓練樣本,包括:
將所述有向無環圖轉換成概念體系樹;
根據所述概念體系樹的每個節點的最相似節點集以及節點的上下位關系,構造每個節點與所述概念體系樹中其他節點的相似度的偏序關系;
基于上述偏序關系,對于每一個節點,構造該節點的采樣集合,在該節點的采樣集合中采樣得到該節點的訓練樣本。
6.根據權利要求5所述的方法,其中,所述在該節點的采樣集合中采樣得到該節點的訓練樣本,包括:
若該節點的后代節點集中節點數量不小于最少樣本量,則將該節點的后代節點集作為該節點的訓練樣本;
否則,根據所述偏序關系補充訓練樣本。
7.根據權利要求5所述的方法,其中,所述在該節點的采樣集合中采樣得到該節點的訓練樣本,包括:
在該節點下掛接至少一個虛節點作為該節點的后代節點;
若該節點的后代節點集中節點數量不小于最少樣本量,則將該節點的后代節點集作為該節點的訓練樣本;
否則,根據所述偏序關系補充訓練樣本。
8.根據權利要求5所述的方法,其中,所述在該節點的采樣集合中采樣得到該節點的訓練樣本,包括:
基于該節點的后代節點的數量和該節點的虛節點的數量計算概念初始權重;
根據所述概念初始權重計算采樣分布;
根據所述采樣分布在該節點的采樣集合中采樣得到該節點的訓練樣本。
9.一種用于輸出信息的裝置,包括:
擴展單元,被配置成基于從目標知識體系獲得的至少一對上下位詞擴展概念體系,其中,所述概念體系是預先構建的有向無環圖結構的樹狀概念層次網絡,所述有向無環圖中的節點是概念,節點間的邊是可傳遞的概念上下位關系;
采樣單元,被配置成基于擴展后的概念體系構造訓練樣本,其中,將外部數據作為虛節點引入概念體系,外部數據不參與向量計算,虛節點指的是不作為概念轉向量模型的輸入但作為概念轉向量模型的輸出的類別標簽,虛節點編號在概念體系已有節點的索引值范圍之外,且不同節點的虛節點集沒有交集;
構建單元,被配置成基于擴展后的概念體系構建概念轉向量模型;
訓練單元,被配置成基于所述訓練樣本訓練所述概念轉向量模型,輸出訓練好的每個概念的特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910738514.X/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





