[發明專利]一種專有本體自動生成系統及方法在審
| 申請號: | 201710383135.4 | 申請日: | 2017-05-26 |
| 公開(公告)號: | CN108959240A | 公開(公告)日: | 2018-12-07 |
| 發明(設計)人: | 雷曉軍;周京 | 申請(專利權)人: | 上海醇聚信息科技有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 上海信好專利代理事務所(普通合伙) 31249 | 代理人: | 朱成之 |
| 地址: | 200000 上海市楊浦*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 短語 句子 輸入端連接 自然語言理解模塊 自動生成系統 文本數據庫 短語分析 建議模塊 句法語義 存儲文本數據 文本數據 輸出端 放入 分割 分析 | ||
1.一種專有本體自動生成系統,其特征在于,包含:
文本數據庫,用于存儲文本數據;
自然語言理解模塊,其輸入端連接于文本數據庫,用于對文本數據分割成若干個句子并分析所述的句子得到句子的句法語義結構;
短語分析模塊,其輸入端連接于自然語言理解模塊輸出端,用于根據所述的句子的句法語義結構得出對應的短語及短語關系;
識別建議模塊、待建立專有本體庫,所述的識別建議模塊輸入端連接短語分析模塊,用于識別所述的短語和短語關系作為待建立專有本體的類別和屬性并放入到待建立專有本體庫中。
2.如權利要求1所述的專有本體自動生成系統,其特征在于,還包含一其他專有本體庫,其與識別建議模塊相連,用于預設存儲已經被建立過的短語。
3.如權利要求1所述的專有本體自動生成系統,其特征在于,所述的自然語言理解模塊包含:
句子分割單元,用于對文本進行句子的切割,成為若干個句子;
句子分析單元,用于對輸入的若干個句子進行句法和語義進行分析,得到句子對應的句法語義結構。
4.如權利要求3所述的專有本體自動生成系統,其特征在于,所述的短語分析模塊包含:
短語語義分析過濾單元,用于提取句法語義結構中的所有短語,并對之進行語義分析,過濾與其他專有本體庫有對應的短語,留下沒有與其他專有本體庫有對應的短語;
短語之間關系分析單元,用于分析過濾留下短語具有的關系得到短語的關系。
5.一種專有本體自動生成方法,其特征在于,該方法包含如下步驟:
S1,存儲文本數據;
S2,對文本數據分割成若干個句子并分析所述的句子得到句子的句法語義結構;
S3,根據所述的句子的句法語義結構得出對應的短語及短語關系;
S4,識別所述的短語和短語關系作為待建立專有本體的類別和屬性并放入到待建立專有本體庫中。
6.如權利要求5所述的專有本體自動生成方法,其特征在于,所述的步驟S2包含:
S2.1,對文本進行句子的切割,成為若干個句子;
S2.2,對輸入的若干個句子進行句法和語義進行分析,得到句子對應的句法語義結構。
7.如權利要求6所述的專有本體自動生成方法,其特征在于,所述的步驟S3包含:
S3.1,提取句法語義結構中的所有短語,并對之進行語義分析,過濾與其他專有本體庫有對應的短語,留下沒有與其他專有本體庫有對應的短語;
S3.2,分析過濾留下短語具有的關系得到短語的關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海醇聚信息科技有限公司,未經上海醇聚信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710383135.4/1.html,轉載請聲明來源鉆瓜專利網。





