[發明專利]一種對企業信息中自然語義的專家學習擬合方法及系統在審
| 申請號: | 201710354038.2 | 申請日: | 2017-05-18 |
| 公開(公告)號: | CN107291812A | 公開(公告)日: | 2017-10-24 |
| 發明(設計)人: | 辛柯俊 | 申請(專利權)人: | 辛柯俊 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27;G06Q10/06 |
| 代理公司: | 北京中企鴻陽知識產權代理事務所(普通合伙)11487 | 代理人: | 郭鴻雁 |
| 地址: | 210049 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 企業信息 自然 語義 專家 學習 擬合 方法 系統 | ||
1.一種對企業信息中自然語義的專家學習擬合方法,其特征在于,包括如下步驟:
步驟S1,爬取互聯網上的企業名稱和企業信息;
步驟S2,對獲取的企業信息進行分詞操作;
步驟S3,建立企業搜索網站,允許用戶輸入企業名稱或關鍵詞進行搜索,在向用戶顯示企業時,將分詞信息嵌入到企業介紹中,以在接收到用戶的點擊操作時,檢測用戶點擊的詞匯,并自動啟動對該詞匯的搜索;
步驟S4,統計用戶對各個詞語的點擊頻率,過濾出點擊頻率高的多個詞匯作為該企業的特征詞匯,并利用上述詞匯創立一個新型的字典,所述字典記錄有該企業的產業鏈特征詞匯;
步驟S5,將企業之間共同的特征作為連接點,連接不同的企業,以形成企業之間的關聯關系圖;
步驟S6,根據所述企業之間的關聯關系圖,搜索出與該企業相關的業務關聯企業。
2.如權利要求1所述的對企業信息中自然語義的專家學習擬合方法,其特征在于,在所述步驟S1中,爬取的數據源包括:企業官網、廣告黃頁、行業門戶。
3.如權利要求1所述的對企業信息中自然語義的專家學習擬合方法,其特征在于,在所述步驟S2中,采用字典匹配法、詞頻統計法進行分詞操作。
4.如權利要求1所述的對企業信息中自然語義的專家學習擬合方法,其特征在于,在所述步驟S4中,將點擊頻率高的詞匯以特殊標記進行突出顯示。
5.如權利要求1所述的對企業信息中自然語義的專家學習擬合方法,其特征在于,在所述步驟S5中,所述企業之間共同的特征包括:多個企業的特征詞匯中的相同詞匯或近義詞。
6.一種對企業信息中自然語義的專家學習擬合系統,其特征在于,包括:
爬取模塊,用于爬取互聯網上的企業名稱和企業信息;
分詞模塊,用于爬取的企業信息進行分詞操作;
詞匯搜索模塊,用于建立企業搜索網站,并運行用戶輸入企業名稱或關鍵詞進行搜索,在向用戶顯示企業時,將分詞信息嵌入到企業介紹中,并在接收到用戶的點擊操作時,檢測用戶點擊的詞匯,自動啟動對該詞匯的搜索;
過濾及字典建立模塊,用于統計用戶對各個詞語的點擊頻率,過濾出點擊頻率高的多個詞匯作為該企業的特征詞匯,并利用上述詞匯創立一個新型的字典,其中,所述字典記錄有該企業的產業鏈特征詞匯;
關聯關系圖建立模塊,用于將企業之間共同的特征作為連接點,連接不同的企業,以形成企業之間的關聯關系圖;
關聯企業搜索模塊,用于根據所述企業之間的關聯關系圖,搜索出與該企業相關的業務關聯企業。
7.如權利要求6所述的對企業信息中自然語義的專家學習擬合系統,其特征在于,所述爬取模塊爬取的數據源包括:企業官網、廣告黃頁、行業門戶。
8.如權利要求6所述的對企業信息中自然語義的專家學習擬合系統,其特征在于,所述過濾及字典建立模塊用于采用字典匹配法、詞頻統計法進行分詞操作。
9.如權利要求6所述的對企業信息中自然語義的專家學習擬合系統,其特征在于,所述過濾及字典建立模塊用于將點擊頻率高的詞匯以特殊標記進行突出顯示。
10.如權利要求6所述的對企業信息中自然語義的專家學習擬合系統,其特征在于,所述關聯關系圖建立模塊定位所述企業之間共同的特征包括:多個企業的特征詞匯中的相同詞匯或近義詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于辛柯俊,未經辛柯俊許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710354038.2/1.html,轉載請聲明來源鉆瓜專利網。





