[發明專利]一種基于NLP的企業供應關系自動抽取分析方法有效
| 申請號: | 201811277652.4 | 申請日: | 2018-10-30 |
| 公開(公告)號: | CN109376202B | 公開(公告)日: | 2021-08-03 |
| 發明(設計)人: | 王金龍;楊傳龍;房斐斐;張云天 | 申請(專利權)人: | 青島理工大學 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F40/211;G06F40/295 |
| 代理公司: | 青島高曉專利事務所(普通合伙) 37104 | 代理人: | 黃曉敏;于正河 |
| 地址: | 266061 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 nlp 企業 供應 關系 自動 抽取 分析 方法 | ||
本發明屬于智能分析技術領域,涉及一種基于NLP的企業供應關系自動抽取分析方法,包括公司名稱識別、產品名稱識別和供求關系判斷三個步驟,利用規則和詞典的方法改進Stanford NER工具包,有效的提高了該工具對公司簡稱的識別效果,并將多種特征融入到條件隨機場模型中,通過結合規則后處理,有效的識別了文本中的產品類別詞,能夠高效準確的從文本中獲取企業間供求關系信息,為投資者和消費者提供寶貴的參考情報,具有重要的理論研究和實際應用價值。
技術領域:
本發明屬于智能分析技術領域,涉及一種基于NLP(語言技術平臺)的企業供應關系自動抽取分析方法。
背景技術:
隨著經濟全球化的進程不斷加深,企業與企業之間的合作不斷發展,制造業早已脫離了閉門造車的時代,現代工業中,某一個終端產品的零部件和生產工藝往往來自不同的國家和企業,這就引出了供應鏈和供應鏈管理的概念。供應鏈管理作為企業運營的重要組成部分,對于企業有著極為重要的作用,一個企業想要發展壯大,一個好的供應鏈是必不可少的,而一條供應鏈,實際上就是由一個個供應關系組成的。
對于現代企業來說,企業與企業之間的關系越來越復雜,企業與企業之間,企業和供應商之前往往存在多重委托,以小米手機為例,小米手機沒有實體工廠,核心零部件全部來自于供應商,核心供應商數量達到40多家,供應商之間也存在復雜的合作和競爭關系,小米手機的成功離不開對供應鏈的精確掌控,由此可見,對供應商之間供求關系的分析對企業經營者來說具有極為重要的現實意義。除此之外,對企業供求關系的分析對投資者和消費者來說也具有極為重要的意義,對投資者而言,掌握了企業之間的供求關系,能在關鍵時候做出正確決策以獲得最大的效益,還是以小米手機為例,小米手機出貨量暴增,ODM供應商聞泰科技,攝像頭模組供應商歐菲科技,天馬面板,華勤通訊等國內上市公司由于給小米供貨,業務收入隨之暴漲,遙遙領先其他對手,若是投資者能盡早獲知這些企業之間的合作關系,也可以從中獲取巨大收益;對于消費者來說,在了解了某產品各零部件的供應商后,也能夠幫助自己做出購買決策。從另一個方面來說,國家正在推行的中國制造2025計劃中,要求以創新驅動、質量為先、綠色發展、結構優化、人才為本作為基本方針,這也要求我們通過挖掘供求關系來進行制造業的優化升級。
目前,國內的許多行業分析公司也推出了自己的供求關系分析產品,比較有代表性的是同花順,同花順推出了產品圖譜,采用圖譜的形式展現國內上市公司之前的上下游供求關系,幫助股票投資者進行投資分析,但是粒度比較粗,主要是描述企業產品之間的聯系,可以幫助用戶進行推斷,但不能確定公司之前是否存在供應關系。
供應關系中涉及到產品名稱和公司名稱兩類實體,在關系抽取前首先要把文本中的實體找出來,進而才能判斷實體之前的關系類別,一個完整的供應關系應該包含供應商,產品和客戶三個實體,供應商供應產品給客戶。目前金融領域的實體關系抽取方面有很多研究成果,孫晨等人通過對上市公司公報數據的分析,將企業間的關系類型定義為持有、投資、轉讓、合并、收購五種,使用最大熵模型進行數據分析尋找最優特征模板,從而在企業公報數據集上得到85%以上的關系抽取準確率;孟蕾同樣將公司間的關系進行分類,結合LSTM和依存句法分析計算句子權重,進而利用分類器進行實體關系分類,在網絡取得了不錯的效果;但是這兩種方法判斷的都是兩個實體間的關系,并且基于機器學習和神經網絡的關系抽取都需要進行大量的語料標注,需要耗費大量的時間,而且目前關系識別通常面向的是開放文本或者是多個類別的關系,目前的實體關系抽取方法并不適用;在產品名稱識別方面,目前對產品名稱識別的研究往往要求產品名稱中包含品牌詞或者型號詞,但是實際中要識別的目標是產品名稱屬于產品類別詞,通常不包含品牌和型號信息;在公司名稱識別方面,由于公司名稱屬于組織機構名,目前針對組織機構名的識別有很多研究成果,出現了很多識別工具包,例如哈工大的LTP,HanLP等等,然而現有的這些工具在對公司簡稱的識別效果較差。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于青島理工大學,未經青島理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811277652.4/2.html,轉載請聲明來源鉆瓜專利網。





