[發明專利]提取企業項目信息在審
| 申請號: | 201580077811.4 | 申請日: | 2015-06-25 |
| 公開(公告)號: | CN107430607A | 公開(公告)日: | 2017-12-01 |
| 發明(設計)人: | M·古普塔;A·丹;V·達斯;P·馬塔尼;R·K·梅達;王仲遠;陳正;閆峻;紀蕾 | 申請(專利權)人: | 微軟技術許可有限責任公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海專利商標事務所有限公司31100 | 代理人: | 蔡悅,胡利鳴 |
| 地址: | 美國華*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 提取 企業 項目 信息 | ||
背景
企業可一般地被定義成組織實體,并且更具體而言是指組織的整體,包括其各個單位和位置。企業可積聚與其運營相關的大量的不同類型的數據。例如,該數據包括關于企業的各種項目的信息,包括從事于項目的人員以及在項目的過程期間被生成和收集的同項目相關的項。該項目信息通常跨眾多的企業數據源散布。
概述
本文所描述的項目信息提取實現通常為企業提取項目信息并且生成項目信息數據庫。在一個實現中,這是通過使用計算設備執行以下過程動作來實現的。首先,企業項目名稱從與企業相關聯的信息源被提取出。與對應于每個提取出的企業項目名稱的項目相關聯的人員同樣使用與企業相關聯的信息源來標識。隨后生成針對該企業的項目信息數據庫。該數據庫具有每個項目的條目,其包括與項目相關聯的提取出的企業項目名稱以及被標識成與項目相關聯的人員的至少一個列表。
應該注意,提供前述概述是為了以簡化的形式介紹將在以下詳細描述中進一步描述的概念的精選。本概述并非旨在標識出要求保護的主題的關鍵特征或必要特征,亦非旨在用作輔助確定要求保護的主題的范圍。唯一的目的是以簡化的形式呈現所要求保護的主題的某些概念,作為下文呈現的比較詳細的描述的前奏。
附圖簡述
參考以下描述、所附權利要求書以及附圖,將更好地理解本發明的具體特征、方面和優點,附圖中:
圖1是以簡化的形式例示用于實現本文所描述的項目信息提取實現的項目信息數據庫系統的一個實現的圖示。
圖2是例示提取項目信息和生成企業的項目信息數據庫的過程的一個實現的流程圖。
圖3示出了用于執行被用來標識作為潛在的項目名稱的企業文檔中的文本字符串的赫斯特模式分析(Hearst pattern analysis)的示例性偽代碼。
圖4示出了用于執行基于種子的拆分過程以標識分發組(DG)標題中的企業項目名稱和修飾語的示例性偽代碼。
圖5示出了用于執行后綴頻率拆分過程以標識DG標題中的企業項目名稱和修飾語的示例性偽代碼。
圖6A-B是例示使用包含企業文檔的一個或多個信息源來標識與對應于每個提取出的企業項目名稱的項目相關聯的人員的過程的一個實現的流程圖。
圖7A-B是例示使用包含企業分發組和會議信息的一個或多個信息源來標識與對應于每個提取出的企業項目名稱的項目相關聯的人員的過程的一個實現的流程圖。
圖8A-B是例示對與項目相關聯的人員根據他們的角色指定來進行排名的過程的一個實現的流程圖。
圖9是描繪構成用于與本文所描述的項目信息提取實現一起使用的示例性系統的通用計算設備的示圖。
詳細描述
在以下描述中,對附圖進行了參考,附圖構成了以下描述的一部分并且在其中作為說明示出了可在其中實踐項目信息提取實現的具體版本。可以理解,可以使用其他實現并且可以做出結構上的改變而不背離其范圍。
還應注意,出于清楚的目的,在描述項目信息提取實現時將依靠具體的術語,但并不意味著這些實現被限制于所選擇的具體術語。此外,應當理解的是,每個具體術語包括以寬泛地類似方式工作以實現類似目的的所有其技術等同物。本文引用“一個實現”、或“另一實現”、或“示例性實現”、或“替代實現”意味著結合該實現描述的特定特征、特定結構、或特定特性可被包括在項目信息提取的至少一個版本中。在本說明書中各個位置出現的短語“在一個實現中”、“在另一實現中”、“在一示例性實現中”、以及“在一替換實現中”不一定全部指同一實現,也不一定是與其他實現相互排斥的分開的或替代的實現。此外,表示演示合成的一個或多個實現的過程流的次序既不固有地指示任何特定次序,也不暗示其任何限制。
如本文中所使用的,術語“組件”、“系統”、“客戶端”等旨在指代計算機相關的實體,它們可以是硬件、(例如,執行中的)軟件、和/或固件,或其組合。例如,組件可以是,在處理器上運行的進程、對象、可執行碼、程序、函數、庫、子例程、計算機,或軟件和硬件的組合。作為說明,在服務器上運行的應用和該服務器兩者都可以是組件。一個或多個組件可留駐在進程中,并且組件可位于一個計算機上和/或分布在兩個或更多個計算機之間。術語“處理器”一般被理解成指代硬件組件,諸如計算機系統的處理單元。
而且,就術語“包括”、“含有”、“具有”、“包含”及其變體和其他類似詞語在詳細描述或權利要求書中的使用而言,這些術語旨在以類似于術語“包括”作為開放的過渡詞的方式為包含性的而不排除任何附加或其他元素。
1.0從企業提取項目信息
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟技術許可有限責任公司,未經微軟技術許可有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580077811.4/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





