[發明專利]用于從非結構化數據自動生成多語言電子內容的方法和系統無效
| 申請號: | 200680048390.3 | 申請日: | 2006-12-04 |
| 公開(公告)號: | CN101341486A | 公開(公告)日: | 2009-01-07 |
| 發明(設計)人: | H·哈桑;O·伊瑪姆;A·亞辛 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G09B5/08 |
| 代理公司: | 北京市金杜律師事務所 | 代理人: | 朱海波 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 結構 數據 自動 生成 語言 電子 內容 方法 系統 | ||
1.一種用于基于用戶首選項從非結構化數據生成電子內容并對其進行本地化的方法,所述方法包括下述步驟:
·從所述非結構化數據提取與一個或多個預選主題有關的信息;
·將所提取信息合并為結構化形式;
·根據選定環境對所合并信息進行本地化;
·根據指定形式生成內容。
2.根據權利要求1所述的方法,其中與所提取信息相關的主題、根據其對所述信息進行本地化的環境以及根據其生成所述內容的形式基于用戶首選項。
3.根據前述權利要求中任意一項所述的方法,包括預備步驟:
·接收一個或多個預選主題。
4.根據前述權利要求中任意一項所述的方法,包括預備步驟:
·接收用戶選定的環境。
5.根據前述權利要求中任意一項所述的方法,包括預備步驟:
·接收用戶指定的形式。
6.根據前述權利要求中任意一項所述的方法,其中所述從非結構化數據提取與一個或多個預選主題有關的信息的步驟,進一步包括下述步驟:
針對每個所述預選主題:
·從非結構化數據中檢索與所述主題有關的內容;
·測量所檢索內容與所述主題的相關性;
·從所檢索內容中選擇被認為與所述主題最相關的內容;
·根據一個或多個預定義類別對所選擇內容進行標記;
·從所標記內容中識別相關的具名實體以及所述具名實體之間的關系;
·從非結構化數據中為每個識別出的具名實體和關系提取特征向量;
·在主題圖中表現所述實體和關系,其中節點代表所述實體并且邊代表所述實體之間的關系。
7.根據前述權利要求所述的方法,其中在主題圖中,預選主題用節點來代表,子主題用其他節點來代表,并且預選主題與子主題之間的關系用邊來代表。
8.根據前述權利要求中任意一項所述的方法,其中將所提取信息合并為結構化形式的步驟進一步包括步驟:
·針對與每個預選主題有關的每個主題圖:
·選擇被認為與預選主題有關的子主題;
·移除被認為與預選主題無關的子主題。
9.根據前述權利要求中任意一項所述的方法,其中將所提取信息合并為結構化形式的步驟進一步包括步驟:
·將與不同主題相關聯的所有主題圖結合在一起并且檢測被表現在多于一個主題圖中的子主題;
·針對被表現在多于一個主題圖中的每個子主題:
·只在主題圖中保存所述子主題數據的一個實例;
·使用參考來在任意其他主題圖中引用所述子主題數據。
10.根據前述權利要求中任意一項所述的方法,其中對所合并信息進行本地化的步驟進一步包括步驟:
·調整所合并信息以適應選定環境。
11.根據前述權利要求所述的方法,其中調整所合并信息以適應選定環境的步驟包括下述步驟:
·根據用戶選定的語言翻譯所合并信息。
12.根據前述權利要求中任意一項所述的方法,包括預備步驟:
·將非結構化數據轉換為單一語言。
13.根據前述權利要求所述的方法,其中將非結構化數據轉換為單一語言的步驟包括下述步驟:
·識別在非結構化數據中使用的語言。
14.根據前述權利要求中任意一項所述的方法,其中所述方法在服務器中執行;所述方法包括下述步驟:
·從一個或多個客戶端接收包括用戶首選項的請求;
·響應于所述請求、根據用戶首選項將內容發回客戶端。
15.一種系統,包括適用于實現根據前述權利要求中任意一項所述的方法步驟的裝置。
16.根據前述權利要求的系統,其中所述系統是服務器。
17.一種計算機程序,包括用于當所述計算機程序在計算機系統上執行時,實現根據權利要求1-14中任一方法的步驟的指令。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200680048390.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種模殼構件成型模具
- 下一篇:載有生物個體DNA的新型工藝品及其制作方法
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





