[發明專利]按示例格式化數據有效
| 申請號: | 201210019215.9 | 申請日: | 2012-01-20 |
| 公開(公告)號: | CN102609403A | 公開(公告)日: | 2012-07-25 |
| 發明(設計)人: | C·羅斯切里爾;D·巴塔金;C·本尼迪克特;R·莫雷拉-席爾維拉;D·O·丹尼洛夫;E·科恩;S·古瓦尼;D·魯哈納;R·辛哈;B·G·佐恩;R·凡卡特杉 | 申請(專利權)人: | 微軟公司 |
| 主分類號: | G06F17/24 | 分類號: | G06F17/24;G06F17/22 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 黃嵩泉 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 示例 格式化 數據 | ||
技術領域
本發明涉及數據處理,尤其涉及數據格式化。
背景技術
相同類型的數據常常以許多不同的格式來輸入和存儲。例如,某些日期采用CCYYMMDD(19990101)的形式,其他日期采用MM/DD/CCYY(01/01/1999)的格式,而另一些日期采用M/D/YY(1/1/99)的格式。為了對數據執行分析,將數據轉換成相同的格式。例如,某一分析可以指定電話號碼要遵循(206)555-1212的形式來格式化,而其他分析可指定從電話號碼移除格式化(即,2065551212)。可使用不同方法來變換數據。例如,可使用不同的變換函數和/或可開發不同的代碼來變換數據。
發明內容
提供本發明內容以便以簡化形式介紹將在以下具體實施方式中進一步描述的一些概念。本發明內容并非旨在標識所要求保護的主題的關鍵特征或必要特征,也不旨在用于幫助確定所要求保護的主題的范圍。
基于示例的一組輸出(例如,用戶編輯)來自動確定將數據項從一種形式轉換成另一種形式的數據格式化規則。機器學習試探法被應用于源數據以及示例輸出(例如,用戶編輯)以確定可應用于其他數據項的數據格式化規則。例如,用戶可作出向數據添加字符/從數據移除字符、串接數據、提取數據、重命名數據等的編輯。通過檢查原始值以及經編輯的值,可得出封裝這種類型的變換的規則,然后該規則可在其他原始值上運行以自動生成所需的經編輯的值或輸出。可響應于事件(例如,在對相同類型的數據作出預定次數的編輯之后)自動觸發機器學習試探法或手動觸發(例如,選擇用戶界面選項)機器學習試探法。可將數據格式化規則應用于其他數據并且格式化的結果可供用戶審閱。基于進一步的編輯/審閱,可更新數據格式化規則。數據格式化規則可被存儲以供以后使用和/或修改。還可給出置信水平以協助用戶確定某一(些)項是否被正確地重新格式化了。
附圖說明
圖1示出了示例性計算環境;
圖2示出一種用于基于對文檔作出的編輯來格式化數據的系統;
圖3示出基于用戶對列的編輯來確定數據格式化規則并將該數據格式化規則應用于該列內的其他單元格;
圖4示出用戶對社會保險號列中的項作出編輯的示例;
圖5示出用戶作出編輯以改變日期的格式化的示例;
圖6示出可用于與項的格式化交互的用戶界面元素;
圖7示出用于啟用/停用按示例填充的用戶界面;以及
圖8示出用于按示例格式化數據的說明性過程。
具體實施方式
現將參考附圖來描述各實施例,在附圖中類似的標號代表類似的元素。具體地,圖1和相應的討論旨在提供對在其中可實現各實施例的合適計算環境的簡要、概括描述。
一般而言,程序模塊包括執行特定任務或實現特定抽象數據類型的例程、程序、組件、數據結構和其它類型的結構。也可使用其它計算機系統配置,包括手持式設備、多處理器系統、基于微處理器或可編程消費電子產品、小型計算機、大型計算機等等。還可使用在其中任務由通過通信網絡鏈接的遠程處理設備執行的分布式計算環境。在分布式計算環境中,程序模塊可位于本地和遠程存儲器存儲設備兩者中。
現在參考圖1,將描述在各個實施例中所利用的計算機100的說明性計算機環境。圖1所示的計算機環境包括計算設備,這些計算設備各自可以被配置為服務器、臺式計算機或移動計算機、或者某一其他類型的計算設備,并且包括中央處理單元5(“CPU”)、包括隨機存取存儲器9(“RAM”)和只讀存儲器(“ROM”)10的系統存儲器7、以及將存儲器耦合至中央處理單元(“CPU”)5的系統總線12。
基本輸入/輸出系統存儲在ROM?10中,所述基本輸入/輸出系統包含幫助在諸如啟動期間在計算機內元件之間傳遞信息的基本例程。計算機100還包括大容量存儲設備14,該大容量存儲設備14用于存儲操作系統16、電子表格11、電子表格應用24、其它程序模塊25、以及格式化管理器26,這將在下面予以更詳細的描述。
大容量存儲設備14通過連接至總線12的大容量存儲控制器(未示出)連接到CPU?5。大容量存儲設備14及其相關聯的計算機可讀介質為計算機100提供非易失性存儲。雖然此處包含的對計算機可讀介質的描述針對諸如硬盤或CD-ROM驅動器等大容量存儲設備,但是計算機可讀介質可以是能夠由計算機100訪問的任何可用介質。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟公司,未經微軟公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210019215.9/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





