[發明專利]一種公式化數據的搜索方法及裝置有效
| 申請號: | 201210158383.6 | 申請日: | 2012-05-18 |
| 公開(公告)號: | CN102693303B | 公開(公告)日: | 2017-06-06 |
| 發明(設計)人: | 侯秀峰;徐飛;張國晨 | 申請(專利權)人: | 上海極值信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海市錦天城律師事務所31273 | 代理人: | 劉民選 |
| 地址: | 201209 上海市浦東新區金海路2*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 公式化 數據 搜索 方法 裝置 | ||
1.一種公式化數據搜索裝置,其特征在于,包括:
至少一用戶端,所述用戶端包括一公式輸入模塊,用于輸入公式并轉換為一文本化編碼,所述公式輸入模塊包括:一輸入界面模塊,用于提供標準的公式元件;一處理模塊,用于接收由所述公式元件所組成的公式并將其轉換為一文本化編碼,所述文本化編碼為Latex語言或MathML語言或OpenMath語言;
一網絡,用于將所述文本化編碼傳送至一服務器;
一服務器,所述服務器包括一搜索模塊,該搜索模塊至少包括一數據庫用于存儲與公式對應的文本化編碼,所述搜索模塊包含一索引,所述索引規則為將公式劃分為運算變量和運算符兩種結構類別,所述運算變量和運算符組成一表達式,所述公式由所述表達式遞歸或非遞歸定義而成,所述非遞歸是指如果所述公式無法匹配所述表達式的定義規則,則所述公式被不斷分解直至形成一符合所述表達式定義規則的最長子結構,如果某一公式需要被整體識別,則將所述公式的結構特征添加為一定義規則;
所述索引的規則為,實現粗粒度的公式中關鍵詞的識別,并結合通過擴展表達式的定義規則,以最細粒度的單元作為索引,將所述粗粒度和最細粒度兩者結合,實現精確搜索和模糊搜索的功能,即同時進行粗粒度和最細粒度的方式進行搜索;
所述搜索模塊根據所述文本化編碼查詢所述數據庫并將查詢結果通過所述網絡返回所述用戶端。
2.如權利要求1所述的公式化數據搜索裝置,其特征在于,所述公式元件包括以下的一種或幾種:數學公式符號、物理符號、化學符號、化學結構式、化學反應式、五線譜。
3.如權利要求1所述的公式化數據搜索裝置,其特征在于,所述公式元件包括一符號以及至少一個輸入光標,所述輸入光標用于根據用戶需要輸入一字母或數字。
4.如權利要求1所述的公式化數據搜索裝置,其特征在于,所述搜索模塊中還包括一網絡 爬蟲進程,用于在網絡中查找與公式相關的網頁或文檔。
5.一種公式化數據的搜索方法,其特征在于,包括:
建立一索引,所述索引規則包括將公式劃分為運算變量和運算符兩種結構類別,所述運算變量和運算符組成一表達式,所述公式由所述表達式遞歸或非遞歸定義而成,所述非遞歸是指如果所述公式無法匹配所述表達式的定義規則,則所述公式被不斷分解直至形成一符合所述表達式定義規則的最長子結構,如果某一公式需要被整體識別,則將所述公式的結構特征添加為一定義規則;
所述索引的規則為,實現粗粒度的公式中關鍵詞的識別,并結合通過擴展表達式的定義規則,以最細粒度的單元作為索引,將所述粗粒度和最細粒度兩者結合,實現精確搜索和模糊搜索的功能,即同時進行粗粒度和最細粒度的方式進行搜索;
輸入一公式,提供一標準的公式元件,用戶根據需要選擇所述公式元件以生成一公式;
將所述公式轉換為一文本化語言,所述文本化語言為Latex語言或MathML語言或OpenMath語言;
查詢數據庫中的公式;
輸出一查詢結果。
6.如權利要求5所述的公式化數據的搜索方法,其特征在于,所述公式包括但不限于數學公式、物理公式、化學結構式、化學反應式、五線譜。
7.如權利要求5所述的公式化數據的搜索方法,其特征在于,輸入一公式的過程具體包括:提供一標準的公式元件,所述公式元件包括符號以及至少一個輸入光標,用戶根據需要選擇所述符號以及在輸入光標處輸入一字母或數字,以生成一公式。
8.如權利要求5所述的公式化數據的搜索方法,其特征在于,所述查詢數據庫中的公式具體包括:在輸入公式之前對所述數據庫中的公式進行索引,將所述輸入公式的文本化語言 在索引中進行查詢,與所述數據庫的公式進行相似性的比較和評分。
9.如權利要求5所述的公式化數據的搜索方法,其特征在于,所述輸出一查詢結果具體包括:將查詢結果進行排序后呈現給用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海極值信息技術有限公司,未經上海極值信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210158383.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:網站廣告位價值量計算系統及計算方法
- 下一篇:一種實現電子書簽的方法及裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





