[發明專利]一種諺文數據庫、構建方法及諺文數據庫檢索系統有效
| 申請號: | 201310597535.7 | 申請日: | 2013-11-23 |
| 公開(公告)號: | CN103605755A | 公開(公告)日: | 2014-02-26 |
| 發明(設計)人: | 朱煒;尉遲治平;高天俊;尉遲明 | 申請(專利權)人: | 華中科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 華中科技大學專利中心 42201 | 代理人: | 朱仁玲 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據庫 構建 方法 檢索系統 | ||
技術領域
本發明屬于漢語及韓語資訊處理技術領域,更具體地,涉及一種諺文數據庫、構建方法及諺文數據庫檢索系統。
背景技術
韓字是由朝鮮王朝第四代君主世宗大王于1443年通過《訓民正音》創制而成,用韓字寫成的文章稱為“諺文”。在此之前,韓語只以口語形式存在,朝廷、文武兩班等統治階級書寫使用漢字。為了方便本國人學習漢語,在朝鮮產生了用韓字對漢字注音和翻譯的各種對音韻書、辭書及漢語教科書,如:《東國正韻》、《四聲通解》、《譯語類解》、《老乞大》、《樸通事》等。這些對音文獻為研究同時代漢語語言系統及韓語語言系統提供了非常重要的資料。
目前,對音韻書、辭書及漢語教科書的研究主要是通過對紙本進行統計查閱。由于上述書目前后跨越近三百年,其中的句子、漢字、諺文注音、聲調標點及諺文注釋均隨當時漢語的變化而發生變化,很難進行全面系統的比較研究。因此開發一套能夠涵蓋句子、漢字、諺文注音、聲調標點、諺文注釋的諺文數據庫及使用該數據庫進行諺文檢索的檢索系統,可為綜合研究16世紀-18世紀近代漢語的語音、聲調、詞匯、語法乃至同時代韓語的發展變化提供一種方便、快捷、有效的工具。
發明內容
針對現有技術的以上缺陷或改進需求,本發明提供了一種諺文數據庫、構建方法及諺文數據庫檢索系統,其目的在于將諺文源文檔轉化為可進行文本查找的諺文電子數據,使得用戶可以檢索到諺文電子數據中句子、漢字、諺文注音、諺文注釋、音韻地位、聲調標點等詳細信息,利用這些成果對近代漢語或韓語的語音系統進行歷時和共時的分析和討論,由此解決目前難以對諺文音韻書、辭書及漢語教科書進行全面系統研究的技術問題。
本發明解決其技術問題所采用的技術方案是,提供一種建立諺文數據庫的方法,所述方法包括以下步驟:
S1、按照諺文類別構建數據表,具體包括書庫數據表、卷次庫數據表、句子庫數據表、被釋詞庫數據表、左音音庫數據表、右音音庫數據表、字庫數據表、單字庫數據表;
S2、根據各類別諺文的屬性在相應數據表中設置諺文屬性字段,并選取字段為數據表之間建立索引;
S3、將諺文源文檔轉換為諺文電子數據;
S4、將所述諺文電子數據按照類別分別導入相應的數據表中,由此生成諺文數據庫。
在本發明所述的建立諺文數據庫的方法中,所述數據庫數據表包含所述諺文電子數據的書名號、書名、作者、成書年代、所據底本、收錄源字段信息,所述卷次庫數據表包含所述諺文電子數據的卷號、書名號、卷次字段信息,所述句子庫數據表包含所述諺文電子數據的句號、卷號、頁碼、正文帶頁碼及顏色標記、正文、中文句子、諺文注釋、句子備注字段信息,所述被釋詞庫數據表包含所述諺文電子數據的被釋詞號、句號、漢字號、
被釋詞號、漢字備注、諺文左音、諺文左音備注、諺文左點、諺文左點備注、諺文左音標號、諺文右音、諺文右音備注、諺文右點、諺文右點備注、諺文右音標號、漢字左點、漢字左點備注、漢字右點、漢字右點備注字段信息,所述左音音庫數據表包含所述諺文電子數據的左音標號、諺文左音、諺文左音轉寫、左音聲母、左音韻母、左音尾音字段信息,所述右音音庫數據表包含所述諺文電子數據的右音標號、諺文右音、諺文右音轉寫、右音聲母、右音韻母、右音尾音字段信息,所述字庫數據表包含所述諺文電子數據的漢字號、字Unicode、被釋漢字字段信息,所述單字庫數據表包含所述諺文電子數據的單字號、字Unicode、字字段信息,所述音韻地位庫數據表包含所述諺文電子數據的字Unicode、字音號、字、音書、反切上字、反切下字、攝、韻、呼、等、調、紐字段信息。
在本發明所述的建立諺文數據庫的方法中,所述書庫數據表與所述卷次庫數據表之間通過“書名號”建立索引;所述卷次庫數據表與所述句子庫數據表之間通過“卷號”建立索引;所述句子庫數據表與所述被釋詞庫數據表之間通過“句號”建立索引;所述被釋詞庫數據表與所述左音音庫數據表之間通過“諺文左音標號”建立索引;所述被釋詞庫數據表與所述右音音庫數據表之間通過“諺文右音標號”建立索引;所述被釋詞庫數據表與所述字庫數據表之間通過“漢字號”建立索引;所述字庫數據表與所述單字庫數據表之間通過“字Unicode”建立索引;所述單字庫數據表與所述音韻地位庫數據表之間通過“字Unicode”建立索引。
相應地,本發明還提供一種由所述建立諺文數據庫的方法構建的諺文數據庫。
相應地,本發明還提供一種諺文數據庫檢索系統,所述系統包括:
輸入模塊,用于輸入檢索命令;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學,未經華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310597535.7/2.html,轉載請聲明來源鉆瓜專利網。





