[發(fā)明專利]權(quán)利要求書的解構(gòu)處理方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810022758.3 | 申請(qǐng)日: | 2018-01-10 |
| 公開(公告)號(hào): | CN108446259A | 公開(公告)日: | 2018-08-24 |
| 發(fā)明(設(shè)計(jì))人: | 蔡宏興 | 申請(qǐng)(專利權(quán))人: | 云拓科技有限公司 |
| 主分類號(hào): | G06F17/21 | 分類號(hào): | G06F17/21;G06F17/27;G06F17/30 |
| 代理公司: | 上海智信專利代理有限公司 31002 | 代理人: | 王潔 |
| 地址: | 中國臺(tái)灣臺(tái)北市*** | 國省代碼: | 中國臺(tái)灣;71 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 元件定義 讀取 文字定義 斷句 紀(jì)錄 詞性 資料庫 卷標(biāo) 解析 數(shù)據(jù)庫 儲(chǔ)存 | ||
本發(fā)明涉及一種權(quán)利要求書的解析紀(jì)錄方法,為讀取一權(quán)利要求書的文字定義以得出一元件定義并予以紀(jì)錄,包含元件定義得出步驟,根據(jù)一詞性資料庫及一詞性斷句規(guī)則,自權(quán)利要求書的文字定義中讀取出一名詞詞首文字,接著在名詞詞首文字之后讀取出對(duì)應(yīng)于名詞詞首文字的一中間判斷文字且/或?qū)?yīng)于名詞詞首文字的一斷句文字,借此而得出一元件定義;以及元件定義紀(jì)錄儲(chǔ)存步驟,將元件定義得出步驟所得出的元件定義予以結(jié)合于一元件定義屬性卷標(biāo)而以該文字定義被讀取的順序而依序紀(jì)錄于一非關(guān)連式數(shù)據(jù)庫。
技術(shù)領(lǐng)域
本發(fā)明涉及一種權(quán)利要求書的解析紀(jì)錄方法,為讀取一權(quán)利要求書的文字定義以得出一元件定義并予以紀(jì)錄于非關(guān)連式數(shù)據(jù)庫。
背景技術(shù)
權(quán)利要求書為專利說明書的核心,包含有元件定義(包含:標(biāo)的、主要元件、次要元件等)及敘述定義(即,連接關(guān)系敘述、補(bǔ)述等)等細(xì)部結(jié)構(gòu)。然而,各個(gè)元件定義之間以及元件定義與敘述定義之間關(guān)系復(fù)雜,造成閱讀不易而不易了解,即使經(jīng)初步了解其關(guān)系之后,但在進(jìn)行分析時(shí)由于權(quán)利要求書未經(jīng)整理也會(huì)有不易整理出分析報(bào)告的問題。此外,如可整理出元件定義,則在專利檢索及專利分析上,皆會(huì)有極大的幫助。因此,如何整理出元件定義及敘述定義為一課題。
現(xiàn)有并無以詞性關(guān)系而得出權(quán)利要求書的元件定義(包含:標(biāo)的、主要元件、次要元件等)及敘述定義(即,連接關(guān)系敘述、補(bǔ)述等)的技術(shù)。現(xiàn)有有關(guān)權(quán)利要求書的拆解處理為有將權(quán)利要求書予以分解為獨(dú)立項(xiàng)與附屬項(xiàng)。此外,現(xiàn)有技術(shù)(例如,中國臺(tái)灣專利號(hào)I347561 以及I400621)中權(quán)利要求書的元件定義的辨識(shí)以將權(quán)利要求書的個(gè)別文字予以比對(duì)一文字?jǐn)?shù)據(jù)庫中文字的方式而逐字比對(duì),但是這樣的方式有以下缺點(diǎn):(1)必須建立龐大的文字?jǐn)?shù)據(jù)庫;(2)對(duì)于元件定義以及敘述定義必須個(gè)別建立元件定義文字?jǐn)?shù)據(jù)庫以及敘述定義文字?jǐn)?shù)據(jù)庫;(3)即使經(jīng)過辛苦建立了該些文字?jǐn)?shù)據(jù)庫之后,在當(dāng)權(quán)利要求書的文字定義或敘述定義不屬于該些文字?jǐn)?shù)據(jù)庫中的文字時(shí),需再重新加入新的元件定義及敘述定義至該些文字?jǐn)?shù)據(jù)庫中而相當(dāng)麻煩;(4)在將單個(gè)文字定義予以與具有龐大內(nèi)容的文字?jǐn)?shù)據(jù)庫相互比對(duì)的過程將需花費(fèi)非常龐大的時(shí)間,更何況專利數(shù)據(jù)庫中的權(quán)利要求書項(xiàng)目的文字以數(shù)十億至數(shù)百億計(jì)算,所需辨識(shí)出的元件定義以及敘述定義更為以億計(jì),因此要將該數(shù)億個(gè)文字定義予以逐一比對(duì)于文字?jǐn)?shù)據(jù)庫并不可行。由此可知,現(xiàn)有技術(shù)的該方法并不科學(xué)而并不可行。因此,面對(duì)數(shù)量龐大且規(guī)則不一的權(quán)利要求書元件定義及敘述定義的辨識(shí),需要一有效而可行的解析方法乃成為一個(gè)課題。
對(duì)此,本發(fā)明的申請(qǐng)人發(fā)現(xiàn)通過英文詞性的關(guān)系,利用詞性分類上為數(shù)量有限的“關(guān)系代名詞”、“介詞”、“分詞的結(jié)尾符號(hào)”等詞性辨識(shí)而快速地辨識(shí)出詞性,并通過以詞性所建立的一詞性數(shù)據(jù)庫及根據(jù)該詞性數(shù)據(jù)庫所建立的一詞性斷句規(guī)則而執(zhí)行權(quán)利要求書的解析以得出一元件定義,并接續(xù)得出敘述定義,借此而可快速有效的得出該元件定義及該敘述定義。
此外,由于面對(duì)所要存取的為數(shù)量龐大的權(quán)利要求書以及數(shù)量更為龐大的元件定義及敘述定義,因此數(shù)據(jù)訪問速度是必須要解決的問題。在一般的數(shù)據(jù)儲(chǔ)存技術(shù)中,為將經(jīng)邏輯處理后所得出的數(shù)據(jù)予以儲(chǔ)存于一經(jīng)正規(guī)化處理后的一關(guān)連式數(shù)據(jù)庫的數(shù)據(jù)表中,以在需使存取該數(shù)據(jù)時(shí)通過存取該數(shù)據(jù)表而使用該數(shù)據(jù)。然而,以關(guān)連式數(shù)據(jù)庫儲(chǔ)存具有元件定義及敘述定義的權(quán)利要求書數(shù)據(jù)有以下缺點(diǎn):(1)將攫取出的大量元件定義及敘述定義依序儲(chǔ)存至該關(guān)連式數(shù)據(jù)庫將耗費(fèi)大量時(shí)間;(2)元件定義與敘述定義之間的關(guān)連性不容易于關(guān)連式數(shù)據(jù)庫中設(shè)定建立,需要復(fù)雜的數(shù)據(jù)連接設(shè)定;(3)元件定義、敘述定義、案名、說明書、書目數(shù)據(jù)等之間的關(guān)連性不容易于關(guān)連式數(shù)據(jù)庫中建立,需要復(fù)雜的數(shù)據(jù)連接設(shè)定;(4)關(guān)連式數(shù)據(jù)庫需要以數(shù)據(jù)表的聯(lián)集或交集進(jìn)行運(yùn)算,存取時(shí)將耗費(fèi)大量時(shí)間;(5)關(guān)連式數(shù)據(jù)庫本身的訪問速度較慢。然而,專利的權(quán)利要求書為一非結(jié)構(gòu)化數(shù)據(jù),且所得出的元件定義與敘述定義又需有多重的應(yīng)用(例如,檢索、關(guān)連于說明書以及分析),且數(shù)量極為龐大,因此在攫取出權(quán)利要求書的元件定義及敘述定義后,需使用儲(chǔ)存容易、訪問速度快、應(yīng)用性高的非關(guān)連式數(shù)據(jù)庫進(jìn)行數(shù)據(jù)的儲(chǔ)存。
發(fā)明內(nèi)容
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于云拓科技有限公司,未經(jīng)云拓科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810022758.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 文本斷句方法及系統(tǒng)
- 用于圖紙排版的文本斷句方法及系統(tǒng)
- 斷句模型訓(xùn)練方法、斷句方法、裝置及計(jì)算機(jī)設(shè)備
- 網(wǎng)絡(luò)電話語音識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 流式自然語言信息的斷句裝置及方法
- 一種斷句方法及裝置
- 語音斷句的方法、裝置和存儲(chǔ)介質(zhì)
- 語言預(yù)處理斷句方法、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本斷句方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 句段的斷句方法、裝置和電子設(shè)備





