[發明專利]用于圖紙排版的文本斷句方法及系統在審
| 申請號: | 201710187190.6 | 申請日: | 2017-03-27 |
| 公開(公告)號: | CN107038152A | 公開(公告)日: | 2017-08-11 |
| 發明(設計)人: | 席斌;李明;王興強;彭成超 | 申請(專利權)人: | 成都優譯信息技術股份有限公司 |
| 主分類號: | G06F17/25 | 分類號: | G06F17/25;G06F17/27;G06K9/62 |
| 代理公司: | 成都行之專利代理事務所(普通合伙)51220 | 代理人: | 馮龍 |
| 地址: | 610000 四川省成都*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 圖紙 排版 文本 斷句 方法 系統 | ||
1.用于圖紙排版的文本斷句方法,其特征在于,包括以下步驟:
S1:對完成斷句的句群進行SVM學習;
S2:利用學習后的SVM對需要斷句的句群進行分析;
S3:根據分析結果對需要斷句的句群進行斷句。
2.根據權利要求1所述的用于圖紙排版的文本斷句方法,其特征在于,步驟S1包括以下子步驟:
S11:收集完成斷句的句群;
S12:標記完成斷句的句群中需要提取特征的地方;
S13:對標記后句群的特征進行SVM學習。
3.根據權利要求2所述的用于圖紙排版的文本斷句方法,其特征在于,步驟S13中所述SVM學習包括利用線性核函數對特征進行處理。
4.根據權利要求3所述的用于圖紙排版的文本斷句方法,其特征在于,所述SVM學習后形成二元分類器。
5.根據權利要求1所述的用于圖紙排版的文本斷句方法,其特征在于,步驟S2包括以下子步驟:
S21:輸入需要斷句的句群;
S22:標記需要斷句的句群中需要提取特征的地方;
S23:對標記后句群的特征通過SVM進行分析。
6.采用權利要求1方法的用于圖紙排版的文本斷句系統,其特征在于,包括:
對完成斷句的句群進行SVM學習的學習單元;
利用學習后的SVM對需要斷句的句群進行分析的分析單元;
根據分析結果對需要斷句的句群進行斷句的斷句單元。
7.根據權利要求6所述的用于圖紙排版的文本斷句系統,其特征在于,所述分析單元包括:
用于輸入需要斷句的句群的輸入模塊;
用于標記需要斷句的句群中需要提取特征的地方的標記模塊;
用于對標記后句群的特征通過SVM進行分析的分析模塊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都優譯信息技術股份有限公司,未經成都優譯信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710187190.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種恒張力自動放卷儲料機構
- 下一篇:波紋管成型機





