[發明專利]人機交互的分詞與語義標示的方法與系統在審
| 申請號: | 201410080020.4 | 申請日: | 2014-03-06 |
| 公開(公告)號: | CN104899187A | 公開(公告)日: | 2015-09-09 |
| 發明(設計)人: | 蔡天琪;陳竹心;王墅;陳澤昊;徐家輝;蔡恒進 | 申請(專利權)人: | 武漢元寶創意科技有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F3/0481 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 430000 湖北省武漢市武昌區*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 人機交互 分詞 語義 標示 方法 系統 | ||
1.人機交互的分詞與語義標示的方法,包括:
A、接收輸入,默認分詞
B、收到指示進行人工分詞調整
C、收到指示進行人工設置代詞或省略的指向
D、收到指示對于二義性語句進行釋義輸入
E、接收、顯示并保存用戶的更新操作。
2.根據權利要求1所述的方法,其特征在于:人機交互入口為在分詞過程中收到的用戶指示操作。
3.根據權利要求1所述的方法,其特征在于,所述的A步驟包括:
根據輸入的文本,以詞庫為依據進行匹配,將識別出的詞匯與其他未識別部分進行標記,達到視覺上的區分;區分呈現的方式包括但不限于使用下劃線標記出識別的部分,或采用豎線、斜線等符號進行分隔。
4.根據權利要求3所述的方法,其特征在于:
詞匯的匹配方式包括但不限于使用正向迭代匹配,即正序逐字識別、與詞庫進行比對,一般默認采用正向最大長度匹配原則并進行詞頻統計。
5.根據權利要求1所述的方法,其特征在于,所述的B步驟包括:
接收到的人工分詞指示包括刪除默認識別標記和添加新的識別標記,分詞的詞匯頻率統計將在每一次對詞匯識別的人工操作后進行更新。
6.根據權利要求1所述的方法,其特征在于,所述的C步驟包括:
接收到的指示為定義指代指示;將識別光標在GUI中接近的文本作為使用了指代或省略的對象,提供至少一種對象選項;接收用戶確認的指代或省略對象;提供至少一種指代或省略的具體內容選項;接收用戶確認的指代或省略的具體內容。
7.根據權利要求6所述的方法,其特征在于:
用戶確認指代或省略對象、指代或省略具體內容的方式包括但不限于在提供的單選列表中進行選擇或手動輸入。
8.根據權利要求1所述的方法,其特征在于,所述的D步驟包括:
接收到的指示為二義性指示;對于有二義性的語句,接收用戶的自定義輸入釋義。
9.根據權利要求1所述的方法,其特征在于,所述的E步驟包括:
分詞結果、代詞或省略指代和二義性等信息隨著源文件一起保存,包括但不限于使用插件或通過格式文件存儲;保存的方式包括但不限于本地保存和保存到互聯網或云端。
10.本發現還公布了人機交互的分詞與語義標示的系統,系統包括獲取輸入模塊、分詞處理模塊、指代設置模塊及顯示模塊:
獲取輸入模塊接收文檔的輸入;分詞處理模塊對文檔進行初步處理,與數據庫進行匹配,進行分詞;指代設著模塊包括對文檔指代不明及省略部分提供指代選擇與接收用戶的選擇及輸入,還包括接收用戶對二義性語句的輸入釋義;顯示模塊處理對分詞結果的顯示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢元寶創意科技有限公司,未經武漢元寶創意科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410080020.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于自動通譯的設備和方法
- 下一篇:一種支持可變分塊的矩陣乘加速方法





