[發明專利]用于法律咨詢的日常語言識別方法有效
| 申請號: | 202010132129.3 | 申請日: | 2020-02-29 |
| 公開(公告)號: | CN111368032B | 公開(公告)日: | 2020-12-11 |
| 發明(設計)人: | 吳怡 | 申請(專利權)人: | 重慶百事得大牛機器人有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/30;G06F40/263;G06Q50/18;G10L15/18;G10L15/22;G10L25/51 |
| 代理公司: | 重慶強大凱創專利代理事務所(普通合伙) 50217 | 代理人: | 文怡然 |
| 地址: | 401147 重慶市渝北區龍溪街道*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 法律咨詢 日常 語言 識別 方法 | ||
1.用于法律咨詢的日常語言識別方法,其特征在于,包括步驟:
S1、輸入法律咨詢的語音;S1具體包括:S11、輸入法律咨詢的語音;S12、對語音進行降噪處理;
S2、提取語音中的關鍵詞,分析語境,根據語境分析關鍵詞的含義;S2具體包括:S21、提取第一類關鍵詞;S22、提取第二類關鍵詞;S23、提取五要素,根據五要素生成語境,其中五因素包括何人、何時、何地、何因、何事;S24、結合語境分析第一類關鍵詞和第二類關鍵詞的語義;
S21具體包括:S21a、顯示音高曲線、共振峰曲線和音強曲線;S21b、獲取A類關鍵詞、B類關鍵詞以及C類關鍵詞為第一類關鍵詞,其中,A類關鍵詞為音高較高的詞,B類關鍵詞為說話時長較長的詞,C類關鍵詞為出現次數較多的詞;
S22具體包括:S22a、對語音進行劃分,得到若干個詞語;S22b、獲取法律語料庫;S22c、計算法律語料庫中每個詞語在語音中的tf值J以及在法律語料庫中的idf值K;S22d、根據tf值及idf值計算權重γ;γ=K*lg(J*W+1);其中,W為預設的生僻詞系數,且W≥1;S22e、選出預設個數權重最大的詞語作為第二類關鍵詞;
S3、根據關鍵詞的含義,結合日常交流習慣進行矯正或者替換,將日常語言轉化為法律術語;
S4、識別語音的法律意義;
S5、首先,進行前置判斷:若包含不超過20%或者一次性付清的信息,則輸出定金;若包含超過20%或者多次付清的信息,則輸出訂金;若前置判斷不能確定是訂金還是定金,則進行后續判斷:輸出定金、訂金和不知道三個選項供用戶選擇,若用戶選擇定金或者訂金,則輸出結果;若用戶選擇不知道,則根據約定的信息進行判斷。
2.根據權利要求1所述的用于法律咨詢的日常語言識別方法,其特征在于,步驟S3具體包括:S31、識別關鍵詞語義;S32、根據語義并依據日常交流習慣對關鍵詞進行矯正或者替換;S33、將矯正或者替換后的關鍵詞轉化為法律術語。
3.根據權利要求2所述的用于法律咨詢的日常語言識別方法,其特征在于,步驟S4具體包括:S41、抽取語音的時間特征;S42、提取每個時間點所對應的關鍵特征;S43、根據事件的發展規律識別含義。
4.根據權利要求3所述的用于法律咨詢的日常語言識別方法,其特征在于,還包括步驟S6,反饋和修正;具體包括:S61、將識別出的含義以文本或者語音的方式輸出,并提醒用戶確認;S62、若用戶確認含義正確,則輸出結果;若用戶確認含義有誤,則重新執行步驟S2-S5,直到用戶確認含義正確。
5.根據權利要求4所述的用于法律咨詢的日常語言識別方法,其特征在于,還包括步驟S7,學習與優化;具體包括:S71、儲存關鍵詞、法律術語和識別出的含義;S72、采用機器學習算法進行優化。
6.根據權利要求5所述的用于法律咨詢的日常語言識別方法,其特征在于,步驟S1中,若語音中包含有方言,先將方言轉換為普通話。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶百事得大牛機器人有限公司,未經重慶百事得大牛機器人有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010132129.3/1.html,轉載請聲明來源鉆瓜專利網。





