[發(fā)明專利]用于用戶問題語句處理的方法及裝置在審
| 申請?zhí)枺?/td> | 201811452424.6 | 申請日: | 2018-11-30 |
| 公開(公告)號: | CN109871437A | 公開(公告)日: | 2019-06-11 |
| 發(fā)明(設計)人: | 曹紹升;張賞;周俊 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 林祥 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語句 標準問題 用戶問題 分詞處理 相似度 方法和裝置 匹配 | ||
1.一種用于用戶問題語句處理的方法,包括:
基于經過分詞處理后的用戶問題語句和經過分詞處理后的至少一個標準問題語句,確定所述用戶問題語句與所述至少一個標準問題語句中的各個標準問題語句之間的相似度;以及
基于所確定出的相似度,從所述至少一個標準問題語句中確定出與所述用戶問題語句匹配的標準問題語句;
其中,所述基于經過分詞處理后的用戶問題語句和經過分詞處理后的至少一個標準問題語句,確定所述用戶問題語句與所述至少一個標準問題語句中的各個標準問題語句之間的相似度包括:
針對每個標準問題語句,確定該標準問題語句中的各個詞語和所述用戶問題語句中的各個詞語的兩兩相似度;
根據所確定的每對詞語的相似度的大小,確定所述用戶問題語句中的各個詞語與該標準問題語句中的相匹配的各個詞語的相似度;
基于所確定出的所述用戶問題語句中的各個詞語對應的相似度,確定所述用戶問題語句與該標準問題語句之間的相似度。
2.如權利要求1所述的方法,其中,基于經過分詞處理后的用戶問題語句和經過分詞處理后的至少一個標準問題語句,確定所述用戶問題語句與所述至少一個標準問題語句中的各個標準問題語句之間的相似度包括:
針對每個經過分詞處理后的標準問題語句,
基于該標準問題語句的各個詞語的詞向量和所述用戶問題語句中的各個詞語的詞向量,確定所述用戶問題語句中的各個詞語與該標準問題語句中的各個詞語之間的兩兩相似度;
對于所述用戶問題語句中的各個詞語,將所確定出的該標準問題語句中的各個詞語與該詞語之間的相似度中的最大相似度值確定為該詞語的相似度值;以及
基于所確定出的所述用戶問題語句中的各個詞語的相似度值,確定所述用戶問題語句與該標準問題語句之間的相似度。
3.如權利要求2所述的方法,其中,經過分詞處理后的所述各個標準問題語句中的各個詞語的詞向量和經過分詞處理后的所述用戶問題語句中的各個詞語的詞向量是通過基于詞向量集來對經過分詞處理后的所述各個標準問題語句和經過分詞處理后的所述用戶問題語句進行詞向量化后獲得的。
4.如權利要求2所述的方法,其中,經過分詞處理后的所述各個標準問題語句中的各個詞語的詞向量和經過分詞處理后的所述用戶問題語句中的各個詞語的詞向量是通過查詢詞向量集而獲得的。
5.如權利要求3或4所述的方法,其中,所述詞向量集是使用詞向量訓練模型來基于給定語料庫訓練出的。
6.如權利要求5所述的方法,其中,所述給定語料庫包括至少一個歷史用戶問題語句和所述至少一個標準問題語句。
7.如權利要求1所述的方法,還包括:
對所述用戶問題語句和所述至少一個標準問題語句進行分詞處理。
8.如權利要求6所述的方法,其中,所述給定語料庫包括經過分詞處理和詞語過濾處理后的至少一個歷史用戶問題語句以及所述經過分詞處理和詞語過濾處理后的至少一個標準問題語句。
9.如權利要求1所述的方法,還包括:
對經過分詞處理后的所述用戶問題語句和/或經過分詞處理后的所述至少一個標準問題語句進行詞語過濾處理。
10.如權利要求8或9所述的方法,其中,所述詞語過濾處理包括:
基于過濾詞數(shù)據庫來進行詞語過濾處理。
11.如權利要求8或9所述的方法,其中,所述詞語過濾處理包括:
基于詞語的詞頻來進行詞語過濾處理,
其中,所述詞語的詞頻是基于給定語料庫統(tǒng)計出的。
12.如權利要求11所述的方法,其中,所述詞頻是基于所述至少一個歷史用戶語句和所述至少一個標準語句統(tǒng)計出的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811452424.6/1.html,轉載請聲明來源鉆瓜專利網。





