[發明專利]問句擴展方法及裝置、存儲介質、終端在審
| 申請號: | 201711338455.4 | 申請日: | 2017-12-14 |
| 公開(公告)號: | CN108090169A | 公開(公告)日: | 2018-05-29 |
| 發明(設計)人: | 陳培華;朱頻頻 | 申請(專利權)人: | 上海智臻智能網絡科技股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 張振軍;吳敏 |
| 地址: | 201803 上海市嘉*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 詞語 存儲介質 詞組合 終端 判斷結果 相鄰詞語 自動生成 分詞 過濾 替換 保證 | ||
1.一種問句擴展方法,其特征在于,包括:
獲取待擴展問句,并對所述待擴展問句進行分詞,以得到多個原始詞語;
對所述多個原始詞語進行相關詞替換,以得到原始詞語與相關詞組合或者相關詞與相關詞組合的多個擴展問句;
對每一擴展問句中包括所述相關詞的相鄰詞語之間的組合有效性進行判斷;
根據判斷結果對所述多個擴展問句進行過濾。
2.根據權利要求1所述的問句擴展方法,其特征在于,所述對所述多個原始詞語進行相關詞替換包括:
利用所述多個原始詞語對應的詞類對所述多個原始詞語進行相關詞替換;
或者,利用同義詞詞典對所述多個原始詞語進行同義詞替換。
3.根據權利要求1所述的問句擴展方法,其特征在于,所述對每一擴展問句中包括所述相關詞的相鄰詞語之間的組合有效性進行判斷包括:
確定每一擴展問句中包括所述相關詞的相鄰詞語之間的組合概率;
利用所述組合概率計算擴展問句的有效分數;
將所述擴展問句的有效分數與設定閾值比較,以得到所述判斷結果。
4.根據權利要求3所述的問句擴展方法,其特征在于,所述根據判斷結果對所述多個擴展問句進行過濾包括:
如果所述判斷結果表示所述擴展問句的有效分數達到所述設定閾值,則保留所述擴展問句,以作為所述待擴展問句的擴展問。
5.根據權利要求3所述的問句擴展方法,其特征在于,所述利用所述組合概率計算擴展問句的有效分數包括:
計算所述組合概率之和,以作為所述擴展問句的有效分數。
6.根據權利要求3所述的問句擴展方法,其特征在于,所述確定每一擴展問句中包括所述相關詞的相鄰詞語之間的組合概率包括:
利用漢語語言模型或神經網絡語言模型確定每一擴展問句中包括所述相關詞的相鄰詞語之間的組合概率。
7.根據權利要求6所述的問句擴展方法,其特征在于,所述獲取待擴展的問句之前還包括:
利用預設原始語料對所述漢語語言模型或所述神經網絡語言模型進行訓練。
8.根據權利要求1所述的問句擴展方法,其特征在于,所述待擴展問句為知識點中的標準問或有效擴展問。
9.根據權利要求1所述的問句擴展方法,其特征在于,所述獲取待擴展的問句之前還包括:
利用預設原始語料對詞向量模型進行訓練;
利用訓練完成的詞向量模型獲取多組新增相關詞,并更新同義詞詞典,以用于進行相關詞替換。
10.根據權利要求9所述的問句擴展方法,其特征在于,所述利用訓練完成的詞向量模型獲取多組相關詞包括:
利用所述訓練完成的詞向量模型獲取述預設原始語料中所有詞語的詞向量;
根據詞向量之間的距離確定所述多組新增相關詞。
11.根據權利要求9所述的問句擴展方法,其特征在于,所述利用訓練完成的詞向量模型獲取多組相關詞包括:
利用所述訓練完成的詞向量模型獲取每組同義詞中所有詞語的詞向量,以及所述預設原始語料中所有詞語的詞向量;
根據詞向量之間的距離確定每組同義詞中所有詞語的相關詞;
將每組同義詞中所有詞語的相關詞取交集,以確定所述多組新增相關詞。
12.根據權利要求1所述的問句擴展方法,其特征在于,還包括:
將過濾后的多個擴展問句進行輸出,以加入知識庫,所述過濾后的多個擴展問句為所述待擴展問句的有效擴展問。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海智臻智能網絡科技股份有限公司,未經上海智臻智能網絡科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711338455.4/1.html,轉載請聲明來源鉆瓜專利網。





