[發明專利]用于確定主題的方法和裝置有效
| 申請號: | 201811624901.2 | 申請日: | 2018-12-28 |
| 公開(公告)號: | CN109710939B | 公開(公告)日: | 2023-06-09 |
| 發明(設計)人: | 王經委;張傲;劉佳祥;孫宇;李芝 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/30 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 確定 主題 方法 裝置 | ||
1.一種用于確定主題的方法,包括:
確定待識別語句序列;
計算所述待識別語句序列與目標領域內主題模板集合中每個主題模板的相似度,其中,所述主題模板集合中的每個主題模板對應所述目標領域內至少一個主題中的主題,主題模板包括主題階段序列,主題階段包括主題語句序列;
根據關聯參數確定所述待識別語句序列的主題,其中,所述關聯參數包括所述待識別語句序列與所述主題模板集合中每個主題模板的相似度;
其中,所述計算所述待識別語句序列與所述主題模板集合中每個主題模板的相似度,包括:
對于所述主題模板集合中的每個主題模板,執行以下第一相似度計算步驟:對于所述待識別語句序列中每個待識別語句,計算該待識別語句與該主題模板所包括的每個主題語句的相似度;利用動態規劃算法,在至少一種映射方式中,以按照該種映射方式計算得到的所述待識別語句序列與該主題模板的相似度最大化為目標,確定最優映射方式,其中,映射方式用于將所述待識別語句序列中每個待識別語句對應到該主題模板中的主題階段;將按照所確定的最優映射方式計算得到的所述待識別語句序列與該主題模板的相似度確定為所述待識別語句序列與該主題模板的相似度;
其中,所述按照該種映射方式計算得到的所述待識別語句序列與該主題模板的相似度是通過第二相似度計算步驟計算得到的,所述第二相似度計算步驟包括:
對于所述待識別語句序列中的每個待識別語句,根據與該待識別語句對應的映射主題階段所包括的主題語句序列中各主題語句與該待識別語句的相似度,確定該待識別語句與對應的映射主題階段的相似度,所述與該待識別語句對應的映射主題階段為按照該種映射方式,將該待識別語句映射至的該主題模板所包括的主題階段;
將所述待識別語句序列中各個待識別語句與對應的映射主題階段的相似度的平均值確定為按照該種映射方式該待識別語句與該主題模板的相似度。
2.根據權利要求1所述的方法,其中,所述按照該種映射方式計算得到的所述待識別語句序列與該主題模板的相似度是通過第三相似度計算步驟計算得到的,所述第三相似度計算步驟包括:
對于所述待識別語句序列中的每個待識別語句,確定與該待識別語句對應的映射主題階段,所述與該待識別語句對應的映射主題階段為按照該種映射方式將該待識別語句映射至的該主題模板所包括的主題階段;
對于該主題模板所包括的每個主題階段,根據該主題階段所包括的主題語句序列中各主題語句與映射至該主題階段的各待識別語句之間的相似度,確定所述待識別語句序列與該主題階段對應的相似度;
將所述待識別語句序列與該主題模板所包括的各主題階段對應的相似度的平均值確定為所述待識別語句序列與該主題模板的相似度。
3.根據權利要求1所述的方法,其中,所述根據與該待識別語句對應的映射主題階段所包括的主題語句序列中各主題語句與該待識別語句的相似度,確定該待識別語句與對應的映射主題階段的相似度,包括:
將與該待識別語句對應的映射主題階段所包括的主題語句序列中各主題語句與該待識別語句的相似度中的最大值,確定為該待識別語句與對應的映射主題階段的相似度。
4.根據權利要求1所述的方法,其中,所述根據與該待識別語句對應的映射主題階段所包括的主題語句序列中各主題語句與該待識別語句的相似度,確定該待識別語句與對應的映射主題階段的相似度,包括:
將與該待識別語句對應的映射主題階段所包括的主題語句序列中各主題語句與該待識別語句的相似度的加權平均值,確定為該待識別語句與對應的映射主題階段的相似度。
5.根據權利要求1所述的方法,其中,所述根據關聯參數確定所述待識別語句序列的主題,包括:
將所述主題模板集合中與所述待識別語句序列的相似度最大的主題模板對應的主題確定為所述待識別語句序列的主題。
6.根據權利要求1-5中任一所述的方法,其中,所述確定待識別語句序列,包括:
實時獲取用戶使用終端設備輸入的當前對話語句以及歷史上一主題對話語句序列;
將在所述歷史上一主題對話語句序列的末尾添加所述當前對話語句后所得到的新的語句序列確定為所述待識別語句序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811624901.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:依存句法樹構建系統
- 下一篇:一種文章立意的分析及文章評分方法、裝置





