[發明專利]針對無法直接采集的會話場景標簽進行自動獲取的方法有效
| 申請號: | 201710076036.1 | 申請日: | 2017-02-13 |
| 公開(公告)號: | CN106844732B | 公開(公告)日: | 2020-05-08 |
| 發明(設計)人: | 陳包容 | 申請(專利權)人: | 長沙軍鴿軟件有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F40/289;G06F40/30 |
| 代理公司: | 合肥左心專利代理事務所(普通合伙) 34152 | 代理人: | 姜玲玲 |
| 地址: | 410000 湖南省長沙市高新開發*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 針對 無法 直接 采集 會話 場景 標簽 進行 自動 獲取 方法 | ||
1.一種針對無法直接采集的會話場景標簽進行自動獲取的方法,其特征在于,包括:
獲取待采集的會話場景標簽項;
將所述會話場景標簽項分為第一會話場景標簽項和第二會話場景標簽項,其中,所述第一會話場景標簽項為能直接采集的會話場景標簽項,第二會話場景標簽項為不能直接采集的會話場景標簽項;
對所述第一會話場景標簽項進行直接采集,獲得與所述第一會話場景標簽項對應的第一會話場景標簽;
根據所述第二會話場景標簽項,
搜索或匹配獲得第二會話場景標簽;
根據所述第一會話場景標簽推理獲得第二會話場景標簽;
通過對會話內容進行語義推理獲得第二會話場景標簽;
通過獲取與會話內容關聯的關聯詞獲得第二會話場景標簽;
其中,通過獲取與會話內容關聯的關聯詞獲得第二會話場景標簽包括:
對會話內容進行分詞,獲得分詞文本;
獲取與所述第二會話場景標簽項關聯的分詞文本,獲得第一關聯文本;
根據預設的關聯詞庫,獲取與所述第一關聯文本關聯的關聯詞,獲得第二關聯文本;
根據所述第一關聯文本和/或所述第一關聯文本,獲得與所述第二會話場景標簽項對應的第二會話場景標簽;
根據已訓練好的分類器分類獲得第二會話場景標;
通過已獲得的第二會話場景標簽進一步多層次推理計算獲得其他的第二會話場景標簽。
2.根據權利要求1所述的針對無法直接采集的會話場景標簽進行自動獲取的方法,其特征在于,根據所述第一會話場景標簽推理獲得第二會話場景標簽包括:
根據所述第一會話場景標簽以及預設的場景標簽推理規則,獲得與所述第二會話場景標簽項對應的第二會話場景標簽。
3.根據權利要求2所述的針對無法直接采集的會話場景標簽進行自動獲取的方法,其特征在于,根據已訓練好的分類器分類獲得第二會話場景標簽包括:
預先訓練好用于獲得會話場景標簽的分類器;
將會話內容和/或所述第一會話場景標簽和/或搜索或匹配獲得第二會話場景標簽和/或推理獲得的第二會話場景標簽和/或通過對會話內容進行語義推理獲得的第:會話場景標簽,作為所述分類器的輸入;
根據所述分類器的輸出結果,獲得與所述第二會話場景標簽項對應的第二會話場景標簽。
4.根據權利要求3所述的針對無法直接采集的會話場景標簽進行自動獲取的方法,其特征在于,所述第一會話場景標簽項包括:
會話通訊雙方的時間、地點、日期、天氣、季節、體感數據,會話通訊雙方會話通訊的間隔時間頻率時間跨度場景標簽項中的一種或多種組合。
5.根據權利要求4所述的針對無法直接采集的會話場景標簽進行自動獲取的方法,其特征在于,所述第二會話場景標簽項包括:
會話內容主題,會話通訊雙方的會話意圖、性別、職業、職務、心情、興趣愛好、健康狀況、實時行為狀態,會話內容的句型、句類、句式結構類型,以及總量場景標簽項中的一種或多種組合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于長沙軍鴿軟件有限公司,未經長沙軍鴿軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710076036.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:隧道式烘干窯傳動鏈條的漲緊裝置
- 下一篇:一種煙絲切絲機鏈條張緊裝置





