[發明專利]一種面向非自由談話式漢語口語的對話行為分析方法有效
| 申請號: | 201711087012.2 | 申請日: | 2017-11-07 |
| 公開(公告)號: | CN107832293B | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 季競;龐在虎;朱風云;吳昊 | 申請(專利權)人: | 北京靈伴即時智能科技有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/211;G06F40/253;G06F40/205 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100083 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 自由 談話 漢語 口語 對話 行為 分析 方法 | ||
1.一種用于智能對話系統的面向非自由談話式漢語口語的對話行為分析方法,包括如下步驟:
步驟一、對文本或語音識別的文本進行分詞和詞性標注;
步驟二、對分詞及詞性標注后的文本句子進行句法分析;所述句法分析包括句類分析和對言語行為動詞進行標注;所述句類分析指為每個句子加注標簽;
步驟三、對分詞及詞性標注后的文本句子進行信息結構分析;所述信息結構分析是指對名詞性成分的指稱范疇進行標注;
步驟四、對文本句子進行話輪和話段的劃分;
步驟五、根據句類和信息結構對話輪進行鄰近對分析,再得到各個話輪的對答類型分析;
步驟六、通過鄰近對類型得到話段對答形式結構標簽;
步驟七、根據對答類型、句類和信息結構確定話輪的交際功能;所述交際功能分為任務管理、任務內容相關和任務內容無關三大類;所述交際功能由對答類型、任務進程、句法特征和信息結構來判定;
步驟三中,根據所述名詞性成分的激活代價,確定其指稱范疇標簽;激活代價分為三種,如果一個名詞性成分在上文已經提及,再次提及時由于聽者頭腦中已經激活,激活代價最低;如果一個名詞性成分在提及時是未激活的新信息,則激活代價最高;若一個名詞性成分雖未在上文中提及,但與已出現的名詞性成分有直接關聯,則為半激活狀態,激活代價居中;
步驟四中,所述話輪的結尾以說話者或聽話者的角色互換或各方的沉默為標志,在話輪標注的同時也標注出話語來源;若同一話輪中的句子分屬不同主題,則將所述話輪分割為不同話段的兩個話輪;
步驟五中,所述鄰近對是指將對答的話輪分為引發語和應答語;在對答類型分析時,首先確定話輪的角色為引發語還是應答語,再確定其所屬鄰近對類別,根據這兩者來添加對答類型標簽;對答類型分為社交對答類型、信息轉移類型、行為商討類型和非有效話輪;
步驟七中,采用任務進程對所述交際功能進行分類時,所述任務進程以任務開啟和任務結束兩個節點劃分為任務開始前,任務進行中和任務結束后三個階段;任務開啟的標志是第一個充當引發語的信息轉移或行為商討類話輪;任務結束的標志是最后一個不含社交對答類型的話段的結束;
利用面向非自由談話式漢語口語的對話行為分析方法對真實客服與用戶的對話進行標注,再利用標注后的文本作為訓練集訓練智能對話系統模型。
2.如權利要求1所述的一種用于智能對話系統的面向非自由談話式漢語口語的對話行為分析方法,其特征在于:步驟二中,所述句類分析是將句子根據語氣分為陳述句、疑問句、祈使句和感嘆句;并將疑問句分為是非問、特指問、選擇問和反問句;對言語行為動詞進行標注指對五種類型的動詞進行標注,分別是斷言式、指令式、承諾式、表情式和宣告式。
3.如權利要求1所述的一種用于智能對話系統的面向非自由談話式漢語口語的對話行為分析方法,其特征在于:步驟六中,所述對答形式結構分為毗鄰式和嵌入式兩大類,所述毗鄰式又分為毗鄰雙部式和毗鄰多部式;所述嵌入式又分為單層嵌入式、多層嵌入式、毗鄰與嵌入綜合式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京靈伴即時智能科技有限公司,未經北京靈伴即時智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711087012.2/1.html,轉載請聲明來源鉆瓜專利網。





