[發明專利]在進行輸入時基于社會關系提供候選詞的方法和裝置有效
| 申請號: | 201310322607.7 | 申請日: | 2013-07-29 |
| 公開(公告)號: | CN103399906A | 公開(公告)日: | 2013-11-20 |
| 發明(設計)人: | 吳先超 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 羅延紅;王兆賡 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 進行 輸入 基于 社會關系 提供 候選 方法 裝置 | ||
技術領域
本發明涉及一種在進行輸入時提供候選詞的方法和裝置,更具體地說,涉及一種在進行輸入時基于社會關系提供候選詞的方法和裝置。
背景技術
現在,隨著通信技術的發展,應用于各種通信終端(諸如基于支持各種通信系統的通信協議的移動通信終端、個人數字助理(PDA)、智能電話、臺式計算機、筆記本計算機、和平板電腦等)的輸入法系統也越來越豐富。然而,目前的輸入法系統存在如下問題:1.對文字聊天的通信對方的身份以及輸入法使用者和對方的社會關系不敏感;2.由于這種社會關系的不敏感,使得輸入法難以正確選擇是使用平常用語文法、還是使用自謙語文法、還是使用敬語文法。
例如,在中文輸入法中,對于一位女性用戶而言,在說“你”的情況下,如果對方是不同的人,則需要使用不同的詞語。當對方是該女性輸入法用戶的丈夫的時候,通常使用“老公”;當對方是該女性輸入法用戶的商業往來的客戶的時候,通常使用“您”或者“客人您”這樣的字眼;當對方是該女性輸入法用戶的父親的時候,通常使用“您”或者“爸爸”。另外,在中文中,在體現對對方尊敬的時候,一般使用對對方的尊敬語,以及對自己的自謙語,這些直接反應在文法中。例如,當表示“對不起”這個意思的時候,輸入法的用戶一般會根據對方和自己的社會關系來動態選擇所需要的詞語。作為示例,當對方是下級或者晚輩的時候,一般說的是“不好意思”,對不起的程度比較輕;當對方是自己的同事等的時候,一般用“對比起”,對不起的程度一般;當對方是自己的長輩或者老師或者商業客戶的時候,一般用“十分抱歉”這種正式的“對不起”的用語,其程度也逐漸更加誠懇和認真。這樣,當通信對方是用戶的長輩老師或者商業客戶時,在用戶輸入了“對不起”的情況下,如果輸入法提示用戶最好使用“十分抱歉”或者更加尊敬的詞語,則會使最終的交流溝通目的被更好地表達,從而協助用戶糾正用詞不當的問題。因此,需要一種可以向用戶提供適合于與對方的社會關系的候選詞的輸入法。
發明內容
根據本發明的多個方面,提供了一種在進行輸入時基于社會關系提供候選詞的方法和裝置,所述方法和裝置可以根據用戶與通信對方的聊天記錄判斷用戶與通信對方的社會關系,從而向用戶提供適合于所述社會關系的候選詞。
根據本發明的一方面,提供了一種在進行輸入時基于社會關系提供候選詞的方法,所述方法包括:檢測用戶的輸入;當檢測到用戶的輸入時,確定當前應用環境是否為信息交換應用;當確定當前應用環境是信息交換應用時,確定與用戶通信的通信對方的標識符;基于確定的通信對方的標識符,根據社會關系自動判定模型來確定用戶與通信對方的社會關系,其中,社會關系自動判定模型是判斷用戶與通信對方的社會關系的模型;根據社會關系修正映射表確定用戶的輸入是否和確定的社會關系匹配,其中,社會關系修正映射表基于確定的社會關系提供與所述社會關系相應的修正候選詞;如果所述輸入與所述社會關系不匹配,則基于社會關系修正映射表向用戶提供與確定的社會關系匹配的修正候選詞。
確定當前應用環境是否為信息交換應用的步驟可包括:通過調用當前應用環境的預定參數確定當前應用環境是否為信息交換應用。
確定與用戶通信的通信對方的標識符的步驟可包括:通過在信息交換應用中提取與通信對方的標識符相關的信息來確定通信對方的標識符。
所述方法還可包括:預先建立社會關系自動判定模型,其中,建立社會關系自動判定模型的步驟包括:根據存儲在信息交換應用中的用戶與通信對方的聊天記錄標注用戶與通信對方的社會關系;利用n元語言模型對聊天記錄進行特征提取;將特征提取后的聊天記錄和標注的社會關系作為訓練數據,基于分類算法訓練社會關系自動判定模型,其中,社會關系自動判定模型包括聊天記錄元素和社會關系元素。
所述方法還可包括:預先建立社會關系修正映射表,其中,建立社會關系自動判定模型的步驟包括:過手動構建和/或自動挖掘算法建立用語形式映射表,所述用語形式映射表是關于針對各個詞語的平常用語形式、自謙語形式和尊敬語形式的對應映射表;基于建立的用語形式映射表以及建立的社會關系自動判定模型來建立社會關系修正映射表,其中,社會關系修正映射表包括社會關系元素、用戶輸入元素和修正候選詞元素。
所述自動挖掘算法可以是最大期望算法的詞對齊模型算法。
預先建立社會關系修正映射表的步驟還可包括:根據用戶對提供的候選詞的選擇來更新社會關系修正映射表。
社會關系可包括平輩或平級關系、長晚輩關系、上下級關系以及商務關系。
與社會關系相關的候選詞的形式可包括自謙語形式、尊敬語形式和平常用語形式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310322607.7/2.html,轉載請聲明來源鉆瓜專利網。





