[發明專利]一種詞聯想方法及裝置有效
| 申請號: | 201810820915.5 | 申請日: | 2018-07-24 |
| 公開(公告)號: | CN109298796B | 公開(公告)日: | 2022-05-24 |
| 發明(設計)人: | 王富田;李健;張連毅;武衛東 | 申請(專利權)人: | 北京捷通華聲科技股份有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023;G06F40/211;G06F40/289;G06F40/30 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100193 北京市海淀區東北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 聯想 方法 裝置 | ||
本發明實施例提供了一種詞聯想方法及裝置,涉及計算機技術領域,以解決現有的詞聯想方法無法滿足用戶的個性化需求的問題。其中,所述詞聯想方法,包括:按照預設規則依次讀入歷史文本數據,將歷史文本數據劃分為若干個子文本數據;分別對每個子文本數據進行句法結構分析;讀取給定的待分析詞;在若干個子文本數據中,識別待分析詞所屬的至少一個目標子文本數據;從目標子文本數據中,提取至少一個待分析詞的鄰近詞;根據目標子文本數據的句法結構分析結論,得到對應的鄰近詞與待分析詞的語義相關強度和共現緊密度;根據語義相關強度和共現緊密度,顯示聯想結果。本發明實施例所提供的詞聯想方法用于計算機。
技術領域
本發明涉及計算機技術領域,特別是涉及一種詞聯想方法及裝置。
背景技術
目前,詞聯想技術應用于互聯網,如在輸入法中,當用戶輸入給定詞后,可聯想并顯示出多個推薦詞,提升用戶的使用體驗;又如在翻譯或者語音識別中,對于同一詞語可聯想出多種結果,以為用戶提供較為流暢的翻譯文本或者識別文本,提升用戶的閱讀性。
詞聯想通常采用的方法有:一、利用人工經驗進行總結,建立一些常見的聯想詞串數據集。二、從一些已知的文本中采集一些詞串的統計信息,按照頻率排序進行推薦返回。
以上兩種方法的中心思路都是基于給定詞推薦給用戶出現頻率較高的詞語,因此,對于同一給定詞,聯想結果是一樣的。而對于不同的用戶,使用習慣、認知范圍、應用語境等各不相同,從而無法滿足用戶的個性化需求,影響使用體驗。
發明內容
本發明的實施例提供一種詞聯想方法,以解決現有的詞聯想方法無法滿足用戶的個性化需求的問題。
一方面,本發明公開了一種詞聯想方法,包括:按照預設規則依次讀入歷史文本數據,將所述歷史文本數據劃分為若干個子文本數據;分別對每個所述子文本數據進行句法結構分析;讀取給定的待分析詞;在所述若干個子文本數據中,識別所述待分析詞所屬的至少一個目標子文本數據;從所述目標子文本數據中,提取至少一個所述待分析詞的鄰近詞;根據所述目標子文本數據的句法結構分析結論,得到對應的所述鄰近詞與所述待分析詞的語義相關強度和共現緊密度;根據所述語義相關強度和所述共現緊密度,顯示聯想結果。
另一方面,本發明公開了一種詞聯想裝置,包括讀入模塊,用于按照預設規則依次讀入歷史文本數據,將所述歷史文本數據劃分為若干個子文本數據;分析模塊,用于分別對每個所述子文本數據進行句法結構分析;讀取模塊,用于讀取給定的待分析詞;識別模塊,用于在所述若干個子文本數據中,識別所述待分析詞所屬的至少一個目標子文本數據;提取模塊,用于從所述目標子文本數據中,提取至少一個所述待分析詞的鄰近詞;聯想模塊,用于根據所述目標子文本數據的句法結構分析結論,得到對應的所述鄰近詞與所述待分析詞的語義相關強度和共現緊密度;顯示模塊,用于根據所述語義相關強度和所述共現緊密度,顯示聯想結果。
與現有技術相比,本發明實施例包括以下優點:
將歷史文本數據劃分為若干個子文本數據,并分別對每個子文本數據進行句法結構分析,從而得到每個子文本數據的句法結構分析結論。當讀取到給定的待分析詞后,首先在所有的子文本數據中,識別給定的待分析詞,并將待分析詞所屬的子文本數據作為目標子文本數據,從目標子文本數據中提取待分析詞所屬上下文的鄰近詞。無論是多個目標子文本數據或者一個目標子文本數據,其包括的鄰近詞的數量都可以是多個,從而分別對每個鄰近詞進行分析,根據其所在子文本數據的句法結構分析結論,計算鄰近詞與待分析詞的語義相關強度和共現緊密度,再將二者綜合考慮后,得到各鄰近詞與待分析詞的不同相關程度,并依據相關程度顯示各鄰近詞作為聯想結果。可見,在本實施例中,在詞聯想的過程中,結合句法結構分析結論,綜合考慮了語義相關強度和共現緊密度,聯想的結果不僅基于高頻率,還考慮到語義的影響,聯想結果更能滿足用戶需求。特別是歷史文本數據包括用戶的大量使用記錄時,經上述詞聯想方法推薦的聯想詞是結合了用戶常用語境的,從而與用戶使用的匹配度更高,滿足用戶的個性化需求,提高用戶使用體驗。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京捷通華聲科技股份有限公司,未經北京捷通華聲科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810820915.5/2.html,轉載請聲明來源鉆瓜專利網。





