[發(fā)明專利]一種基于語義模型的手寫輸入的優(yōu)化方法、系統(tǒng)及介質(zhì)有效
| 申請?zhí)枺?/td> | 202110558066.2 | 申請日: | 2021-05-21 |
| 公開(公告)號: | CN113313001B | 公開(公告)日: | 2023-10-10 |
| 發(fā)明(設(shè)計)人: | 張濤;索春寶;胡焱;牛鵬 | 申請(專利權(quán))人: | 浪潮金融信息技術(shù)有限公司 |
| 主分類號: | G06V30/32 | 分類號: | G06V30/32;G06V30/19 |
| 代理公司: | 北京權(quán)智天下知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11638 | 代理人: | 王新愛 |
| 地址: | 215100 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 語義 模型 手寫輸入 優(yōu)化 方法 系統(tǒng) 介質(zhì) | ||
本發(fā)明公開了一種基于語義模型的手寫輸入的優(yōu)化方法、系統(tǒng)及介質(zhì),方法包括以下步驟:獲取個體語音輸入的數(shù)據(jù)和應(yīng)用場景,根據(jù)個體語音輸入的數(shù)據(jù)創(chuàng)建語義模型;將個體語音輸入的應(yīng)用場景與語義模型建立映射關(guān)系;根據(jù)映射關(guān)系對所述語義模型執(zhí)行分類操作,根據(jù)分類操作結(jié)果提取若干句向量;配置權(quán)重關(guān)系,根據(jù)權(quán)重關(guān)系,對句向量拆分,生成若干詞向量;獲取個體手寫操作,根據(jù)詞向量與句向量的權(quán)重關(guān)系,對個體手寫操作執(zhí)行關(guān)聯(lián)推薦,本發(fā)明能夠通過個性化的語音輸入生成和訓(xùn)練模型,提取句向量,區(qū)分句向量的出現(xiàn)頻率,并在個體手寫輸入時,根據(jù)時間域和空間域?yàn)閭€體推薦句向量或詞向量,可以提升手寫輸入的準(zhǔn)確率,并大大提升手寫輸入的效率。
技術(shù)領(lǐng)域
本發(fā)明涉及手寫輸入技術(shù)領(lǐng)域,特別是涉及一種基于語義模型的手寫輸入的優(yōu)化方法、系統(tǒng)及介質(zhì)。
背景技術(shù)
現(xiàn)有的技術(shù)方案通過計算文本的編輯距離、相似系數(shù)或TF-IDF(term frequency–inverse document frequency)信息檢索數(shù)據(jù)挖掘的常用加權(quán)技術(shù)計算等。
編輯距離,英文叫做Edit Distance,又稱Levenshtein距離,是指兩個字串之間,由一個轉(zhuǎn)成另一個所需的最少編輯操作次數(shù),如果它們的距離越大,說明它們越是不同,許可的編輯操作包括將一個字符替換成另一個字符,插入一個字符,刪除一個字符。
相似系數(shù),用于比較有限樣本集之間的相似性與差異性,相似系數(shù)值越大,樣本相似度越高。計算方式非常簡單,兩個樣本的交集除以并集得到的數(shù)值,當(dāng)兩個樣本完全一致時,結(jié)果為1,當(dāng)兩個樣本完全不同時,結(jié)果為0。
第三種方案就是直接計算TF矩陣中兩個向量的相似度了,實(shí)際上就是求解兩個向量夾角的余弦值,就是點(diǎn)乘積除以二者的模長。
現(xiàn)有的計算文本相似都是基于詞的相似度計算方法,沒有對文字輸入的用于的工作情況、個人喜好或者家庭因素進(jìn)行參考的語義理解,僅基于句子表層的關(guān)鍵詞信息,不能區(qū)別在語義或句法結(jié)構(gòu)上相似的句子,在各種辦公或者高校的智能屏幕中,基于語義模型的手寫輸入的優(yōu)化方法對于加快文字輸入的速度及關(guān)聯(lián)字推薦有重要的影響。
發(fā)明內(nèi)容
本發(fā)明主要解決的是現(xiàn)有的手寫輸入沒有參照使用者的使用情況、工作因素和個人喜好推薦關(guān)聯(lián)字的問題。
為解決上述技術(shù)問題,本發(fā)明采用的一個技術(shù)方案是:提供一種基于語義模型的手寫輸入的優(yōu)化方法,包括以下步驟:
獲取個體語音輸入的數(shù)據(jù)和應(yīng)用場景,根據(jù)個體語音輸入的數(shù)據(jù)創(chuàng)建語義模型;
將所述個體語音輸入的應(yīng)用場景與所述語義模型建立映射關(guān)系;
根據(jù)所述映射關(guān)系對所述語義模型執(zhí)行分類操作,根據(jù)所述分類操作結(jié)果提取若干句向量;
配置權(quán)重關(guān)系,并根據(jù)權(quán)重關(guān)系,對所述句向量拆分,生成若干詞向量;
獲取個體手寫操作,根據(jù)所述詞向量與所述句向量的權(quán)重關(guān)系,對所述個體手寫操作執(zhí)行關(guān)聯(lián)推薦。
優(yōu)選地,所述獲取個體語音輸入的數(shù)據(jù)和應(yīng)用場景,根據(jù)個體語音輸入的數(shù)據(jù)創(chuàng)建語義模型的步驟進(jìn)一步包括:
配置第一閾值和閾值區(qū)間,對所述個體語音輸入的數(shù)據(jù)執(zhí)行數(shù)據(jù)特性解析操作,將滿足所述第一閾值的所述數(shù)據(jù)作為特性向量;
提取所述特性向量創(chuàng)建語義模型。
優(yōu)選地,所述將所述個體手寫輸入的應(yīng)用場景與所述語義模型建立映射關(guān)系的步驟進(jìn)一步包括:
獲取所述應(yīng)用場景的所述特性向量,將所述特性向量及對應(yīng)的應(yīng)用場景和語義模型建立映射關(guān)系。
優(yōu)選地,所述根據(jù)所述映射關(guān)系對所述語義模型執(zhí)行分類操作,根據(jù)所述分類操作結(jié)果提取若干句向量的步驟進(jìn)一步包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浪潮金融信息技術(shù)有限公司,未經(jīng)浪潮金融信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110558066.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





