[發(fā)明專(zhuān)利]候選詞輸出方法、裝置、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110001436.2 | 申請(qǐng)日: | 2021-01-04 |
| 公開(kāi)(公告)號(hào): | CN112684915A | 公開(kāi)(公告)日: | 2021-04-20 |
| 發(fā)明(設(shè)計(jì))人: | 費(fèi)騰 | 申請(qǐng)(專(zhuān)利權(quán))人: | 上海臣星軟件技術(shù)有限公司 |
| 主分類(lèi)號(hào): | G06F3/023 | 分類(lèi)號(hào): | G06F3/023;G06F40/284;G06K9/62 |
| 代理公司: | 北京東方億思知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11258 | 代理人: | 趙秀芹 |
| 地址: | 201802 上海市嘉*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 候選 輸出 方法 裝置 電子設(shè)備 計(jì)算機(jī) 存儲(chǔ) 介質(zhì) | ||
本申請(qǐng)?zhí)峁┝艘环N候選詞輸出方法、裝置、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)。該候選詞輸出方法,應(yīng)用于服務(wù)端,包括:接收客戶(hù)端發(fā)送的用戶(hù)輸入內(nèi)容信息;分別計(jì)算用戶(hù)輸入內(nèi)容信息和各個(gè)預(yù)設(shè)的類(lèi)別的相似度;在相似度達(dá)到預(yù)設(shè)的相似度閾值的情況下,向客戶(hù)端發(fā)送相似度對(duì)應(yīng)類(lèi)別的候選詞集合,以使客戶(hù)端將候選詞集合中的每個(gè)候選詞依據(jù)預(yù)設(shè)的得分進(jìn)行排序輸出。根據(jù)本申請(qǐng)實(shí)施例,能夠更加準(zhǔn)確地輸出候選詞。
技術(shù)領(lǐng)域
本申請(qǐng)屬于輸入法調(diào)頻排序技術(shù)領(lǐng)域,尤其涉及一種候選詞輸出方法、裝置、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)。
背景技術(shù)
在輸入法調(diào)頻排序技術(shù)領(lǐng)域,調(diào)頻技術(shù)就是利用額外信息(上下文信息、用戶(hù)使用習(xí)慣信息、所在地域信息、輸入App信息等)對(duì)候選詞進(jìn)行二次打分,然后進(jìn)行重排序的技術(shù)。
目前,各家輸入法調(diào)頻的方法都是相似的,就是利用上面提到的額外信息訓(xùn)練相關(guān)的模型,然后將各個(gè)模型融合進(jìn)行打分。但是,針對(duì)每一種信息訓(xùn)練出來(lái)的模型由于受到客戶(hù)端內(nèi)存、性能等限制,模型的尺寸限制很厲害,所以模型涉及到的詞的范圍很受限制,一般只能涉及到一些高頻的詞,導(dǎo)致輸入法推薦的候選詞不準(zhǔn)確。
因此,如何更加準(zhǔn)確地輸出候選詞是本領(lǐng)域技術(shù)人員亟需解決的技術(shù)問(wèn)題。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供一種候選詞輸出方法、裝置、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì),能夠更加準(zhǔn)確地輸出候選詞。
第一方面,本申請(qǐng)實(shí)施例提供一種候選詞輸出方法,應(yīng)用于服務(wù)端,包括:
接收客戶(hù)端發(fā)送的用戶(hù)輸入內(nèi)容信息;
分別計(jì)算用戶(hù)輸入內(nèi)容信息和各個(gè)預(yù)設(shè)的類(lèi)別的相似度;
在相似度達(dá)到預(yù)設(shè)的相似度閾值的情況下,向客戶(hù)端發(fā)送相似度對(duì)應(yīng)類(lèi)別的候選詞集合,以使客戶(hù)端將候選詞集合中的每個(gè)候選詞依據(jù)預(yù)設(shè)的得分進(jìn)行排序輸出。
可選的,在分別計(jì)算用戶(hù)輸入內(nèi)容信息和各個(gè)預(yù)設(shè)的類(lèi)別的相似度之前,方法還包括:
獲取樣本用戶(hù)輸入內(nèi)容信息;
對(duì)樣本用戶(hù)輸入內(nèi)容信息進(jìn)行聚類(lèi),確定各個(gè)預(yù)設(shè)的類(lèi)別。
可選的,在對(duì)樣本用戶(hù)輸入內(nèi)容信息進(jìn)行聚類(lèi),確定各個(gè)預(yù)設(shè)的類(lèi)別之后,方法還包括:
針對(duì)每個(gè)類(lèi)別中的樣本用戶(hù)輸入內(nèi)容信息進(jìn)行分詞,得到類(lèi)別對(duì)應(yīng)的候選詞集合。
可選的,獲取樣本用戶(hù)輸入內(nèi)容信息,包括:
從用戶(hù)輸入日志中獲取樣本用戶(hù)輸入內(nèi)容信息。
第二方面,本申請(qǐng)實(shí)施例提供了一種候選詞輸出裝置,應(yīng)用于服務(wù)端,包括:
接收模塊,用于接收客戶(hù)端發(fā)送的用戶(hù)輸入內(nèi)容信息;
計(jì)算模塊,用于分別計(jì)算用戶(hù)輸入內(nèi)容信息和各個(gè)預(yù)設(shè)的類(lèi)別的相似度;
發(fā)送模塊,用于在相似度達(dá)到預(yù)設(shè)的相似度閾值的情況下,向客戶(hù)端發(fā)送相似度對(duì)應(yīng)類(lèi)別的候選詞集合,以使客戶(hù)端將候選詞集合中的每個(gè)候選詞依據(jù)預(yù)設(shè)的得分進(jìn)行排序輸出。
可選的,該裝置還包括:
獲取模塊,用于獲取樣本用戶(hù)輸入內(nèi)容信息;
聚類(lèi)模塊,用于對(duì)樣本用戶(hù)輸入內(nèi)容信息進(jìn)行聚類(lèi),確定各個(gè)預(yù)設(shè)的類(lèi)別。
可選的,該裝置還包括:
分詞模塊,用于針對(duì)每個(gè)類(lèi)別中的樣本用戶(hù)輸入內(nèi)容信息進(jìn)行分詞,得到類(lèi)別對(duì)應(yīng)的候選詞集合。
可選的,獲取模塊,包括:
獲取單元,用于從用戶(hù)輸入日志中獲取樣本用戶(hù)輸入內(nèi)容信息。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于上海臣星軟件技術(shù)有限公司,未經(jīng)上海臣星軟件技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110001436.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計(jì)算機(jī)能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機(jī)傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶(hù)和計(jì)算機(jī)之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時(shí)間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來(lái)自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機(jī)上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 光源裝置、照明裝置、液晶裝置和電子裝置
- 預(yù)測(cè)裝置、編輯裝置、逆預(yù)測(cè)裝置、解碼裝置及運(yùn)算裝置
- 圖像形成裝置、定影裝置、遮光裝置以及保持裝置
- 打印裝置、讀取裝置、復(fù)合裝置以及打印裝置、讀取裝置、復(fù)合裝置的控制方法
- 電子裝置、光盤(pán)裝置、顯示裝置和攝像裝置
- 光源裝置、照明裝置、曝光裝置和裝置制造方法
- 用戶(hù)裝置、裝置對(duì)裝置用戶(hù)裝置、后端裝置及其定位方法
- 遙控裝置、通信裝置、可變裝置及照明裝置
- 透鏡裝置、攝像裝置、處理裝置和相機(jī)裝置
- 抖動(dòng)校正裝置、驅(qū)動(dòng)裝置、成像裝置、和電子裝置





