[發(fā)明專利]基于上下文語(yǔ)義精準(zhǔn)地域識(shí)別方法、系統(tǒng)及電子設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202110364502.2 | 申請(qǐng)日: | 2021-04-05 |
| 公開(kāi)(公告)號(hào): | CN114282535A | 公開(kāi)(公告)日: | 2022-04-05 |
| 發(fā)明(設(shè)計(jì))人: | 韓勇;趙沖;李青龍;駱飛 | 申請(qǐng)(專利權(quán))人: | 北京智慧星光信息技術(shù)有限公司 |
| 主分類號(hào): | G06F40/284 | 分類號(hào): | G06F40/284;G06F40/30;G06K9/62 |
| 代理公司: | 北京智宇正信知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11876 | 代理人: | 李明卓 |
| 地址: | 100080 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 上下文 語(yǔ)義 精準(zhǔn) 地域 識(shí)別 方法 系統(tǒng) 電子設(shè)備 | ||
1.一種基于上下文語(yǔ)義精準(zhǔn)地域識(shí)別方法,其特征在于,包括:
獲取訓(xùn)練集;
通過(guò)預(yù)先訓(xùn)練好的詞向量對(duì)訓(xùn)練集進(jìn)行詞嵌入表示,并通過(guò)多層全連接神經(jīng)網(wǎng)絡(luò)進(jìn)行上下文語(yǔ)義學(xué)習(xí)訓(xùn)練,得到地域意圖識(shí)別模型,所述地域意圖識(shí)別模型用于對(duì)文章中的地域意圖進(jìn)行識(shí)別,地域意圖識(shí)別模型的識(shí)別結(jié)果包括無(wú)地域意圖的概率值、離開(kāi)地域意圖的概率值和前往地域意圖的概率值;
獲取待識(shí)別文章和待識(shí)別文章中的地域詞;
將待識(shí)別文章按照文章結(jié)構(gòu)進(jìn)行模塊劃分,得到多個(gè)文章模塊;
根據(jù)待識(shí)別文章的地域詞確定待識(shí)別文章中的地域詞句子,所述地域詞句子為包含待識(shí)別文章的地域詞的句子;
根據(jù)地域詞句子確定地域詞句子所對(duì)應(yīng)的文章模塊;
將待識(shí)別文章中的地域詞句子輸入地域意圖識(shí)別模型,得到待識(shí)別文章中每一個(gè)地域詞的地域意圖識(shí)別結(jié)果;
對(duì)地域意圖識(shí)別結(jié)果進(jìn)行意圖方向判定,得到每一個(gè)地域詞在文章模塊中的地域意圖方向判定值;
根據(jù)多個(gè)文章模塊確定待識(shí)別文章中每一個(gè)地域詞在文章模塊中的權(quán)值;
根據(jù)每一個(gè)地域詞在文章模塊中的地域意圖方向判定值和所對(duì)應(yīng)的權(quán)值確定待識(shí)別文章的精準(zhǔn)地域信息。
2.根據(jù)權(quán)利要求1所述的基于上下文語(yǔ)義精準(zhǔn)地域識(shí)別方法,其特征在于,根據(jù)每一個(gè)地域詞在文章模塊中的地域意圖方向判定值和所對(duì)應(yīng)的權(quán)值確定待識(shí)別文章的精準(zhǔn)地域信息的步驟中,包括:
根據(jù)每一個(gè)地域詞在文章模塊中的權(quán)值得到每一個(gè)地域詞在待識(shí)別文章中的權(quán)值;
對(duì)每一個(gè)地域詞在待識(shí)別文章中的權(quán)值和在文章模塊中的地域意圖方向判定值進(jìn)行地域權(quán)值融合計(jì)算,得到每一個(gè)地域詞在待識(shí)別文章中的地域最終權(quán)重;
將待識(shí)別文章中所有地域詞的地域最終權(quán)重進(jìn)行權(quán)重值排序,將權(quán)重值最高的地域詞作為待識(shí)別文章的精準(zhǔn)地域信息。
3.根據(jù)權(quán)利要求2所述的基于上下文語(yǔ)義精準(zhǔn)地域識(shí)別方法,其特征在于,每一個(gè)地域詞在待識(shí)別文章中的權(quán)值的計(jì)算公式如下:
其中,twl為地域詞wl在待識(shí)別文章中的權(quán)值;λ1為第一文章模塊的權(quán)值參數(shù);m1為地域詞wl在第一文章模塊中出現(xiàn)的次數(shù);λ2為第二文章模塊的權(quán)值參數(shù);m2為地域詞wl在第二文章模塊中出現(xiàn)的次數(shù);λn為第n文章模塊的權(quán)值參數(shù);mn為地域詞wl在第n文章模塊中出現(xiàn)的次數(shù)。
4.根據(jù)權(quán)利要求3所述的基于上下文語(yǔ)義精準(zhǔn)地域識(shí)別方法,其特征在于,每一個(gè)地域詞在待識(shí)別文章中的地域最終權(quán)重的計(jì)算公式如下:
其中,scorewl為地域詞wl在待識(shí)別文章中的地域最終權(quán)重;d1為地域詞wl在第一文章模塊中的地域意圖方向判定值;d2為地域詞wl在第二文章模塊中的地域意圖方向判定值;dn為地域詞wl在第n文章模塊中的地域意圖方向判定值。
5.根據(jù)權(quán)利要求4所述的基于上下文語(yǔ)義精準(zhǔn)地域識(shí)別方法,其特征在于,多個(gè)文章模塊包括4個(gè)模塊,分別為文章標(biāo)題模塊、第一文章正文模塊、第二文章正文模塊和第三文章正文模塊;第一文章正文模塊包括從文章正文起始位置至文章正文中第一預(yù)設(shè)字?jǐn)?shù)的位置,第一預(yù)設(shè)字?jǐn)?shù)小于0.5倍的文章正文總字?jǐn)?shù);第二文章正文模塊包括從文章正文第一預(yù)設(shè)字?jǐn)?shù)的位置開(kāi)始至文章正文中間位置;第三文章正文模塊包括從文章正文中間位置開(kāi)始至文章正文結(jié)尾位置。
6.根據(jù)權(quán)利要求5所述的基于上下文語(yǔ)義精準(zhǔn)地域識(shí)別方法,其特征在于,文章標(biāo)題模塊的權(quán)重大于第二文章正文模塊的權(quán)重,并且大于第三文章正文模塊的權(quán)重;
第一文章正文模塊的權(quán)重大于第二文章正文模塊的權(quán)重,并且大于第三文章正文模塊的權(quán)重。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京智慧星光信息技術(shù)有限公司,未經(jīng)北京智慧星光信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110364502.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 自動(dòng)創(chuàng)建上下文信息提供配置的系統(tǒng)
- 用于管理上下文的方法、系統(tǒng)和裝置
- 一種基于本體的上下文感知應(yīng)用平臺(tái)框架模型
- 一種基于上下文感知的智能家居系統(tǒng)
- 實(shí)現(xiàn)上下文感知業(yè)務(wù)應(yīng)用的方法和相關(guān)裝置
- 一種多推理引擎融合上下文感知系統(tǒng)及其工作方法
- 多個(gè)并發(fā)上下文虛擬演進(jìn)型會(huì)話管理(虛擬ESM)
- 一種基于異質(zhì)上下文感知的推薦方法
- 一種可提高上下文質(zhì)量的本體建模方法及裝置
- 微服務(wù)全局上下文控制方法及系統(tǒng)
- 面向語(yǔ)義Web服務(wù)程序設(shè)計(jì)的語(yǔ)義數(shù)據(jù)表示和處理方法
- 一種基于語(yǔ)義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語(yǔ)義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語(yǔ)義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語(yǔ)義匹配方法和系統(tǒng)
- 遠(yuǎn)程語(yǔ)義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語(yǔ)義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語(yǔ)義表征和語(yǔ)義計(jì)算的信號(hào)語(yǔ)義識(shí)別方法
- 語(yǔ)義分類方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備





