[發(fā)明專利]字符序列處理方法及設(shè)備在審
| 申請?zhí)枺?/td> | 201810257040.2 | 申請日: | 2018-03-27 |
| 公開(公告)號: | CN108595416A | 公開(公告)日: | 2018-09-28 |
| 發(fā)明(設(shè)計)人: | 陸晨昱;武擁珍;何永;李傳豐;劉杰漢 | 申請(專利權(quán))人: | 義語智能科技(上海)有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/22 |
| 代理公司: | 上海百一領(lǐng)御專利代理事務(wù)所(普通合伙) 31243 | 代理人: | 王奎宇;甘章乖 |
| 地址: | 201203 上海市浦東新*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 詞向量 向量 向量序列 連續(xù)字 連續(xù)向量 字詞混合 字符序列 語義信息 拼接 | ||
1.一種字符序列處理方法,其中,該方法包括:
獲取字向量矩陣和詞向量矩陣;
根據(jù)所述字向量矩陣,將待轉(zhuǎn)換字符序列中的每個字依序轉(zhuǎn)換為對應(yīng)的字向量,根據(jù)依次轉(zhuǎn)換得到的各字向量得到連續(xù)字向量序列;
將所述待轉(zhuǎn)換字符序列依序進(jìn)行分詞,以得到對應(yīng)的詞語序列;
根據(jù)所述詞向量矩陣,依序?qū)⑺鲈~語序列中的每個詞,轉(zhuǎn)換為對應(yīng)的詞向量,根據(jù)轉(zhuǎn)換得到的各詞向量得到連續(xù)詞向量序列,其中,所述連續(xù)詞向量序列中的詞向量個數(shù)與所述連續(xù)字向量序列中的字向量個數(shù)一致,所述連續(xù)字向量序列中的每一個字向量與所述連續(xù)詞向量序列中的一個詞向量對應(yīng);
依序?qū)⑺鲞B續(xù)字向量序列中的每一個字向量與所述連續(xù)詞向量序列中對應(yīng)的一個詞向量拼接,得到字詞混合的連續(xù)向量序列。
2.根據(jù)權(quán)利要求1所述的方法,其中,根據(jù)所述詞向量矩陣,依序?qū)⑺鲈~語序列中的每個詞,轉(zhuǎn)換為對應(yīng)的詞向量,根據(jù)轉(zhuǎn)換得到的各詞向量得到連續(xù)詞向量序列,包括:
根據(jù)所述詞向量矩陣,依序?qū)⑺鲈~語序列中的每個詞中的每個字映射到該字所屬的詞的詞向量。
3.根據(jù)權(quán)利要求2所述的方法,其中,根據(jù)所述詞向量矩陣,依序?qū)⑺鲈~語序列中的每個詞中的每個字映射到該字所屬的詞的詞向量中,
若某個詞的字無法根據(jù)所述詞向量矩陣映射得到該字所屬的詞對應(yīng)的詞向量,則將該字轉(zhuǎn)換為預(yù)設(shè)的詞向量。
4.根據(jù)權(quán)利要求1所述的方法,其中,根據(jù)所述字向量矩陣,將待轉(zhuǎn)換字符序列中的每個字依序轉(zhuǎn)換為對應(yīng)的字向量中,
若某個字在所述字向量矩陣中未找到對應(yīng)的字向量,則將該字轉(zhuǎn)換為預(yù)設(shè)的字向量。
5.根據(jù)權(quán)利要求1至4任一項(xiàng)所述的方法,其中,所述字向量矩陣和詞向量矩陣的訓(xùn)練方法包括CBOW,skip-gram和glove等中的一種或任意組合。
6.一種字符序列處理設(shè)備,其中,該設(shè)備包括:
獲取裝置,用于獲取字向量矩陣和詞向量矩陣;
字向量轉(zhuǎn)換裝置,用于根據(jù)所述字向量矩陣,將待轉(zhuǎn)換字符序列中的每個字依序轉(zhuǎn)換為對應(yīng)的字向量,根據(jù)依次轉(zhuǎn)換得到的各字向量得到連續(xù)字向量序列;
詞向量轉(zhuǎn)換裝置,用于將所述待轉(zhuǎn)換字符序列依序進(jìn)行分詞,以得到對應(yīng)的詞語序列,根據(jù)所述詞向量矩陣,依序?qū)⑺鲈~語序列中的每個詞,轉(zhuǎn)換為對應(yīng)的詞向量,根據(jù)轉(zhuǎn)換得到的各詞向量得到連續(xù)詞向量序列,其中,所述連續(xù)詞向量序列中的詞向量個數(shù)與所述連續(xù)字向量序列中的字向量個數(shù)一致,所述連續(xù)字向量序列中的每一個字向量與所述連續(xù)詞向量序列中的一個詞向量對應(yīng);
拼接裝置,用于依序?qū)⑺鲞B續(xù)字向量序列中的每一個字向量與所述連續(xù)詞向量序列中對應(yīng)的一個詞向量拼接,得到字詞混合的連續(xù)向量序列。
7.根據(jù)權(quán)利要求1所述的設(shè)備,其中,所述詞向量轉(zhuǎn)換裝置,用于根據(jù)所述詞向量矩陣,依序?qū)⑺鲈~語序列中的每個詞中的每個字映射到該字所屬的詞的詞向量。
8.根據(jù)權(quán)利要求7所述的設(shè)備,其中,所述詞向量轉(zhuǎn)換裝置,用于若某個詞的字無法根據(jù)所述詞向量矩陣映射得到該字所屬的詞對應(yīng)的詞向量,則將該字轉(zhuǎn)換為預(yù)設(shè)的詞向量。
9.根據(jù)權(quán)利要求1所述的設(shè)備,其中,所述字向量轉(zhuǎn)換裝置,用于若某個字在所述字向量矩陣中未找到對應(yīng)的字向量,則將該字轉(zhuǎn)換為預(yù)設(shè)的字向量。
10.根據(jù)權(quán)利要求6至9任一項(xiàng)所述的設(shè)備,其中,所述字向量矩陣和詞向量矩陣的訓(xùn)練方法包括CBOW,skip-gram和glove等中的一種或任意組合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于義語智能科技(上海)有限公司,未經(jīng)義語智能科技(上海)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810257040.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 移動向量解碼方法和移動向量解碼裝置
- 一種用于支持向量機(jī)的在線向量選取方法
- 用于在幀序列中執(zhí)行運(yùn)動估計的數(shù)據(jù)處理系統(tǒng)和方法
- 神經(jīng)網(wǎng)絡(luò)的處理方法及裝置、存儲介質(zhì)、電子設(shè)備
- 字符序列處理方法及設(shè)備
- 向量獲取方法、裝置、電子設(shè)備以及計算機(jī)可讀存儲介質(zhì)
- 向量獲取方法、裝置、電子設(shè)備以及計算機(jī)可讀存儲介質(zhì)
- 近鄰向量的召回方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)
- 一種向量運(yùn)算裝置及運(yùn)算方法
- 生成類別向量的方法和裝置
- 電力信號的諧波相位測量方法和系統(tǒng)
- 電力信號的基波幅值測量方法和系統(tǒng)
- 電力信號的正弦參數(shù)測量方法和系統(tǒng)
- 電力信號的基波相位測量方法和系統(tǒng)
- 電力信號的諧波幅值測量方法和系統(tǒng)
- 字符序列處理方法及設(shè)備
- 目標(biāo)匹配方法及裝置、電子設(shè)備和存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)表示生成方法、裝置、存儲介質(zhì)和設(shè)備
- 神經(jīng)網(wǎng)絡(luò)中網(wǎng)絡(luò)表示生成、編碼方法和裝置
- 文本翻譯方法、裝置、存儲介質(zhì)和計算機(jī)設(shè)備





