[發明專利]實體簡稱轉化方法、可讀存儲介質和電子設備在審
| 申請號: | 201910656568.1 | 申請日: | 2019-07-19 |
| 公開(公告)號: | CN110377887A | 公開(公告)日: | 2019-10-25 |
| 發明(設計)人: | 陳曉宇 | 申請(專利權)人: | 出門問問(蘇州)信息科技有限公司 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22 |
| 代理公司: | 北京睿派知識產權代理事務所(普通合伙) 11597 | 代理人: | 劉鋒 |
| 地址: | 215000 江蘇省蘇州市蘇州工*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 可讀存儲介質 電子設備 工作效率 人工標注 輸入編碼 自動計算 準確率 轉化 網絡 | ||
1.一種實體簡稱轉化方法,其特征在于,所述方法包括:
根據實體全稱確定第一詞向量序列;
將所述第一詞向量序列中的第一詞向量依次輸入編碼網絡以確定編碼向量;
將所述編碼向量輸入解碼網絡以確定第二詞向量序列;
根據所述第二詞向量序列確定實體簡稱。
2.根據權利要求1所述的方法,其特征在于,所述根據實體全稱確定第一詞向量序列包括:
對所述實體全稱進行分詞處理以確定詞序列;
將所述詞序列中的各元素轉換為對應的詞向量以確定第一詞向量序列。
3.根據權利要求1所述的方法,其特征在于,所述將所述編碼向量輸入解碼網絡以確定第二詞向量序列包括:
將所述編碼向量輸入所述解碼網絡確定并記錄一個解碼向量,每個所述解碼向量用于表征一個字符;
以迭代的方式將所述解碼向量輸入所述解碼網絡以確定并記錄一個解碼向量,直到滿足預設條件時結束所述迭代過程;
根據每一次輸出記錄的解碼向量確定第二詞向量序列。
4.根據權利要求3所述的方法,其特征在于,所述迭代過程包括:
將上一次迭代后確定的解碼向量輸入所述解碼網絡以確定解碼向量集合,所述解碼向量集合中包括解碼向量和與所述解碼向量對應的概率值;
確定所述解碼向量集合中對應概率值最大的解碼向量為本次迭代過程的輸出。
5.根據權利要求3所述的方法,其特征在于,所述預設條件包括:
所述記錄的解碼向量數量達到預設值;或者
一次迭代過程中確定的解碼向量用于表征結束符。
6.根據權利要求1所述的方法,其特征在于,所述將所述編碼向量輸入解碼網絡以確定第二詞向量序列還包括:
將所述編碼向量輸入所述解碼網絡確定N個解碼向量,并將所述N個解碼向量分別記錄在N個序列內,其中每個解碼向量用于表征一個字符,對應一個概率值;
以迭代方式分別將各序列中最后一個解碼向量輸入所述解碼網絡以確定N個解碼向量,并根據所述輸入的解碼向量和確定的解碼向量對應的概率值更新所述N個序列,直到滿足預設條件時結束所述迭代過程;
確定所述N個序列中概率值最高的序列為第二詞向量序列。
7.根據權利要求6所述的方法,其特征在于,所述迭代過程包括:
將各序列中最后一個解碼向量輸入所述解碼網絡以確定N個解碼向量集合,每個所述解碼向量集合中包含至少一個解碼向量;
根據各輸入解碼向量所在序列中各元素對應的概率值以及輸出的解碼向量集合中各元素對應的概率值確定解碼概率值;
確定N個最大的解碼概率值,并將其中各解碼概率值對應的解碼向量所在序列中各元素和輸出的解碼向量更新至一個序列中。
8.根據權利要求6所述的方法,其特征在于,所述預設條件具體為:
所述各序列中記錄的解碼向量數量達到預設值。
9.一種計算機可讀存儲介質,用于存儲計算機程序指令,其特征在于,所述計算機程序指令在被處理器執行時實現如權利要求1-8中任一項所述的方法。
10.一種電子設備,包括存儲器和處理器,其特征在于,所述存儲器用于存儲一條或多條計算機程序指令,其中,所述一條或多條計算機程序指令被所述處理器執行以實現如權利要求1-8中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于出門問問(蘇州)信息科技有限公司,未經出門問問(蘇州)信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910656568.1/1.html,轉載請聲明來源鉆瓜專利網。





