[發(fā)明專利]一種基于Transformer的語義相似度計算模型DSSM技術有效
| 申請?zhí)枺?/td> | 201910788264.0 | 申請日: | 2019-08-28 |
| 公開(公告)號: | CN110516240B | 公開(公告)日: | 2021-04-06 |
| 發(fā)明(設計)人: | 劉軼 | 申請(專利權)人: | 南京璇璣信息技術有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京衛(wèi)智暢科專利代理事務所(普通合伙) 11557 | 代理人: | 陳佳 |
| 地址: | 211100 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 transformer 語義 相似 計算 模型 dssm 技術 | ||
1.一種基于Transformer的語義相似度計算模型DSSM系統(tǒng),其特征在于:包括輸入層、表示層和匹配層,所述輸入層用于將圖譜節(jié)點名稱和APP頁面文字分別轉為由字向量表示的二維數(shù)組,并將其作為表示層的輸入;
所述表示層是采用Transformer的編碼器部分,首先,分別對由輸入層輸出的節(jié)點名稱特征向量和APP頁面文字特征向量進行編碼,從而提取出句子中每個單詞的抽象特征,然后,通過global-attention將原本由每個字向量組成的句子特征表示轉換為由一個512維向量表示的新的句子特征;
所述匹配層在由表示層分別得到了圖譜節(jié)點名稱和APP頁面文字的句子特征向量后,圖譜節(jié)點名稱和APP頁面文字的句子特征向量之間的語義相似性用這兩個語義向量的cosine距離來表示。
2.根據權利要求1所述的一種基于Transformer的語義相似度計算模型DSSM系統(tǒng),其特征在于:所述字向量由網上公開文本數(shù)據訓練得到,且向量空間為300維。
3.根據權利要求1所述的一種基于Transformer的語義相似度計算模型DSSM系統(tǒng),其特征在于:所述Transformer編碼器部分的整體結構一共分為6個小Encoder,其中每個Encoder又包含了self-attention和full-connect兩個模塊。
4.根據權利要求1所述的一種基于Transformer的語義相似度計算模型DSSM系統(tǒng),其特征在于:所述匹配層中cosine距離表示公式為:其中,yN代表節(jié)點,yW代表頁面文字。
5.一種基于Transformer的語義相似度計算模型DSSM技術的測試圖譜修改匹配處理流程,其特征在于:具體包括以下步驟:
S1、從圖數(shù)據庫中提取出待匹配測試圖譜數(shù)據,以及啟動相應APP,打開APP頁面提取接口;
S2、從測試圖譜中進行圖譜路徑的提取并依次提取出當前路徑中的每一個操作節(jié)點名稱,從新APP主頁開始,提取當前頁面圖片,并通過使用OCR接口將頁面內容轉化成文字信息,得到頁面文字;
S3、進行預先訓練的中文詞向量及語義相似度模型的加載,用于后續(xù)相似度計算;
S4、通過將輸入的操作節(jié)點名稱和頁面APP文字進行詞向量表示操作后,將進行詞向量表示后的操作節(jié)點名稱和頁面APP文字帶入到語義相似度計算模型DSSM中,分別得到操作節(jié)點名稱與每一個文字的相似度計算得分,從中選取中相似度評分最高的進行匹配;
S5、如果匹配成功,則將操作節(jié)點名稱修改為APP頁面相應文字名稱,并修改對應腳本內容,根據所得到得腳本描述內容,調用相應腳本執(zhí)行接口,執(zhí)行腳本,當獲取到執(zhí)行反饋信息后,根據反饋結果,跳轉到下一頁面及下一操作節(jié)點;
S6、如果匹配失敗,刪除當前操作節(jié)點及相應腳本,跳轉到下一操作節(jié)點,并保持當前頁面內容不變;
S7、重復上述步驟S1至S6,直至整個測試圖譜的路徑都執(zhí)行完成。
6.根據權利要求5所述的一種基于Transformer的語義相似度計算模型DSSM技術的測試圖譜修改匹配處理流程,其特征在于:所述步驟S2路徑中的第一個節(jié)點為對主頁進行操作的節(jié)點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京璇璣信息技術有限公司,未經南京璇璣信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910788264.0/1.html,轉載請聲明來源鉆瓜專利網。
- 基于Transformer+LSTM神經網絡模型的商品銷量預測方法及裝置
- 一種基于Transformer模型自然場景文字識別方法
- 一種深度Transformer級聯(lián)神經網絡模型壓縮算法
- 點云分割方法、系統(tǒng)、介質、計算機設備、終端及應用
- 基于Transformer的中文智能對話方法
- 一種基于改進Transformer模型的飛行器故障診斷方法和系統(tǒng)
- 一種基于Transformer模型的機器翻譯模型優(yōu)化方法
- 基于Transformer和增強交互型MPNN神經網絡的小分子表示學習方法
- 基于U-Transformer多層次特征重構的異常檢測方法及系統(tǒng)
- 基于EfficientDet和Transformer的航空圖像中的飛機檢測方法





