[發明專利]一種跨語言分析報告的生成方法在審
| 申請號: | 201711458010.X | 申請日: | 2017-12-28 |
| 公開(公告)號: | CN108132933A | 公開(公告)日: | 2018-06-08 |
| 發明(設計)人: | 王曉東 | 申請(專利權)人: | 中譯語通科技(青島)有限公司 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 266000 山東省青島市高新區*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 結果數據 語言分析 自然語言 機器翻譯引擎 關鍵詞翻譯 關鍵詞檢索 檢索結果 檢索數據 輸入系統 母語 語言 檢索 分析 翻譯 | ||
本發明提供一種跨語言分析報告的生成方法,包括:獲取關鍵詞并判斷所屬語言;通過接口將關鍵詞發送給機器翻譯引擎;將關鍵詞翻譯成多種語言;通過接口輸入系統進行檢索;將檢索結果通過模型得到結果數據;將結果數據插入到模板中,生成分析報告。本發明不需要用戶提前翻譯,直接使用母語關鍵詞檢索,同時可以檢索數據集中所有自然語言的數據,生成的分析報告更加全面。
技術領域
本發明涉及報告的自動生成方法。
背景技術
隨著大數據的發展,科技大數據平臺積攢了許多科技類的社媒文獻數據,可以根據用戶輸入的關鍵詞進行查詢匯總相關的數據,但平臺采集的數據包括多種自然語言,使用關鍵詞查詢只能查詢到該語言相關數據,生成的分析報告結果會不全面準確。
發明內容
本發明所要解決的技術問題是提供一種跨語言分析報告的生成方法,能夠將多種關鍵詞檢索到的所有相關數據匯總整合在一起生成分析報告。
本發明解決技術問題所采用的技術方案是:一種跨語言分析報告的生成方法,包括以下步驟:
(1)獲取關鍵詞并判斷所屬語言;
(2)通過接口將關鍵詞發送給機器翻譯引擎;
(3)機器翻譯引擎根據需求將關鍵詞翻譯成多種語言;
(4)將多種語言的關鍵詞通過接口輸入系統進行檢索;
(5)將檢索結果通過模型得到結果數據;
(6)將結果數據插入到模板中,生成分析報告。
進一步地,分析報告的模板包括:1)按照社媒文獻數據類型分類統計數量;2)社媒文獻數據按照學科分類統計數量;3)社媒文獻數據按照年份分類統計數量;4)相關數據發文機構、作者TOP10;5)相關文獻專利。
本發明的有益效果是:1、自動化,不需要用戶提前翻譯,直接使用母語關鍵詞檢索。2、全面性,可以檢索數據集中所有自然語言的數據,生成的分析報告更加全面。
附圖說明
圖1是本發明的整體流程圖。
具體實施方式
以下結合附圖對本發明的技術方案做進一步詳細說明,應當指出的是,具體實施方式只是對本發明的具體闡述,并不是對本發明的限定。
如圖1所示,本發明的實現方法包括:
(1)獲取關鍵詞并判斷所屬語言;
(2)通過接口將關鍵詞發送給機器翻譯引擎;
(3)機器翻譯引擎根據需求將關鍵詞翻譯成多種語言;
(4)將多種語言的關鍵詞通過接口輸入系統進行檢索;
(5)將檢索結果通過模型得到結果數據;
(6)將結果數據插入到模板中,生成分析報告。
從用戶的角度來說,首先用戶輸入關鍵詞進行檢索,關鍵詞會通過接口發送給機器翻譯引擎,翻譯成多種自然語言相對應的詞匯,并將這些詞匯以“或”的組合形式發送到跨語言分析報告生成系統接口。跨語言分析報告生成系統建立了相應的分析模型,根據關鍵詞檢索出的數據為基礎數據,通過跑分析模型生成相關的結果數據,分析報告有一個固定的模板,定義了報告的文本格式,根據模型生成的結果數據會填入模板相應的區域,最終生成完整的分析報告。
該報告分析模型可以包括:
1)按照社媒數據文獻類型分類統計數量。
2)社媒文獻數據按照學科分類統計數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中譯語通科技(青島)有限公司,未經中譯語通科技(青島)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711458010.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:帶有復制機制的神經機器翻譯方法
- 下一篇:信息輸出方法和裝置





