[發明專利]一種優化政務服務網事項搜索效果的方法在審
| 申請號: | 202111175762.1 | 申請日: | 2021-10-09 |
| 公開(公告)號: | CN113987323A | 公開(公告)日: | 2022-01-28 |
| 發明(設計)人: | 張奇欣 | 申請(專利權)人: | 浪潮軟件股份有限公司 |
| 主分類號: | G06F16/9532 | 分類號: | G06F16/9532;G06F16/9538;G06F16/332;G06F40/216;G06F40/289;G06Q50/26 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 闞恭勇 |
| 地址: | 271000 山東省*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 優化 政務 服務網 事項 搜索 效果 方法 | ||
1.一種優化政務服務網事項搜索效果的方法,其特征在于,
將問答與回復數據作為平行語料庫,分析挖掘生活化詞匯和專業領域詞匯,并與提問的事項相關聯,訓練模型后,用于優化口語化搜索關鍵詞。
2.根據權利要求1所述的方法,其特征在于,
包括數據初始化流程和搜索流程,
其中,數據初始化流程包括:
1)數據初始化開始
2)獲取數據
3)對數據進行分詞
4)寫入搜索引擎
5)結束;
搜索流程包括:
1)搜索開始
2)對搜索關鍵詞進行分詞
3)使用搜索引擎進行匹配
4)返回排名最高的事項名稱
5)結束。
3.根據權利要求2所述的方法,其特征在于,
將咨詢標題、內容、答復分別進行分詞,這里的分詞器使用n-gram分詞。
4.根據權利要求3所述的方法,其特征在于,
將分詞后的標題、內容劃為一個字段;將分詞后的回復內容單獨劃為一個字段,然后將這兩者按照相同的事項進行合并。
5.根據權利要求3所述的方法,其特征在于,
將改數據結構寫入搜索引擎,計算這些詞匯的TF-IDF值,以此衡量詞匯的重要性,用于搜索引擎關鍵詞搜索。
6.根據權利要求5所述的方法,其特征在于,
對輸入的關鍵詞進行同樣的n-gram分詞,使用搜索引擎搜索口語詞匯集合和書面語詞匯集合,依據TF-IDF值計算得分排名,取得分最高的一條或數條記錄。
7.根據權利要求6所述的方法,其特征在于,
獲取記錄中的事項名稱,再將此事項名稱作為關鍵詞,輸入到搜索引擎。
8.根據權利要求7所述的方法,其特征在于,
可將此事項名稱,作為選項輸出到搜索前端,提供主動選擇。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮軟件股份有限公司,未經浪潮軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111175762.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:原子自組裝多元涂層的設計制備方法
- 下一篇:一種環保型復合驅油體系及制備方法





