[發明專利]一種語用關鍵詞通用模板的生成、應用方法與裝置有效
| 申請號: | 201210281413.2 | 申請日: | 2012-08-09 |
| 公開(公告)號: | CN102902711A | 公開(公告)日: | 2013-01-30 |
| 發明(設計)人: | 劉莎 | 申請(專利權)人: | 劉莎 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 400041 重慶市九*** | 國省代碼: | 重慶;85 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 關鍵詞 通用 模板 生成 應用 方法 裝置 | ||
技術領域
本發明涉及計算機及通信領域,特別是涉及生成、應用語用關鍵詞模版的方法及裝置。?
背景技術
目前,全文關鍵詞搜索是互聯網信息搜索的基本方法,但是,全文關鍵詞實際上有兩種完全不同的應用功能。例如,當用戶在全文關鍵詞檢索輸入欄中輸入“NBA籃球比賽直播時間”時,一種需求是想檢索到與“NBA籃球比賽直播時間”相關的所有信息,這時,“時間”一詞是揭示目標信息主題的語義關鍵詞之一。另一種需求則是只想檢索到NBA籃球比賽直播的具體時間,如“NBA籃球比賽直播:9-30-20:30”,這時,“時間”一詞則是指示“9-30-20:30”功能與效用的語用關鍵詞。顯然,用戶輸入同一檢索關鍵詞的這兩種不同應用功能需求,所指向的目標信息有巨大差別。因此,在關鍵詞搜索中區別語義關鍵詞和語用關鍵詞,對提高關鍵詞檢索的精準度具有重要價值。?
問題在于,雖然語用關鍵詞和語義關鍵詞同是組織信息的基本要素,但如果沒有語用關鍵字標簽導航模版,信息發布方往往會忽略提供語用關鍵詞,或者不知道應該提供什么語用關鍵詞,或者發布方和檢索方提供的語用關鍵詞不一致。其結果是,關鍵詞檢索的非目標信息很可能在檢索結果中排序在前,而目標信息排序在后。例如,按照關鍵字命中率排序,“NBA籃球比賽直播時間太晚”、“沒時間看NBA比賽直播了”等信息會排序在前,而檢索用戶真正需要的目標信息“NBA籃球比賽直播:9-30-20:30”則由于發布信息中沒有“時間”?一詞,只能排序在后。?
更為關鍵的問題是,即使發布用戶提供了語用關鍵字,目前的全文關鍵字搜索服務實際上也無法判別,當搜索用戶輸入同一關鍵字時到底是要的其語義功能,還是語用功能?因此,目前的全文關鍵字檢索實際上是一種不區分關鍵字語義功能和語用功能的模糊檢索。也因此,無論加上多少輔助性技術手段,也無法根本改善全文關鍵字檢索的效率。?
與此同時,為了提高信息搜索的效率,互聯網上提供了上萬種不同的結構化信息發布、檢索模版(如:購物、訂票等結構化信息發布、檢索模版),以引導用戶在結構化標簽下發布、檢索信息。但是,各類結構化模版均不具有通用性,因此,在提高信息檢索效率的同時,也大大增加了用戶的使用難度。?
簡言之,目前的關鍵詞信息搜索方法仍然處在查精則不能查全,查全則不能查精的困境中。?
但是,經過我們的統計和研究,互聯網信息中的語用關鍵詞具有以下雙十定律:輸入任意關鍵字,其相關信息的高頻應用語用關鍵詞在10X10范圍以內。?
例如,輸入任意搜索關鍵字(如:NBA、國家發改委、智能手機、云計算、韓寒、歐美大片......),其相關信息的通用且常用分類包括新聞、告示、知識、論壇、產品、服務、人際交往、點播/下載、博客/微博、大黃頁。而各類新聞的通用語用關鍵詞包括:標題、行為主體、行為、時間、地點、背景、綜述......;各類人際交往(無論是征婚、交友、招聘、應聘......)的語用關鍵詞均包括:標題、交往目的、性別、年齡、職業......。?
依據上述雙十定律,本發明提供一種語用關鍵詞通用模版的生成、應用方法與裝置,用于實現語義關鍵詞和語用關鍵詞的區別檢索,以根本改善互聯網信息發布、檢索效率。?
發明內容
一種語用關鍵詞通用模版的生成、應用方法與裝置,用于實現語義關鍵詞和語用關鍵詞的區別檢索,以根本改善互聯網信息發布、檢索效率。?
一種語用關鍵詞通用模版的生成方法,其主要流程步驟如下:?
采用隨機抽樣的方法獲得任意關鍵詞的檢索結果;?
統計檢索結果中的各類語用關鍵詞的應用頻率;?
調用高頻語用關鍵詞生成語用關鍵詞通用模版;?
一種統計檢索結果中的各類語用關鍵詞的應用頻率的方法,其特征在于,包括以下步驟:?
統計結構化數據、半結構數據中的結構標簽的應用頻率;?
統計無結構信息中標點符號冒號與關鍵詞形成的固定搭配的應用頻率;?
統計語用關鍵詞的嵌套關系及應用頻率;?
統計不同發布主體分類下的語用關鍵詞應用頻率;?
統計不同語義關鍵詞與語用關鍵詞的關聯應用頻率;?
統計在語用關鍵詞模版中由用戶自由擴展的語用關鍵詞使用頻率。?
一種調用高頻語用關鍵詞生成語用關鍵詞通用模版的方法,其步驟包括:?
當沒有獲得用戶選擇的主體分類時,生成或調用不區分發布信息主體的、包括嵌套語用關鍵詞的語用關鍵詞通用模版;?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于劉莎,未經劉莎許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210281413.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:船用水冷空調衡風系統
- 下一篇:一種頂置空調器的進出風通道組件





