[發(fā)明專利]一種從眾多網(wǎng)絡(luò)標(biāo)簽里生成折射詞的方法無效
| 申請(qǐng)?zhí)枺?/td> | 201010244308.2 | 申請(qǐng)日: | 2010-08-04 |
| 公開(公告)號(hào): | CN102346742A | 公開(公告)日: | 2012-02-08 |
| 發(fā)明(設(shè)計(jì))人: | 張占平 | 申請(qǐng)(專利權(quán))人: | 張占平 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100039 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 眾多 網(wǎng)絡(luò) 標(biāo)簽 生成 折射 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明要求保護(hù)的技術(shù)方案所屬的技術(shù)領(lǐng)域是互聯(lián)網(wǎng)的數(shù)據(jù)挖掘、數(shù)據(jù)檢索和數(shù)據(jù)顯示。
背景技術(shù)
目前,許多網(wǎng)絡(luò)文章,如博客和新聞,往往被作者或者編輯者附加一些標(biāo)簽。網(wǎng)友通過一個(gè)標(biāo)簽找到許多包含該標(biāo)簽的標(biāo)簽串,但是,這些標(biāo)簽串呈現(xiàn)為散亂的分布形式,網(wǎng)友需要對(duì)這些散亂的眾多標(biāo)簽進(jìn)行人工識(shí)別,這耗費(fèi)了網(wǎng)友的精力;并且,在標(biāo)簽串非常多的情況下,網(wǎng)友很難從這些散亂的標(biāo)簽里總結(jié)出關(guān)聯(lián)性最強(qiáng)的標(biāo)簽。本發(fā)明可以從這些散亂的標(biāo)簽里生成有用的折射詞。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種從眾多網(wǎng)絡(luò)標(biāo)簽里生成折射詞的方法。
本發(fā)明解決該技術(shù)問題所采用的技術(shù)方案是:由計(jì)算機(jī)處理,把一篇網(wǎng)絡(luò)文章里附加的2-N個(gè)標(biāo)簽作為一個(gè)標(biāo)簽串,標(biāo)簽串里有多少個(gè)標(biāo)簽就生成多少個(gè)衍生串,每個(gè)標(biāo)簽均有一次機(jī)會(huì)成為對(duì)應(yīng)衍生串的領(lǐng)頭詞;把大量衍生串以相同的領(lǐng)頭詞為前提,添加到一個(gè)或者多個(gè)總串里,相同的跟隨詞累計(jì)頻度,并且,同一個(gè)總串里的各個(gè)跟隨詞依據(jù)頻度排序,從而得到一個(gè)或者多個(gè)總串。
由計(jì)算機(jī)處理,當(dāng)用戶使用搜索引擎時(shí),每輸入一個(gè)字符,則使用當(dāng)前已經(jīng)輸入的全部字符或者部分字符在各個(gè)總串的領(lǐng)頭詞里檢索,檢索到相同的領(lǐng)頭詞時(shí),返回一次檢索結(jié)果,為用戶顯示一個(gè)對(duì)應(yīng)總串里的N個(gè)跟隨詞。
由計(jì)算機(jī)處理,當(dāng)執(zhí)行網(wǎng)頁(yè)的搜索時(shí),同時(shí),使用標(biāo)簽的全部字符或者部分字符在各個(gè)總串的領(lǐng)頭詞里檢索,檢索到相同的領(lǐng)頭詞時(shí),返回一次檢索結(jié)果,為用戶顯示一個(gè)對(duì)應(yīng)總串里的N個(gè)跟隨詞。
由計(jì)算機(jī)處理,把不同的總串分別生成動(dòng)態(tài)網(wǎng)頁(yè)或者靜態(tài)網(wǎng)頁(yè),在網(wǎng)頁(yè)里包含總串的領(lǐng)頭詞和N個(gè)跟隨詞。
在本申請(qǐng)的描述里,多處使用N這個(gè)英文字母。N代表大于2的一個(gè)具體數(shù)字。不同地方使用的N,不一定是相同的數(shù)字。
大多網(wǎng)友都有體會(huì),搜索資料時(shí),往往耗費(fèi)大量的時(shí)間和精力,也不一定能夠找到有用的資料。本發(fā)明讓網(wǎng)友更加方便地找到所需的資料,減輕勞動(dòng)強(qiáng)度,爭(zhēng)取更多的休閑時(shí)間,并且有利于身心健康。
“折射詞”的含義:在同一個(gè)“總串”里,各個(gè)“跟隨詞”相對(duì)“領(lǐng)頭詞”來說,也叫做折射詞;頻度越高的“跟隨詞”與“領(lǐng)頭詞”之間的折射關(guān)系越大。
另外,在文章里標(biāo)出的鏈接詞,也是一種標(biāo)簽形式。使用這種鏈接詞生成“標(biāo)簽串”,進(jìn)而生成“衍生串”和“總串”也在本申請(qǐng)的保護(hù)范圍之內(nèi)。
“標(biāo)簽串”體現(xiàn)的是同一個(gè)網(wǎng)友的行為。“總串”創(chuàng)造性地綜合了多個(gè)網(wǎng)友的行為。
附圖說明
圖1是本發(fā)明的流程圖。
具體實(shí)施方式
下面對(duì)照附圖舉例說明本發(fā)明的優(yōu)選方案。
網(wǎng)友的標(biāo)簽可以是一個(gè)字、一個(gè)詞、幾個(gè)用空格間隔的詞語(yǔ)或者任意字符串。
下面對(duì)“標(biāo)簽串”進(jìn)行詳細(xì)的介紹。
計(jì)算機(jī)從眾多網(wǎng)絡(luò)文章里采集標(biāo)簽,把同一篇文章里的2-N個(gè)不同的“標(biāo)簽”,作為一個(gè)“標(biāo)簽串”對(duì)待。
下面介紹把“標(biāo)簽串”加工成為“衍生串”的方案。
一個(gè)“標(biāo)簽串”包含2-N個(gè)“標(biāo)簽”,其中的任何兩個(gè)“標(biāo)簽”一般均不相同(相同也可以,但是,從科學(xué)的角度來說,不嚴(yán)謹(jǐn))。一個(gè)“標(biāo)簽串”包含多少個(gè)“標(biāo)簽”,就需要拆分為多少個(gè)“衍生串”。比如包含6個(gè)標(biāo)簽,就需要拆分為6個(gè)“衍生串”。
比如使用“|”作為各個(gè)標(biāo)簽之間的分割標(biāo)識(shí)。
從第一篇文章里提取出來的標(biāo)簽串如下:
Microsoft?SQL?Server|微軟|C#|關(guān)系數(shù)據(jù)庫(kù)|SQL注入攻擊
從第二篇文章里提取出來的標(biāo)簽串如下:
C#|.NET?Framework|安德斯·海爾斯伯格(Anders?Hejlsberg)|Visual?Studio.NET|Microsoft?SQL?Server|面向?qū)ο笳Z(yǔ)言
從第三篇文章里提取出來的標(biāo)簽串如下:
微軟|比爾·蓋茨|家用電腦|全球富豪排名
按照上方第一個(gè)“標(biāo)簽串”為例,介紹把“標(biāo)簽串”進(jìn)化成為“衍生串”的方案。我們知道:該標(biāo)簽串里的這5個(gè)標(biāo)簽,僅僅是作者或者編輯者逐個(gè)書寫的,這5個(gè)標(biāo)簽之間沒有其它實(shí)際意義上的排序。這5個(gè)標(biāo)簽在標(biāo)簽串里的地位是相同的。所以,需要“衍生”出5個(gè)“衍生串”。每個(gè)標(biāo)簽均有機(jī)會(huì)成為其中一個(gè)“衍生串”的“領(lǐng)頭詞”。所以說,在衍生串里,“領(lǐng)頭詞”與“跟隨詞”之間的地位是不同的。正因?yàn)椤皹?biāo)簽串”里的5個(gè)標(biāo)簽的地位相同,所以,需要“衍生”出5個(gè)“衍生串”,讓每一個(gè)“標(biāo)簽”都擔(dān)當(dāng)一次“衍生串”的“領(lǐng)頭詞”。如下:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于張占平,未經(jīng)張占平許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010244308.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種mp3播放器
- 下一篇:一種燈箱面框的開啟結(jié)構(gòu)
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 瀏覽器中關(guān)閉標(biāo)簽的裝置和方法
- 標(biāo)簽生成方法及標(biāo)簽生成裝置
- 一種帶有標(biāo)簽的電氣插座
- 標(biāo)簽檢測(cè)定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 基于樹形結(jié)構(gòu)的標(biāo)簽存儲(chǔ)方法及裝置
- 一種標(biāo)簽分離機(jī)構(gòu)
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 標(biāo)簽檢測(cè)定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽轉(zhuǎn)換處理方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)





