[發明專利]檢測欺詐電話的方法有效
| 申請號: | 201310368700.1 | 申請日: | 2013-08-22 |
| 公開(公告)號: | CN103412940A | 公開(公告)日: | 2013-11-27 |
| 發明(設計)人: | 李昕;劉奕群;張敏;馬少平;張闊 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04W12/12 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張大威 |
| 地址: | 100084 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢測 欺詐 電話 方法 | ||
技術領域
本發明涉及網絡信息智能處理技術領域,特別涉及一種檢測欺詐電話的方法。
背景技術
隨著固定電話和手機的普及,利用電話進行的詐騙活動層出不窮。傳統的電信詐騙包括犯罪分子通過電話和短信的方式,以受害人涉嫌犯罪、信用卡盜用、電話欠費、退稅等借口設置騙局,誘使受害人給犯罪分子打款或轉賬,以達到牟取暴利的目的。新型的電信詐騙指不法分子冒充廠家的官方電話,通過對用戶的產品進行非官方的維修來獲得利益,對用戶和廠家同時造成損失。據統計,2008年,僅北京、上海、廣東、福建這四個省市群眾因電信詐騙犯罪被騙走的錢就有6億多元。
對于傳統的電信詐騙,由于電視、網絡等媒體的曝光以及民眾自身防范意識的提高,近年來已有了很大的改觀。但是對于新型的電信欺詐,尤其是在搜索引擎結果頁面中出現的電話,用戶往往降低了警惕。圖1中顯示了從同一域名(www.yumao.com)下抽取的三個網頁截圖。從圖中可以看出,該網站對于不同產品(科寶、億田、清華陽光)給出了相同的廠家維修電話400-888-0356,屬于典型的欺詐電話。但是搜索引擎往往更加注重網頁的內容信息,而無法檢測出網頁中的電話是否為欺詐電話,因此在搜索結果中,以上頁面都會被展現出來,這不僅會對搜索引擎用戶和廠家造成很大損失,也會對搜索引擎的質量造成影響,因此對于欺詐電話的檢測具有很重要的意義。
對于電話號碼:電話號碼分為固定電話號碼、移動電話號碼和其他電話號碼。固定電話號碼由區號和電話號構成,其中區號以“0”開頭,例如“010”(北京)、“0431”(長春)等,電話號由7至8位數字組成。移動電話號碼由以“1”開頭的11位數字組成,其中1至3位為網絡識別號,例如“151”(中國移動)、“131”(中國聯通)、“153”(中國電信)等,4至7位為地區編碼,8至11位為用戶號碼。其他電話號碼包括:電信服務號碼,以“10”開頭,例如“10010”(中國聯通服務中心)、“10086”(中國移動服務中心)等;金融及民用服務號碼,以“95”開頭,例如“95566”(中國銀行),“95519”(中國人壽保險)等;企業電話號碼,由以“400”或“800”開頭的10位數字組成。了解電話號碼的構成對于在搜索引擎結果頁面中抽取電話號碼具有十分重要的意義。
目前主流的搜索引擎都是通過關鍵詞查詢來提供服務的,即用戶向搜索引擎提交反映自己查詢需求的關鍵詞(通常為幾個字、詞),搜索引擎在互聯網上搜尋與用戶查詢相關的結果列表,將搜索結果按相關性進行排序,并返回給用戶。一般來說,搜索引擎在結果頁面的第一頁中會展示按相關性排名的前10條結果,這也是用戶查看最多的結果。
為了對用戶行為進行分析,主流搜索引擎都會記錄用戶與搜索引擎進行交互的行為日志,這種日志一般被稱為搜索引擎查詢日志。查詢日志通常記錄的內容包括:用戶的IP地址、用戶使用搜索引擎的時間、用戶提交的查詢、用戶點擊的結果等。由于查詢日志客觀、真實地保存了用戶與搜索引擎的交互情況,因此在搜索引擎算法改進、社會輿論熱點分析等領域,查詢日志都發揮了很重要的作用。
向搜索引擎提交某電話的查詢,在返回的前10條結果中,如果多個不同的電話號碼出現在同一個結果網頁上,則稱這些電話具有共現關系。
發明內容
本發明旨在至少解決上述技術問題之一。
為此,本發明的目的在于提出一種檢測欺詐電話的方法,該方法能夠及時、高效地檢測欺詐電話,提升搜索引擎的服務性能,減少用戶的損失,另外,該方法涉及的算法復雜度低,易于實現,具有較好的推廣性和適應性,且檢測效果客觀、全面、可靠。
為了實現上述目的,本發明的實施例提出了一種檢測欺詐電話的方法,包括以下步驟:獲取搜索引擎查詢日志;定期處理所述搜索引擎查詢日志以提取預設時間段內的包含預設關鍵字段的查詢集合,并對所述查詢集合進行篩選,并將篩選的查詢集合按照查詢次數進行排序;將排序的查詢集合提交至搜索引擎進行搜索,并對搜索結果進行分析,以獲取種子官方電話集合及種子欺詐電話集合;根據所述搜索結果建立電話共現關系圖;根據所述種子官方電話集合、所述種子欺詐電話集合及所述電話共現關系圖檢測所述搜索結果中是否存在欺詐電話。
根據本發明實施例的檢測欺詐電話的方法,基于搜索引擎查詢日志和對查詢搜索結果分析實現自動檢測網頁中的欺詐電話,該方法能夠及時高效地檢測欺詐電話,提升搜索引擎的服務性能,減少用戶損失,另外,該方法實現需要的數據模型結構和參數簡單,算法復雜度低,易于實現,具有較好的推廣性和適應性,且檢測效果客觀、全面、可靠。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310368700.1/2.html,轉載請聲明來源鉆瓜專利網。





