[發明專利]一種在網絡用車系統中使用TF-IDF評估承運車輛與地域相關性的方法在審
| 申請號: | 201510245529.4 | 申請日: | 2015-05-14 |
| 公開(公告)號: | CN104866959A | 公開(公告)日: | 2015-08-26 |
| 發明(設計)人: | 湯鵬;王柏 | 申請(專利權)人: | 北京東方車云信息技術有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q50/30 |
| 代理公司: | 北京萬慧達知識產權代理有限公司 11111 | 代理人: | 敖列偉;李春晅 |
| 地址: | 100080 北京市海淀區北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡 系統 使用 tf idf 評估 承運 車輛 地域 相關性 方法 | ||
技術領域
本發明涉及到網絡用車領域中的評估承運車輛與地域相關性的方法,更具體地涉及到以TF-IDF評估承運車輛與地域相關性的方法。
背景技術
在網絡用車領域中,承運車輛通常與地域有較強的關聯性。例如,由于承運司機對不同地域的熟悉程度和對不同類型地域的偏好,造成承運車輛接單時對其運營的地域有較強的選擇性。為了將用車的訂單更準確和高效地發送給適合于承運的司機,需要對承運車輛與地域相關性進行評估。
TF-IDF(term?frequency–inverse?document?frequency)是一種統計方法,用以評估一個字詞對于一個文件集或一個語料庫中的其中一份文件的重要程度。字詞的重要性隨著它在文件中出現的次數成正比增加,但同時會隨著它在語料庫中出現的頻率成反比下降。如果某個詞或短語在一篇文章中出現的頻率TF高,并且在其他文章中很少出現,則認為此詞或者短語具有很好的代表能力。TF-IDF實際上是:TF詞頻(Term?Frequency)與IDF逆向文件頻率(Inverse?Document?Frequency)的乘積。詞頻TF表示詞條在文檔d中出現的頻率。實際上,如果一個詞條在一個文檔中頻繁出現,則說明該詞條能夠更好代表這個文本的特征。IDF的主要思想是:如果包含某個詞條t的文檔越少,那么IDF越大,則說明詞條t具有很好代表能力。
TF-IDF在信息檢索技術中已經有成功的應用,例如在搜索引擎中有廣泛應用。但是,如何將其應用到網絡用車系統中,尤其是應用到承運車輛與地域相關性的評估中,仍然是現有技術中待解決的問題。
發明內容
針對上述問題,本發明將TF-IDF統計方法創造性地應用到了網絡用車系統中的承運車輛與地域相關性的評估中,提出了一種在網絡用車系統中使?用TF-IDF評估承運車輛與地域相關性的方法,所述方法包括如下步驟:
將承運車輛的運營區域劃分為多個區塊Bi;
在給定的一個時間段內,
統計出參與運營的承運車輛總數S,
對任一區塊Bi,統計出曾經以其作為運營起點或終點的承運車輛數目Ni,
計算出區塊Bi的IDFi=log(S/Ni);
對每個承運車輛j,統計出其總的運營次數nj和區塊Bi作為其運營起點或終點的次數ni,j,
計算出區塊Bi在承運車輛j中的TFi,j=ni,j/nj;
那么,承運車輛j與區塊Bi的相關度Ri,j=TFi,j*IDFi。
優選地,在所述的評估承運車輛和地域相關性的方法中,所述區塊Bi是將城市按經緯度劃分成的矩形塊。
優選地,在所述的評估承運車輛和地域相關性的方法中,所述矩形塊的大小不相同,并且用車密度較大的區域所述矩形塊較小。
優選地,在所述的評估承運車輛和地域相關性的方法中,所述區塊Bi是形狀不規則的區域。
優選地,在所述的評估承運車輛和地域相關性的方法中,所給定的時間段為最近一周或一個月或更長的時間段。
本發明另外一方面提出了一種在網絡用車系統中使用TF-IDF評估承運車輛與地域相關性的方法,所述方法包括如下步驟:
將承運車輛的運營區域劃分為多個區塊Bi,并為每個區塊定義一種或多種地域標簽Ci1,Ci2,…Cin;
在給定的一個時間段內,
統計出參與運營的承運車輛總數S,
對任一地域標簽Ci,統計出曾經以其作為運營起點或終點的承運車輛數目Ni,
計算出地域標簽Ci的IDFi=log(S/Ni);
對每個承運車輛j,統計出其總的運營次數nj和有標簽Ci的地域作為其運營起點或終點的次數ni,j,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京東方車云信息技術有限公司,未經北京東方車云信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510245529.4/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





