[發明專利]基于聯合相似度的民航旅客不文明等級預測方法及系統有效
| 申請號: | 201910404740.4 | 申請日: | 2019-05-15 |
| 公開(公告)號: | CN110084440B | 公開(公告)日: | 2022-12-23 |
| 發明(設計)人: | 丁建立;李洋;王懷超 | 申請(專利權)人: | 中國民航大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/30;G06F16/33;G06F40/211;G06F40/289 |
| 代理公司: | 天津市鼎和專利商標代理有限公司 12101 | 代理人: | 蒙建軍 |
| 地址: | 300300 天*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 聯合 相似 民航 旅客 不文明 等級 預測 方法 系統 | ||
本發明涉及一種基于聯合相似度的民航旅客不文明等級預測方法及系統,包括:一:數據預處理;二:文本信息的特征提取;三:民航不文明旅客與社會不文明人員的不文明行為通過IPS算法進行句子向量表示;四:不文明旅客的懲處特征的度量,五:基于聯合相似度匹配的旅客不文明等級預測,六:通過對來自民航和社會兩部分不文明旅客和不文明人員行為數據進行整理,并帶入聯合相似度匹配模型進行計算,同時分別在平均詞向量算法、Doc2vec模型、IPS算法、以及IPBS?IPS算法中進行實驗對比與分析,依據各模型的相似度值來預測在從事民航活動的人員發生不文明行為的潛在程度,通過查準率、召回率、F1值和準確率來對實驗結果進行評估。
技術領域
本發明屬于民航安全技術領域,具體涉及一種基于聯合相似度的民航旅客不文明等級預測方法及系統。
背景技術
隨著民航領域的快速發展,民航客流量的不斷攀升,不文明旅客的數量也不斷增加,不文明旅客數據庫逐漸形成規模。在登機和乘機的過程中不文明旅客因為自己的個人因素對工作人員進行毆打或對航空器進行破壞,極大影響了公共安全秩序,危害航空安全。因此如何對民航不文明旅客行為進行有效的監控與分析,如何建立一套可量化、可測量的指標體系,通過不文明行為記錄,形成對不文明旅客服務和交互的全流程量化管理,輔助航空公司對不文明旅客的管理決策和服務政策制定已經成為民航業亟待解決的問題。
目前國內外使用文本挖掘技術對于民航不文明旅客的研究較少,但在犯罪偵查項目中有所應用。亞利桑那州大學和警察機構建立的犯罪偵查項目Coplink和Recap,通過命名實體抽取對犯罪敘述報告的實體進行識別。此外運用文本工程GATE結合犯罪規范詞匯,從犯罪記錄和目擊者的敘述中提取相關實體。通過聚類方法和短文本相似性分析來匹配犯罪過程。因此本文在文本相似性分析的基礎上,加入了不文明旅客的懲處規則特征,實現不文明旅客的多粒度聯合相似度分析。給旅客是否是不文明旅客身份的潛在程度做出合理的度量和預測。實現航空公司對旅客行為的有效監控,對維護民航安全和航空安全具有重大意義。
目前國內外對文本相似度的研究主要集中在對文本特征題提取和對比分析方面,通過統計文本中的詞頻TF和逆文檔頻率指數IDF來計算詞語的權重TF-IDF值構成文本特征向量,并運用卷積神經網絡(CNN),和深度學習(Deep Learning)等方法對文本進行訓練,計算出文本的相似度值。
具有多種文本特征的句子對匹模型是一種多特征文本相似度計算方法,該方法考慮了兩個句子間同詞的共現,使用對齊特征(Alignment Feature)計算句子的語義相似性,可提高文本語義相似度計算性能。
文本關鍵詞尋優算法,考慮了關鍵詞比例增加的臨界點問題,該算法通過更新類別關鍵詞和控制相似度閾值降低了噪聲文本加入的概率,提高了效率,通過關鍵詞提取去除非關鍵詞語料,降低了計算的復雜度從而提高了文本相似度計算效率。
同義詞林的多粒度計算模型是在原始語料庫的基礎上將同義詞林加入文本共同經過神經網絡訓練,提升了具有相同意思但不同文字間的計算精度,從而提高性能,同義詞林的加入可提高模型對詞匯的語義理解,進而提升文本相似性計算精度。
目前國內外研究學者借助于文本詞向量表示方法word2vec的成功,對于句子和段落的向量表示工作正嘗試展開,從單詞向量的簡單附加組成到復雜的加權結構。通過聯合詞語的詞向量來獲得句子向量對整個句子的語義表達。
發明內容
本發明為解決公知技術中存在的技術問題而提供一種基于聯合相似度的民航旅客不文明等級預測方法及系統,該基于聯合相似度的民航旅客不文明等級預測方法及系統依據其不文明記錄的組成機構,將旅客的行為記錄通過詞向量的特征提取,懲處特征進行標準化度量,通過行為特征與懲處特征的多粒度融合計算和聯合相似性匹配,實現對民航旅客潛在不文明等級的預測,提高了預測準確率。
本發明的第一發明目的是提供一種基于聯合相似度的民航旅客不文明等級預測方法,至少包括如下步驟:
步驟一:數據預處理;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國民航大學,未經中國民航大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910404740.4/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





