[發明專利]一種自動播放推送消息的方法及系統有效
| 申請號: | 201910337143.4 | 申請日: | 2019-04-25 |
| 公開(公告)號: | CN110113635B | 公開(公告)日: | 2021-05-25 |
| 發明(設計)人: | 王健;劉衛平;蘇戰;鄭巖 | 申請(專利權)人: | 廣州智伴人工智能科技有限公司 |
| 主分類號: | H04N21/25 | 分類號: | H04N21/25;H04N21/258;H04N21/45;H04N21/466 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 朱健;張國香 |
| 地址: | 510000 廣東省廣州市海珠區廣州大道南1*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自動 播放 推送 消息 方法 系統 | ||
1.一種自動播放推送消息的方法,其特征在于,
S1、根據預設的敏感詞匯數據庫,對消息進行過濾處理;
S2、根據過濾后的消息,獲取所述消息對應的標簽類型;
S3、根據用戶需求確定與用戶所對應的預設標簽類型優先級數據庫;
S4、根據所述預設標簽類型優先級數據庫和所述消息對應的標簽類型,對所述消息進行優先級從高到低依次排序;
S5、將排序后的所述消息轉換為語音數據進行依次定時播放;
所述步驟S1根據預設的敏感詞匯數據庫,對消息進行過濾處理,包括如下步驟:
首先構建一個學習數據庫D,所述學習數據庫D中有總共S條消息,且被定義為不需被過濾的消息p條,需過濾的消息n條,則不需要被過濾的概率需要被過濾的概率利用公式(1)計算期望信息:
其中I(p,n)為所計算得到的期望信息;
根據敏感詞匯數據庫中包含的敏感詞匯及每個敏感詞匯對應的詞匯屬性,確定學習數據庫D中的每一條消息中出現的敏感詞匯;根據學習數據庫D中的每一條消息中出現的敏感詞匯,確定每一條消息在每一種敏感詞匯屬性下所對應的可能值,所述可能值為敏感詞匯的具體內容;假設敏感詞匯數據庫中包含的詞匯屬性有T種,其中任一種詞匯屬性A包含m種可能值分別為{C1,C2,…,Cm},其中,Ci為所述學習數據庫D中詞匯屬性A的第i種可能值,i=1,2,3……m;
在所述S條消息中,包含Ci的所有消息中,有pi條消息不需被過濾,有ni條消息需要被過濾,則詞匯屬性A的增益信息如公式(2)所示:
其中,I(pi,ni)為將pi和ni帶入公式(1)計算得出的期望信息,S為學習數據庫D中的消息總條數,E(A)為中間值;
利用下列步驟(A)-(C)進行分類操作:
(A)用公式(2)計算出所述學習數據庫D中每種詞匯屬性的增益信息,選擇增益信息最大的詞匯屬性作為該次分類標準,該增益信息最大的詞匯屬性中有多少種可能值則分為多少類,假設有Yi種可能值,將每一個可能值看成一類,則可分為Yi類,每一類對應一個葉子節點,每個葉子節點中都包含有對應的消息,該對應的消息是指學習數據庫D中包含有該葉子節點對應的那一類所對應的可能值的消息,然后將每個葉子節點中包含的對應的消息作為一個新的學習數據庫;
(B)統計所述新的學習數據庫中的葉子節點中包含的對應的消息是否需要過濾的結論,判斷所述結論是否是該葉子節點中包含的對應的消息都需要過濾、或者該葉子節點中包含的對應的消息都不需要過濾;如果是,則將該葉子節點作為末端葉子節點進行標注,標注的內容為所述結論,分類結束;如果否,則對所述新的學習數據庫重復執行步驟(A)-(B);
(C)按照前述操作最終形成一棵分類樹,該分類樹的每個末端葉子節點都對應有所述標注;
判斷需要過濾處理的消息在所述分類樹中所屬的末端葉子節點;獲取該所屬的末端葉子節點的標注,按照標注中所顯示的是否需要過濾來對所述需要過濾處理的消息進行過濾處理。
2.如權利要求1所述的方法,其特征在于,
所述步驟S1、根據預設的敏感詞匯數據庫,對所述消息進行過濾處理之前的步驟,還包括:
對所獲取的消息進行預處理;具體包括:
根據預設的繁簡對照文字庫,將所述消息中的繁體字轉換為簡體字;并將所述消息中的標點符號去除。
3.如權利要求2所述的方法,其特征在于,
所述對所獲取的消息進行預處理之前的步驟,還包括:
設置網絡爬蟲對網絡上的消息進行實時獲取;
所述消息,包括消息內容和消息鏈接地址。
4.如權利要求1所述的方法,其特征在于,
所述步驟S2、根據過濾后的消息,獲取所述消息對應的標簽類型;包括如下步驟:
S21、獲取所述消息的標題數據和名詞數據;
S22、獲取所述名詞數據中的地名名詞,生成消息對應的相關地名標簽;
S23、獲取所述名詞數據中的關鍵詞,基于消息類型數據庫進行判斷識別,獲取所述消息所對應的類型,生成消息對應的內容標簽;
S24、獲取所述標題數據中的名詞,生成消息對應的標題標簽;
S25、根據所述相關地名標簽、內容標簽和標題標簽,形成所述消息對應的標簽類型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州智伴人工智能科技有限公司,未經廣州智伴人工智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910337143.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:信息處理方法和裝置
- 下一篇:一種預測方法、裝置及電子設備





