[發明專利]語音智能播報方法、裝置、計算機設備及存儲介質有效
| 申請號: | 201910372969.4 | 申請日: | 2019-05-06 |
| 公開(公告)號: | CN110198464B | 公開(公告)日: | 2023-03-28 |
| 發明(設計)人: | 陳小翔 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | H04N21/41 | 分類號: | H04N21/41;H04N21/439;H04N21/4415;H04N21/4782;G10L17/22 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 黃章輝 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 智能 播報 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種語音智能播報方法,其特征在于,包括:
檢測客戶端當前頁面的頁面內容,生成頁面檢測數據;所述頁面檢測數據包含文字數量、文字大小和顏色對比度;
將所述頁面檢測數據中所包含的子檢測信息與預設檢測數據中所包含的子預設信息進行一一比較,以判斷所述頁面檢測數據是否滿足預設檢測數據;所述預設檢測數據包括文字數量區間值、文字大小區間值和顏色對比區間值;所述子檢測信息是指頁面檢測數據中所包含的所述文字數量、所述文字大小和所述顏色對比度;所述子預設信息指預先設定的用來評估所述子檢測信息是否滿足條件的信息;
若任意一所述子檢測信息不滿足所述預設檢測數據中對應的所述子預設信息,則進入人臉采集模式以獲取目標人臉圖像;所述目標人臉圖像為正面朝向的圖像;
判斷所述目標人臉圖像是否與預設的樣本人臉圖像相匹配,若所述目標人臉圖像與所述樣本人臉圖像相匹配,則獲取所述當前頁面的待播報信息;
將所述待播報信息轉換成設定的語言播報方式的待播報語音數據,并通過所述客戶端播報所述待播報語音數據;
所述檢測當前頁面的頁面內容,生成頁面檢測數據,包括:
當所述當前頁面包含圖像部分時,對所述圖像部分進行文字識別,得到所述圖像部分的文字信息;
對所述文字信息進行檢測,生成所述頁面檢測數據。
2.如權利要求1所述的語音智能播報方法,其特征在于,所述在通過所述客戶端播報所述待播報語音數據之后,所述語音智能播報方法,還包括:
實時采集所述客戶端根據所述待播報語音數據返回的語音交互數據;
對所述語音交互數據進行語音識別,得到語音識別結果;
根據所述語音識別結果,加載所述語音識別結果對應的功能。
3.如權利要求2所述的語音智能播報方法,其特征在于,所述根據所述語音識別結果,加載所述語音識別結果對應的功能,包括:
采用關鍵詞提取算法,提取所述語音識別結果中的目標關鍵詞;
將所述目標關鍵詞與關鍵詞庫中的每一預設關鍵詞進行一一匹配,得到匹配結果,所述匹配結果包括匹配成功和匹配失敗;
若所述匹配結果為匹配成功,則加載所述語音識別結果對應的功能。
4.如權利要求1所述的語音智能播報方法,其特征在于,所述獲取所述當前頁面的待播報信息,包括:
實時監控客戶端在所述當前頁面的操作指令;
若所述操作指令為有效操作指令,則獲取所述有效操作指令對應的觸發位置;
根據所述觸發位置獲取待播報信息。
5.如權利要求3所述的語音智能播報方法,其特征在于,所述采用關鍵詞提取算法,提取語音識別結果中的目標關鍵詞,包括:
對所述語音識別結果進行分詞、詞性標注處理和詞性過濾,獲取指定詞性的候選關鍵詞;
基于所述候選關鍵詞,設置滑動窗口為K,若兩節點對應的詞匯在長度為K的窗口中共現,則所述兩節點之間存在邊,基于所述邊構建候選關鍵詞有向圖G=(V,E),其中,V為有向圖的節點集合,E為有向圖的邊集合,E是V×V的子集;所述節點為所述候選關鍵詞有向圖中的候選關鍵詞;
采用TextRank算法對每一所述節點的權重進行迭代,直至收斂,獲取每一所述節點對應的權重;
根據每一所述節點對應的權重對所述節點進行排序,獲取預設數量所述節點對應的候選關鍵詞作為目標關鍵詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910372969.4/1.html,轉載請聲明來源鉆瓜專利網。





