[發明專利]基于人工智能分類語音輸入文本的方法和裝置在審
| 申請號: | 201710728382.3 | 申請日: | 2017-08-23 |
| 公開(公告)號: | CN107506434A | 公開(公告)日: | 2017-12-22 |
| 發明(設計)人: | 梁一川;凌光;林英展;王文敏;謝澤穎;張寅;徐威;周超 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27;G10L15/26 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司11204 | 代理人: | 王達佐,馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 分類 語音 輸入 文本 方法 裝置 | ||
技術領域
本申請涉及計算機技術領域,具體涉及計算機網絡技術領域,尤其涉及基于人工智能分類語音輸入文本的方法和裝置。
背景技術
人工智能(Artificial Intelligence,簡稱AI)技術的快速發展為人們的日常工作和生活提供了便利。人工智能是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。人工智能越來越多地融入到應用中,結合人工智能的應用可以準確地確定出信息的種類,并按照不同用戶的需求將不同種類的信息推送給相應的用戶。
隨著人工智能的飛速發展,如何讓機器能擁有和人類一樣的智能,成了無數企業希望做到的事情。在這個背景下,我們希望機器能夠與用戶進行語音智能交互。在語音智能交互服務的初期,收集的用戶文本語料通常不完善,如何對這些文本語料進行分類的冷啟動,是語音智能交互服務需要面對的問題。目前的語音智能交互服務,在面對文本分類冷啟動這一類問題時,都需要收集大量的文本語料,完成對文本語料的人工標注后,才能進行分類訓練。
然而,目前的語音智能交互服務,無法在服務初期通過有效方式較快進行文本分類。此外,進行人工標注需要投入大量的標注人力,標注效率較低。
發明內容
本申請的目的在于提出一種改進的基于人工智能分類語音輸入文本的方法和裝置,來解決以上背景技術部分提到的技術問題。
第一方面,本申請實施例提供了一種基于人工智能分類語音輸入文本的方法,方法包括:獲取用戶語音查詢的當前交互文本;采用詞法分析器,分析當前交互文本,得到當前詞法結構;判斷當前詞法結構是否命中分類器中各類別的模板;若當前詞法結構命中分類器中各類別的模板,將當前詞法結構對應的當前交互文本分類至所命中的模板所屬的類別。
在一些實施例中,各類別的模板經由以下步驟確定:對于預定交互場景,獲取預設的類別;獲取各類別中出現頻率高于預定頻率的待泛化交互文本;接收人工對各類別的待泛化交互文本的泛化,得到各類別的模板。
在一些實施例中,方法還包括:若當前詞法結構未命中分類器中各類別的模板,則將當前詞法結構對應的當前交互文本分類至待分類類別。
在一些實施例中,方法還包括:獲取待分類類別中出現頻率高于預設頻率的待處理交互文本;接收人工對待處理交互文本的分類操作;將待處理交互文本分類至分類器中對應分類操作的類別中。
在一些實施例中,將待處理交互文本分類至分類器中對應分類操作的類別中包括:若分類器中存在對應分類操作的類別,則直接將待處理交互文本分類至分類器中對應分類操作的類別中。
在一些實施例中,將待處理交互文本分類至分類器中對應分類操作的類別中包括:若分類器中不存在對應分類操作的類別,則在分類器中構建對應分類操作的類別;將待處理交互文本分類至分類器中對應分類操作的類別中。
在一些實施例中,方法還包括:接收人工對分類至分類器中各類別的待處理交互文本的泛化;根據泛化結果,更新分類器中各類別的模板。
第二方面,本申請實施例還提供了一種基于人工智能分類語音輸入文本的裝置,裝置包括:當前文本獲取單元,用于獲取用戶語音查詢的當前交互文本;當前文本分析單元,用于采用詞法分析器,分析當前交互文本,得到當前詞法結構;命中模板判斷單元,用于判斷當前詞法結構是否命中分類器中各類別的模板;當前文本分類單元,用于若當前詞法結構命中分類器中各類別的模板,將當前詞法結構對應的當前交互文本分類至所命中的模板所屬的類別。
在一些實施例中,命中模板判斷單元中各類別的模板經由以下單元確定:預設類別獲取單元,用于對于預定交互場景,獲取預設的類別;預定文本獲取單元,用于獲取各類別中出現頻率高于預定頻率的待泛化交互文本;預定文本泛化單元,用于接收人工對各類別的待泛化交互文本的泛化,得到各類別的模板。
在一些實施例中,裝置還包括:當前文本待分類單元,用于若當前詞法結構未命中分類器中各類別的模板,則將當前詞法結構對應的當前交互文本分類至待分類類別。
在一些實施例中,裝置還包括:待處理文本獲取單元,用于獲取待分類類別中出現頻率高于預設頻率的待處理交互文本;分類操作接收單元,用于接收人工對待處理交互文本的分類操作;待處理文本分類單元,用于將待處理交互文本分類至分類器中對應分類操作的類別中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710728382.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:城市發展空間格局情景模擬系統
- 下一篇:一種基于價格預測的特價機票查詢方法





