日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種用于輔助調查訪談的語料庫積累方法有效

專利信息
申請號: 202011089200.0 申請日: 2020-10-13
公開(公告)號: CN112214586B 公開(公告)日: 2022-06-28
發明(設計)人: 姚占雷;周謙豪;許鑫 申請(專利權)人: 華東師范大學
主分類號: G06F16/332 分類號: G06F16/332;G10L15/26;G06N20/00;G06F40/194;G06F16/31
代理公司: 上海藍迪專利商標事務所(普通合伙) 31215 代理人: 徐筱梅;張翔
地址: 200241 *** 國省代碼: 上海;31
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 用于 輔助 調查 訪談 語料庫 積累 方法
【說明書】:

發明公開了一種用于輔助調查訪談的語料庫積累方法,其特點是采用領域語料向通用語料有條件轉化的積累機制的方法,將頻繁出現新的相似語料的領域語料轉化為通用語料,其情景化的語料庫積累具體包括:接收用戶輸入、通用語料的追加積累、領域情景語料的追加積累和領域語料向通用語料有條件轉化的積累等步驟。本發明與現有技術相比具領域語料庫和通用語料庫分離并存,進一步明確領域專有語料的邊界,降低建立基于專家知識的規則的信息抽取系統的成本,有助于提供包含領域針對性的訓練數據,提高基于機器學習的信息抽取系統的準確率,為實現情景化的調查訪談輔助系統提供數據基礎。

技術領域

本發明涉及自然語言處理技術領域,尤其是一種基于領域情景訪談語料的用于輔助調查訪談的語料庫積累方法。

背景技術

調查訪談資料的后續處理一般依賴于調查人員手工完成。隨著科技發展,訪談資料的記錄和初步整理工作可以交由具備音頻錄制功能的軟硬件和語音識別轉寫程序完成。

目前,相關的調查訪談輔助系統大多采用通用語料庫,基于常見通用語料進行規則定義或機器學習實現,通用語料庫為用于存儲適用于大多數訪談場景的不同問句和對應的答句列表的數據庫或數據表,該訪談輔助技術對一般通用場景下的訪談語音轉換、處理和分析效果較佳。但對特定專有領域的訪談語音處理,由于領域情景語料的匱乏,情景化的訪談資料的轉寫處理難以實現,訪談語音轉換、處理及分析效果一般。領域情景語料庫為用于存儲適用于特定類型的訪談場景的不同問句、其相似次數和對應的答句列表的數據庫或數據表。由于領域情景語料的匱乏,尤其專門的領域訪談語料庫更為匱乏。

現有技術的自然語言處理缺少可以針對性地采集處理領域情景訪談語料,專門的領域訪談語料庫目前較為匱乏。因此,現有的訪談輔助技術對一般通用場景下的訪談語音轉換、處理和分析效果較佳,但對特定專有領域的訪談語音處理效果很差。

發明內容

發明的目的是針對現有技術的不足而設計的一種用于輔助調查訪談的語料庫積累方法,采用領域語料向通用語料有條件轉化的積累機制的方法,實現針對特定訪談場景的領域情景語料的積累,以及結合相似語料的出現頻率和用戶設定閾值將頻繁出現新的相似語料的領域語料轉化為通用語料,使得領域語料庫和通用語料庫分離并存,進一步明確領域專有語料的邊界,降低建立基于專家知識的規則的信息抽取系統的成本,也有助于提供包含領域針對性的訓練數據,提高基于機器學習的信息抽取系統的準確率,為實現情景化的調查訪談輔助系統提供數據基礎。

本發明的目的是這樣實現的:一種用于輔助調查訪談的語料庫積累方法,其特點是采用領域語料向通用語料有條件轉化的積累機制的方法,將頻繁出現新的相似語料的領域語料轉化為通用語料,其情景化的語料庫積累具體包括以下步驟:

步驟1:初始化通用語料庫、領域語料庫。

步驟2:接收用戶輸入的文本相似度閾值和語料庫更新觸發閾值,如果用戶為訪談預先設計了問卷,則接收問卷中的領域專有問句內容,將其寫入領域語料庫,上述問句的相似次數以初始值0寫入,答句列表為空。

步驟3:接收一個由訪談錄音轉換而成的文本片段,所述文本片段是指一特定問句和對應的一答句的組合;該步驟得到的問句,簡稱為“新問句”,其答句,簡稱為“新答句”。

步驟4:將新問句與通用語料庫中已存儲的問句逐一進行文本相似度計算,所述文本相似度可以使用距離函數或相似系數進行計算和表達。

步驟5:比較步驟4的每一個計算結果與步驟2得到的文本相似度閾值大小,

如果步驟4的計算結果均小于文本相似度閾值或通用語料庫為空,那么轉至步驟6;如果步驟4的計算結果至少有一個大于或等于文本相似度閾值,那么則按下述步驟進行:

步驟5-1:查找出通用語料庫中對應最大計算結果的問句,即語料庫中與新問句最相似的問句;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011089200.0/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 色一情一交一乱一区二区三区| 一区二区三区国产精品视频 | 国产欧美一区二区三区在线播放| 九色国产精品入口| 国产区二区| 国产欧美亚洲精品| 久久精品中文字幕一区| 国产激情二区| 国产中文字幕一区二区三区| 午夜大片网| 久久99精品国产一区二区三区| 久久99精品一区二区三区| 国产一区二区三区黄| 久久两性视频| 男女视频一区二区三区| 99国产精品一区| 中文字幕日韩一区二区| 亚洲精品性| 国产精品久久久久免费a∨大胸| 国产午夜亚洲精品午夜鲁丝片| 久久一区二区三区视频| 国v精品久久久网| 亚洲在线久久| 欧美日韩国产精品综合| 国产精品一区二区日韩新区 | 欧美在线观看视频一区二区 | 国产欧美精品一区二区三区小说| 久久午夜鲁丝片午夜精品| 色综合久久综合| 欧美一区亚洲一区| 理论片午午伦夜理片在线播放| 99国产精品一区二区| 小萝莉av| 午夜看片在线| 日本午夜一区二区| 国产97免费视频| 午夜叫声理论片人人影院| 国产日韩欧美精品一区| 国产一a在一片一级在一片 | 51区亚洲精品一区二区三区| 日韩精品免费看| 午夜影院色| 996久久国产精品线观看| 国产91高清| 亚洲五码在线| 超碰97国产精品人人cao| 欧美日韩久久一区二区| 国内精品在线免费| 思思久久96热在精品国产| 黄毛片在线观看| 护士xxxx18一19| 午夜电影理伦片2023在线观看| 久久国产欧美一区二区三区免费| 午夜看大片| 中文字幕一区二区三区又粗| 一本色道久久综合亚洲精品浪潮| 午夜伦理片在线观看| 99爱精品在线| 中文av一区| 久久国产精品网站| 91一区二区三区视频| 国产一区二区三区四区五区七| 国产99视频精品免视看芒果| 狠狠色狠狠色合久久伊人| 国产精品午夜一区二区| 日韩av一区二区在线播放 | 欧美hdxxxx| 国产一级片网站| 国产一区二三| 亚洲精品一区二区三区香蕉| 欧美一区二区伦理片| 亚洲国产精品入口| 日本五十熟hd丰满| 精品国产九九九| 国产精品偷拍| 日韩av中文字幕在线| 国产一区日韩一区| 97精品国产97久久久久久| 欧美日韩不卡视频| 国内久久精品视频| 国产女人好紧好爽| 91一区二区在线观看|