日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于人工智能自動識別社區問答論壇中的正確回答的方法在審

專利信息
申請號: 201911058818.8 申請日: 2019-11-01
公開(公告)號: CN110825930A 公開(公告)日: 2020-02-21
發明(設計)人: 孫海峰;王晶;戚琦;王敬宇;郭令奇;馬兵;杜純寧 申請(專利權)人: 北京郵電大學
主分類號: G06F16/9032 分類號: G06F16/9032;G06F16/906;G06F16/951
代理公司: 暫無信息 代理人: 暫無信息
地址: 100876 *** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 人工智能 自動識別 社區 問答 論壇 中的 正確 回答 方法
【權利要求書】:

1.基于人工智能自動識別社區問答論壇中的正確回答的方法,其特征在于:所述方法包括下列操作步驟:

(1)數據集建立的過程,具體內容是:先用爬蟲軟件爬取大量的問答貼內容;在爬取后,將所述問答貼內容以提問和單個回答組成的文本對的形式進行數據存儲;然后對前述存儲的數據進行數據清洗,再進行人工標注,建立數據集;

(2)使用深度學習的方法抽取文本對的信息特征,具體內容是:將步驟(1)中獲得的數據集作為訓練集訓練深度學習模型,然后用所述的深度學習模型提取文本對的語氣,關鍵詞,語法結構等特征;

(3)使用規則提取提問和回答的其他特征,具體內容是:計算提問與回答發布的天數差、利用TF-IDF計算單個回答與當前提問的相似程度、利用TF-IDF計算單個回答與當前提問的其他回答的相似程度等特征,將這些特征與步驟(2)中得到的特征拼接成特征向量;

(4)訓練機器學習分類模型并預測新帖,具體內容是:將步驟(3)獲得的特征向量對機器學習分類模型進行訓練;訓練完成后對新帖進行預測,先用爬蟲爬取新帖的全部內容并存儲,之后按照步驟(2)和步驟(3)抽取特征組成向量再用所述的機器學習分類模型進行預測,選取概率最高的前n個回答,n為自然數,n不大于回答的總個數。

2.根據權利要求1所述的基于人工智能自動識別社區問答論壇中的正確回答的方法,其特征在于:所述步驟(1)的具體內容包括如下操作步驟:

(11)使用爬蟲爬取網站的信息,將帖子提問,回答,提問用戶,回答用戶,發帖時間等信息存儲,也可以從其他類似數據集中獲得數據,一并進行整理;

(12)遍歷并用“NULL”填充為空的屬性,統一文本的最大長度,清洗干擾數據;

(13)將上一步驟中獲得的數據以問題和單個回答以文本對的形式存儲,進行人工標注。

3.根據權利要求1所述的基于人工智能自動識別社區問答論壇中的正確回答的方法,其特征在于:所述步驟(2)的具體內容包括如下操作步驟:

(21)使用BERT模型并根據步驟(1)中得到的數據進行微調訓練;BERT模型將輸入的文本內容進行字節編碼、片段編碼和位置編碼;在微調訓練結束后,將微調后的模型存儲;

(22)將步驟(21)中得到的三個編碼層的向量相加后進行分類,獲得單個提問和單個回答的分類結果,所述分類結果中含有BERT模型學習到文本中的語氣,關鍵詞等文本特征。

4.根據權利要求1所述的基于人工智能自動識別社區問答論壇中的正確回答的方法,其特征在于:所述步驟(3)的具體內容包括如下操作步驟:

(31)在所述數據集中讀取當前提問和其回答的時間,計算天數差,即天數差=提問的時間-回答提問的時間,使用TF-IDF詞頻-逆文件頻率算法來計算單個回答和提問的相似度;

(32)根據步驟(2)中所得到對所有回答的分類結果,計算每個回答與它當前提問的概率最高的回答之間的相似度,具體方法是使用TF-IDF詞頻-逆文件頻率算法來計算所述相似度,所述概率最高的回答即優秀回答;

(33)將前述獲得的天數差特征、相似度特征和步驟(2)中獲得的特征值拼接成特征向量,所述特征向量的格式為[BERT預測概率,當前回答和優秀回答的相似度,回答和提問的相似度,天數差]。

5.根據權利要求1所述的基于人工智能自動識別社區問答論壇中的正確回答的方法,其特征在于:所述步驟(4)的具體內容包括如下操作步驟:

(41)選取SVM模型作為機器學習分類模型,根據步驟(3)獲得的特征向量對所述機器學習分類模型進行訓練;

(42)獲得目標帖的相關信息,包括但不限于提問內容、回答內容、發帖時間,按照步驟(1)的存儲格式,將提問和單個回答以文本對的形式存儲;

(43)根據上一步驟獲得的文本數據,使用在步驟(2)中微調好的BERT模型對所述目標貼進行預測,再按照步驟(3)的方法計算天數差、相似度等特征之后組合成特征向量,特征向量格式與步驟(3)中組成的特征向量格式相同,特征向量的個數與回答個數相等;

(44)使用步驟(41)中訓練好的機器學習分類模型對所述特征向量進行預測,輸出前n個概率最高的回答供用戶參考,n為自然數,n不大于回答的總個數。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201911058818.8/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 97一区二区国产好的精华液| 激情久久影院| 国产69精品久久久久999天美| 亚洲va国产2019| 午夜影院91| 538在线一区二区精品国产| 午夜黄色网址| 欧美一区二区精品久久| 国产清纯白嫩初高生在线播放性色| 高清国产一区二区| 大伊人av| 久久综合久久自在自线精品自| 午夜电影毛片| 国产一区二区高清视频| 国产中文字幕一区二区三区| 午夜毛片在线| 人人澡超碰碰97碰碰碰| 一区二区三区国产精华| 精品国产一区二区三区在线| 一区二区三区欧美视频| 国产精品亚州| 欧美一区二区三区艳史| 狠狠色综合久久婷婷色天使| 久久精品综合视频| 国产一区在线免费| 97人人模人人爽视频一区二区| 久久国产精品免费视频| 久久久久亚洲精品| 国产精品视频一区二区在线观看| 日日噜噜夜夜狠狠| 国产suv精品一区二区4| 国产一区激情| 免费视频拗女稀缺一区二区| 欧美激情在线观看一区| 国产69精品久久久久999天美| 最新国产精品自拍| 亚洲精品日日夜夜| 午夜av影视| 热99re久久免费视精品频软件 | 美女直播一区二区三区| 国产v亚洲v日韩v欧美v片| 麻豆精品国产入口| 午夜性电影| 夜夜夜夜曰天天天天拍国产| 精品福利一区二区| 国产精品乱码久久久久久久| 欧美日韩一区二区三区69堂| 一区二区三区欧美在线| 亚洲欧洲一区二区| 97欧美精品| 国产日韩欧美中文字幕| 久久99精品国产麻豆宅宅| 亚洲网久久| 99精品国产一区二区三区不卡 | 午夜国产一区二区三区四区| 国产第一区二区| 国产欧美精品一区二区三区小说| 少妇高潮在线观看| 亚州精品国产| 日韩av不卡一区| 少妇性色午夜淫片aaa播放5| 美国三级日本三级久久99| 午夜影院一区| 香蕉av一区二区三区| 亚洲久色影视| 亚洲精品一区在线| 色婷婷噜噜久久国产精品12p | 国产一区二三| 在线国产一区二区三区| 强行挺进女警紧窄湿润| 国产1区2区3区| 国产精品刺激对白麻豆99| 欧美日韩国产午夜| 国产欧美一区二区在线观看| 欧美乱妇在线观看| 国产欧美一二三区| 亚洲乱亚洲乱妇50p| 小萝莉av| 亚洲欧美国产一区二区三区| 91国产一区二区| 91麻豆精品国产91久久久久推荐资源 | 少妇太爽了在线观看免费|