[發(fā)明專利]問答對的生成方法和裝置在審
| 申請?zhí)枺?/td> | 201910420007.1 | 申請日: | 2019-05-20 |
| 公開(公告)號: | CN110196929A | 公開(公告)日: | 2019-09-03 |
| 發(fā)明(設(shè)計)人: | 崔建青;劉璟 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F16/9032 | 分類號: | G06F16/9032 |
| 代理公司: | 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 子標(biāo)題 拼接 預(yù)設(shè) 方法和裝置 文本標(biāo)題 文本信息 文本信息內(nèi)容 策略確定 問答服務(wù) 用戶提供 用戶問題 構(gòu)建 解析 篩選 應(yīng)用 | ||
本發(fā)明提出一種問答對的生成方法和裝置,其中,方法包括:獲取待解析的文本信息,并提取文本信息中的文本標(biāo)題和多級子標(biāo)題;獲取與多級子標(biāo)題中的預(yù)設(shè)級別的第一子標(biāo)題,并確定與第一子標(biāo)題對應(yīng)的擴展標(biāo)題;確定多級子標(biāo)題中高于預(yù)設(shè)級別的第二子標(biāo)題;將文本標(biāo)題和第二子標(biāo)題,與第一子標(biāo)題及其對應(yīng)的擴展標(biāo)題中的每個標(biāo)題拼接,獲取多個拼接候選問題;根據(jù)預(yù)設(shè)的篩選策略確定多個拼接候選問題中的目標(biāo)拼接問題;根據(jù)目標(biāo)拼接問題和第一子標(biāo)題包括的文本信息內(nèi)容構(gòu)建問答對。由此,豐富了問答對,召回了更多的問答資源,實現(xiàn)了問答對中的問題與實際應(yīng)用中的用戶問題更加貼近,實用性較強,提高了為用戶提供的問答服務(wù)質(zhì)量。
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理技術(shù)領(lǐng)域,尤其涉及一種問答對的生成方法和裝置。
背景技術(shù)
隨著計算技術(shù)的發(fā)展,很多信息以文檔或者網(wǎng)頁等文本的形式存在,文本信息中包含了很多的優(yōu)質(zhì)的內(nèi)容,有些高質(zhì)量的內(nèi)容是可以直接作為用戶問題的答案的。基于文本信息的內(nèi)容為用戶提供問答服務(wù),是目前常用的一種服務(wù)方式。
相關(guān)技術(shù)中,構(gòu)建問答對實現(xiàn)問答服務(wù),基于文本信息的內(nèi)容生成問題,進(jìn)而,基于問題與對應(yīng)的文檔內(nèi)容構(gòu)建問答對,然而,這種方式,導(dǎo)致生成的問題受到內(nèi)容的多種影響,生成的問題總結(jié)性不高,質(zhì)量較差。
發(fā)明內(nèi)容
本發(fā)明旨在至少在一定程度上解決上述技術(shù)中的技術(shù)問題之一。
為此,本發(fā)明的第一個目的在于提出一種問答對的生成方法,豐富了問答對,召回了更多的問答資源,實現(xiàn)了問答對中的問題與實際應(yīng)用中的用戶問題更加貼近,實用性較強,提高了為用戶提供的問答服務(wù)質(zhì)量。
本發(fā)明的第二個目的在于提出一種問答對的生成裝置。
本發(fā)明的第三個目的在于提出一種計算機設(shè)備。
本發(fā)明的第四個目的在于提出一種非臨時性計算機可讀存儲介質(zhì)。
為達(dá)上述目的,本發(fā)明第一方面實施例提出了一種問答對的生成方法,包括以下步驟:
獲取待解析的文本信息,并提取所述文本信息中的文本標(biāo)題和多級子標(biāo)題;獲取與所述多級子標(biāo)題中的預(yù)設(shè)級別的第一子標(biāo)題,并確定與所述第一子標(biāo)題對應(yīng)的擴展標(biāo)題;在所述多級子標(biāo)題中,確定與所述第一子標(biāo)題對應(yīng)的第二子標(biāo)題,其中,所述第二子標(biāo)題的等級高于所述預(yù)設(shè)級別;將所述文本標(biāo)題和所述第二子標(biāo)題與所述第一子標(biāo)題及其對應(yīng)的擴展標(biāo)題中的每個標(biāo)題拼接,獲取多個拼接候選問題;根據(jù)所述多個拼接候選問題確定目標(biāo)拼接問題;根據(jù)所述目標(biāo)拼接問題和所述第一子標(biāo)題包括的段落內(nèi)容構(gòu)建問答對。
本發(fā)明實施例的問答對的生成方法,獲取待解析的文本信息,并提取文本信息中的文本標(biāo)題和多級子標(biāo)題,獲取與多級子標(biāo)題中的預(yù)設(shè)級別的第一子標(biāo)題,并確定與第一子標(biāo)題對應(yīng)的擴展標(biāo)題,確定多級子標(biāo)題中高于預(yù)設(shè)級別的第二子標(biāo)題,進(jìn)而,將文本標(biāo)題和第二子標(biāo)題,與第一子標(biāo)題及其對應(yīng)的擴展標(biāo)題中的每個標(biāo)題拼接,獲取多個拼接候選問題,最后,根據(jù)多個拼接候選問題確定目標(biāo)拼接問題,并根據(jù)目標(biāo)拼接問題和第一子標(biāo)題包括的段落內(nèi)容構(gòu)建問答對。由此,豐富了問答對,召回了更多的問答資源,實現(xiàn)了問答對中的問題與實際應(yīng)用中的用戶問題更加貼近,實用性較強,提高了為用戶提供的問答服務(wù)質(zhì)量。
為達(dá)上述目的,本發(fā)明第二方面實施例提出了一種問答對的生成裝置,包括:提取模塊,用于獲取待解析的文本信息,并提取所述文本信息中的文本標(biāo)題和多級子標(biāo)題;第一獲取模塊,用于獲取與所述多級子標(biāo)題中的預(yù)設(shè)級別的第一子標(biāo)題,并確定與所述第一子標(biāo)題對應(yīng)的擴展標(biāo)題;第一確定模塊,用于在所述多級子標(biāo)題中,確定與所述第一子標(biāo)題對應(yīng)的第二子標(biāo)題,其中,所述第二子標(biāo)題的等級高于所述預(yù)設(shè)級別;第二獲取模塊,用于將所述文本標(biāo)題和所述第二子標(biāo)題與所述第一子標(biāo)題及其對應(yīng)的擴展標(biāo)題中的每個標(biāo)題拼接,獲取多個拼接候選問題;第二確定模塊,用于根據(jù)所述多個拼接候選問題確定目標(biāo)拼接問題;構(gòu)建模塊,用于根據(jù)所述目標(biāo)拼接問題和所述第一子標(biāo)題包括的段落內(nèi)容構(gòu)建問答對。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910420007.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 子標(biāo)題編碼/譯碼方法和設(shè)備
- 網(wǎng)絡(luò)兼容電子裝置、網(wǎng)頁處理方法和程序
- 提供屏上菜單系統(tǒng)的方法和裝置
- 三維圖像數(shù)據(jù)發(fā)送設(shè)備、三維圖像數(shù)據(jù)發(fā)送方法、三維圖像數(shù)據(jù)接收設(shè)備和三維圖像數(shù)據(jù)接收方法
- 基于人工智能的為新聞生成短標(biāo)題的方法和裝置
- 一種標(biāo)題的切換方法、裝置、電子設(shè)備及可讀介質(zhì)
- 自動合同審查方法、裝置、介質(zhì)以及電子設(shè)備
- 問答對的生成方法和裝置
- 用于展示頁面菜單欄的方法、裝置、電子設(shè)備和可讀介質(zhì)
- 子標(biāo)題讀出方法和設(shè)備





