[發(fā)明專利]基于人工智能的分詞方法、裝置、服務(wù)器和存儲(chǔ)介質(zhì)有效

申請?zhí)枺?/td>	201710448749.6	申請日：	2017-06-14
公開（公告）號(hào)：	CN107273356B	公開（公告）日：	2020-08-11
發(fā)明（設(shè)計(jì)）人：	鄭利群;詹金波;肖求根;付志宏;何徑舟;周古月	申請（專利權(quán)）人：	北京百度網(wǎng)訊科技有限公司
主分類號(hào)：	G06F40/289	分類號(hào)：	G06F40/289
代理公司：	北京品源專利代理有限公司 11332	代理人：	孟金喆
地址：	100085 北京市***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	基于人工智能分詞方法裝置服務(wù)器存儲(chǔ) 介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明實(shí)施例公開了一種基于人工智能的分詞方法、裝置、服務(wù)器和存儲(chǔ)介質(zhì)。所述方法包括：獲取待分詞語料以及與設(shè)定分詞模板對應(yīng)的分詞模型；根據(jù)設(shè)定匹配算法，匹配待分詞語料與分詞模型，獲取待分詞語料中滿足第一設(shè)定規(guī)則的目標(biāo)詞組；根據(jù)目標(biāo)詞組修正與分詞模型和待分詞語料對應(yīng)的發(fā)射矩陣；根據(jù)修正后的發(fā)射矩陣對待分詞語料進(jìn)行分詞處理，得到第一分詞結(jié)果。本發(fā)明實(shí)施例的技術(shù)方案解決了現(xiàn)有技術(shù)中針對專業(yè)領(lǐng)域或特定場景，對文本進(jìn)行分詞的過程繁瑣以及準(zhǔn)確度低的技術(shù)缺陷，實(shí)現(xiàn)了快速、簡單以及準(zhǔn)確地針對專業(yè)領(lǐng)域或特定場景對文本進(jìn)行分詞。

技術(shù)領(lǐng)域

本發(fā)明實(shí)施例涉及分詞技術(shù)領(lǐng)域，尤其涉及一種基于人工智能的分詞方法、裝置、服務(wù)器和存儲(chǔ)介質(zhì)。

背景技術(shù)

人工智能(Artificial Intelligence)，英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支，它企圖了解智能的實(shí)質(zhì)，并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器，該領(lǐng)域的研究包括機(jī)器人、語言識(shí)別、圖像識(shí)別、自然語言處理和專家系統(tǒng)等。

中文分詞指的是將一個(gè)漢字序列切分成一個(gè)一個(gè)單獨(dú)的詞。中文分詞是文本挖掘的基礎(chǔ)，對于輸入的一段中文，成功的進(jìn)行中文分詞，可以達(dá)到電腦自動(dòng)識(shí)別語句含義的效果。

現(xiàn)有的中文分詞模型一般都是通用分詞模型，無法針對專業(yè)領(lǐng)域或特定場景對文本進(jìn)行準(zhǔn)確的分詞。現(xiàn)有技術(shù)中一般通過對通用分詞模型的分詞結(jié)果進(jìn)行后處理來實(shí)現(xiàn)針對專業(yè)領(lǐng)域或特定場景對文本進(jìn)行準(zhǔn)確分詞，或者是通過使用專業(yè)領(lǐng)域或特定場景的分詞訓(xùn)練語料重新訓(xùn)練現(xiàn)有的通用分詞模型，得到專業(yè)領(lǐng)域或特定場景對應(yīng)的分詞模型。

上述兩種方法中，對于第一種方法來說，由于詞組之間存在交疊現(xiàn)象，因此會(huì)導(dǎo)致分詞結(jié)果錯(cuò)誤，對于第二種方法來說，重新訓(xùn)練分詞模型費(fèi)時(shí)費(fèi)力，且難易保證分詞質(zhì)量。

發(fā)明內(nèi)容

有鑒于此，本發(fā)明實(shí)施例提供了一種基于人工智能的分詞方法、裝置、服務(wù)器和存儲(chǔ)介質(zhì)，以解決現(xiàn)有技術(shù)中針對專業(yè)領(lǐng)域或特定場景，對文本進(jìn)行分詞的過程繁瑣以及準(zhǔn)確度低的技術(shù)缺陷。

在第一方面，本發(fā)明實(shí)施例提供了一種基于人工智能的分詞方法，包括：

獲取待分詞語料以及與設(shè)定分詞模板對應(yīng)的分詞模型；

根據(jù)設(shè)定匹配算法，匹配所述待分詞語料與所述分詞模型，獲取所述待分詞語料中滿足第一設(shè)定規(guī)則的目標(biāo)詞組；

根據(jù)所述目標(biāo)詞組修正與所述分詞模型和所述待分詞語料對應(yīng)的發(fā)射矩陣；

根據(jù)修正后的發(fā)射矩陣對所述待分詞語料進(jìn)行分詞處理，得到第一分詞結(jié)果。

在第二方面，本發(fā)明實(shí)施例提供了一種基于人工智能的分詞裝置，包括：

模型獲取模塊，用于獲取待分詞語料以及與設(shè)定分詞模板對應(yīng)的分詞模型；

詞組獲取模塊，用于根據(jù)設(shè)定匹配算法，匹配所述待分詞語料與所述分詞模型，獲取所述待分詞語料中滿足第一設(shè)定規(guī)則的目標(biāo)詞組；

矩陣修正模塊，用于根據(jù)所述目標(biāo)詞組修正與所述分詞模型和所述待分詞語料對應(yīng)的發(fā)射矩陣；

分詞處理模塊，用于根據(jù)修正后的發(fā)射矩陣對所述待分詞語料進(jìn)行分詞處理，得到第一分詞結(jié)果。

在第三方面，本發(fā)明實(shí)施例提供了一種服務(wù)器，所述服務(wù)器包括：

一個(gè)或多個(gè)處理器；

存儲(chǔ)裝置，用于存儲(chǔ)一個(gè)或多個(gè)程序，

當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行，使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)本發(fā)明實(shí)施例所述的基于人工智能的分詞方法。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司，未經(jīng)北京百度網(wǎng)訊科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201710448749.6/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】