[發(fā)明專利]一種例句檢索的方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201210413295.6 | 申請日: | 2012-10-25 |
| 公開(公告)號: | CN102890723A | 公開(公告)日: | 2013-01-23 |
| 發(fā)明(設(shè)計)人: | 楊振東;石志偉;周步戀;車天文;王更生;王喜民;何宏靖;徐憶蘇 | 申請(專利權(quán))人: | 深圳市宜搜科技發(fā)展有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 深圳市世紀(jì)恒程知識產(chǎn)權(quán)代理事務(wù)所 44287 | 代理人: | 胡海國 |
| 地址: | 518026 廣東省深圳市福田區(qū)濱*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 例句 檢索 方法 系統(tǒng) | ||
1.一種例句檢索的方法,其特征在于,包括,
獲取用戶輸入的查詢詞query;
在例句庫中檢索匹配query的例句,并進(jìn)行所述query與例句的相關(guān)性計算;
根據(jù)用法多樣性或翻譯多樣性原則,進(jìn)行例句相關(guān)性打分調(diào)整,進(jìn)行例句排序;
輸出例句并展示例句中的短語。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在獲取用戶輸入的查詢詞后,還包括,
對用戶輸入的query進(jìn)行處理。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述在例句庫中檢索匹配query的例句,并進(jìn)行所述query與例句的相關(guān)性計算具體包括,
根據(jù)例句中query與其它詞構(gòu)成短語的短語概率、相關(guān)句法結(jié)點(diǎn)概率、句子完整性概率、句長概率、噪音概率進(jìn)行query與例句的相關(guān)性計算。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,
query在例句中的與其它詞構(gòu)成短語的短語概率pphr
其中,wq表示用戶輸入query,w為例句中的詞,phr(wq,w)表示wq與w構(gòu)成短語,δ(wq,wqk)表示構(gòu)成的短語中wq為核心詞,δ(wq,wqnk)表示構(gòu)成的短語中wq為非核心詞,且有:
若wq為核心詞,則δ(wq,wqk)=1,δ(wq,wqnk)?=0;
若wq為非核心詞,則δ(wq,wqnk)=1,δ(wq,wqk)=0;
f表示短語出現(xiàn)頻率,max表示取最大值,或表示當(dāng)有多個詞與query構(gòu)成短語(wq為核心詞或非核心詞)時,取頻率最大值進(jìn)行歸一;
query在例句中相關(guān)句法結(jié)點(diǎn)概率psyn
f為出現(xiàn)頻率,wq為用戶query,syn(w1...wq...wn)表示(w1...wq...wn)構(gòu)成一個句法結(jié)點(diǎn),T(syn(w1...wq...wn),N)表示句法結(jié)點(diǎn)的句法標(biāo)識符為N,句法標(biāo)識概率基于語料庫統(tǒng)計計算得出;
句子結(jié)構(gòu)完整性概率Pcom;
以句法分析是否歸結(jié)到S來反映句子結(jié)構(gòu)是否完整,
若句法解析歸結(jié)到S,Pcom=0.99,否則Pcom=10-7;
句長概率為:
L為句子長度,u為句長均值,且:
若?8=<L<=22,u=L;
若?L<8,u=8,σ=8;
若?L>25,u=15,σ=8;
例句中所含標(biāo)點(diǎn)、數(shù)字的噪音概率Ppun,根據(jù)例句長度與所含標(biāo)點(diǎn)、數(shù)字?jǐn)?shù)目及例句結(jié)尾與開頭詞的特征給予不同的概率,從而使得不規(guī)范的例句排序靠后。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市宜搜科技發(fā)展有限公司,未經(jīng)深圳市宜搜科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210413295.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





