[發(fā)明專利]數(shù)據(jù)的搜索和匹配有效
| 申請?zhí)枺?/td> | 201310044062.8 | 申請日: | 2013-02-04 |
| 公開(公告)號: | CN103970798B | 公開(公告)日: | 2019-05-28 |
| 發(fā)明(設計)人: | 黃欣榮 | 申請(專利權(quán))人: | 商業(yè)對象軟件有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F17/28;G06F17/22 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 劉虹 |
| 地址: | 愛爾蘭*** | 國省代碼: | 愛爾蘭;IE |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù) 搜索 匹配 | ||
1.一種匹配數(shù)據(jù)的計算機實現(xiàn)的方法,包括:
接收包括一個或多個第一表意元素的輸入數(shù)據(jù)串;
接收包括一個或多個第二表意元素的候選串;
提取與輸入數(shù)據(jù)串關(guān)聯(lián)的第一特征集和與候選串關(guān)聯(lián)的第二特征集,其中所述第一特征集和第二特征集包括語音特征和形狀特征的n元;以及
基于第一特征集和第二特征集來確定候選串的匹配分數(shù),
其中,n元是從文本的串或給定序列提取的n個連續(xù)字符的集合,其中n是等于或大于1的正整數(shù)。
2.如權(quán)利要求1所述的方法,其中提取第一特征集包括從輸入數(shù)據(jù)串提取至少一個第一語音特征,并且提取第二特征集包括從候選串提取至少一個第二語音特征。
3.如權(quán)利要求2所述的方法,其中從輸入數(shù)據(jù)串提取第一語音特征包括提取輸入數(shù)據(jù)串的第一語音拼寫,并且從候選串提取第二語音特征包括提取候選串的第二語音拼寫。
4.如權(quán)利要求2所述的方法,其中從輸入數(shù)據(jù)串提取第一語音特征包括基于輸入數(shù)據(jù)串的第一語音拼寫提取第一語音關(guān)鍵字,并且從候選串提取第二語音特征包括基于候選串的第二語音拼寫提取第二語音關(guān)鍵字。
5.如權(quán)利要求4所述的方法,其中提取第一語音關(guān)鍵字和第二語音關(guān)鍵字包括從第一語音拼寫和第二語音拼寫中去除任何非空格不發(fā)音的元素。
6.如權(quán)利要求5所述的方法,其中所述不發(fā)音的元素包括字母“H”、“G”、“I”或“U”。
7.如權(quán)利要求4所述的方法,其中提取第一語音關(guān)鍵字和第二語音關(guān)鍵字包括替換第一語音拼寫和第二語音拼寫中具有相應的發(fā)音相似的元素的任何元素。
8.如權(quán)利要求1所述的方法,其中提取第一特征集包括從輸入數(shù)據(jù)串提取第一形狀特征,并且提取第二特征集包括從候選串提取第二形狀特征。
9.如權(quán)利要求8所述的方法,其中所述第一形狀特征包括第一表意元素,并且第二形狀特征第二表意元素。
10.如權(quán)利要求8所述的方法,其中所述第一形狀特征包括輸入數(shù)據(jù)串的部首表示,并且第二形狀特征包括候選串的部首表示。
11.如權(quán)利要求8所述的方法,其中提取所述第一特征集包括從輸入數(shù)據(jù)串的部首表示提取第一部首關(guān)鍵字,并且提取第二特征集包括從候選串的部首表示提取第二部首關(guān)鍵字。
12.如權(quán)利要求11所述的方法,其中提取第一部首關(guān)鍵字和第二部首關(guān)鍵字包括替換與具有相應的外形相似的部首的部首相關(guān)聯(lián)的任何拉丁字符。
13.如權(quán)利要求8所述的方法,其中所述第一形狀特征包括輸入數(shù)據(jù)串的筆劃表示,而第二形狀特征包括候選串的筆劃表示。
14.如權(quán)利要求8所述的方法,其中提取所述第一特征集包括從輸入數(shù)據(jù)串的筆劃表示提取第一筆劃關(guān)鍵字,而提取第二特征集包括從候選串的筆劃表示提取第二筆劃關(guān)鍵字。
15.如權(quán)利要求14所述的方法,其中提取第一筆劃關(guān)鍵字包括從輸入數(shù)據(jù)串的筆劃表示去除任何重復的拉丁字符,并且提取第二筆劃關(guān)鍵字包括從候選串的筆劃表示去除任何重復的拉丁字符。
16.如權(quán)利要求1所述的方法,其中提取第一特征集包括基于輸入數(shù)據(jù)串提取第一語音特征的一個或多個n元,并且提取第二特征集包括基于候選串提取第二語音特征的一個或多個n元。
17.如權(quán)利要求1所述的方法,其中提取第一特征集包括基于輸入數(shù)據(jù)串提取第一形狀特征的一個或多個n元,并且提取第二特征集包括基于候選串提取第二形狀特征的一個或多個n元。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于商業(yè)對象軟件有限公司,未經(jīng)商業(yè)對象軟件有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310044062.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





