[發(fā)明專利]使用語法單元的文檔搜索在審
| 申請?zhí)枺?/td> | 201811039364.5 | 申請日: | 2018-09-06 |
| 公開(公告)號: | CN110020032A | 公開(公告)日: | 2019-07-16 |
| 發(fā)明(設(shè)計)人: | D·辛加爾;R·T·A·文卡塔;T·帕特爾;A·穆克赫杰;A·納塔拉杰 | 申請(專利權(quán))人: | 奧多比公司 |
| 主分類號: | G06F16/93 | 分類號: | G06F16/93;G06F17/27 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 酆迅;辛鳴 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語法單元 文檔 文檔搜索 接收查詢 用戶界面 搜索 查詢 申請 應(yīng)用 | ||
1.一種用于在至少一個文檔內(nèi)搜索的計算機程序產(chǎn)品,所述計算機程序產(chǎn)品被有形地體現(xiàn)在非暫態(tài)計算機可讀存儲介質(zhì)上并且包括指令,所述指令在由至少一個計算設(shè)備執(zhí)行時,被配置為使得所述至少一個計算設(shè)備:
通過應(yīng)用的用戶界面結(jié)合所述至少一個文檔的標識來接收查詢,所述至少一個文檔使用計算機存儲器而被存儲;
標識所述至少一個文檔內(nèi)的多個語法單元;
關(guān)于所述查詢、針對每個語法單元提取用于至少一個特征的值,所述至少一個特征值表征每個語法單元與所述查詢的相關(guān)性;
基于每個語法單元的每個特征值來對所述語法單元排名;以及
基于所述排名、通過所述用戶界面并且結(jié)合所述至少一個文檔來顯示所述多個語法單元中的至少一個選擇的語法單元。
2.根據(jù)權(quán)利要求1所述的計算機程序產(chǎn)品,其中所述指令在被執(zhí)行時,還被配置為使得所述至少一個計算設(shè)備:
接收由用戶說出的所述查詢;
將說出的所述查詢轉(zhuǎn)換為查詢文本;以及
使用所述用戶界面顯示所述查詢文本。
3.根據(jù)權(quán)利要求1所述的計算機程序產(chǎn)品,其中所述至少一個語法單元包括短語、子句、句子和段落中的至少一項。
4.根據(jù)權(quán)利要求1所述的計算機程序產(chǎn)品,其中所述至少一個語法單元的類型結(jié)合所述查詢的接收而被接收。
5.根據(jù)權(quán)利要求1所述的計算機程序產(chǎn)品,其中所述指令在被執(zhí)行時,還被配置為使得所述至少一個計算設(shè)備提取用于所述至少一個特征的所述值,包括:
基于每個單詞在所述語法單元中和所述查詢中的單詞出現(xiàn),來針對每個語法單元計算語言模型,所述語言模型表征每個語法單元與所述查詢的相關(guān)性。
6.根據(jù)權(quán)利要求1所述的計算機程序產(chǎn)品,其中所述指令在被執(zhí)行時,還被配置為使得所述至少一個計算設(shè)備提取用于所述至少一個特征的所述值,包括:
基于每個單詞在所述查詢和所述語法單元內(nèi)的向量表示之間的至少一個相似性度量,來計算所述查詢與每個語法單元之間的語義相似性。
7.根據(jù)權(quán)利要求1所述的計算機程序產(chǎn)品,其中所述指令在被執(zhí)行時,還被配置為使得所述至少一個計算設(shè)備提取用于所述至少一個特征的所述值,包括:
基于至少一個相鄰語法單元的相關(guān)性得分,來計算所述查詢與每個語法單元之間的上下文相似性。
8.根據(jù)權(quán)利要求1所述的計算機程序產(chǎn)品,其中所述指令在被執(zhí)行時,還被配置為使得所述至少一個計算設(shè)備:
使用經(jīng)訓(xùn)練的模型對所述語法單元排名,其中所述至少一個特征被用于訓(xùn)練所述模型并且優(yōu)化要在所述排名期間被使用的所述模型的權(quán)重。
9.根據(jù)權(quán)利要求1所述的計算機程序產(chǎn)品,其中所述指令在被執(zhí)行時,還被配置為使得所述至少一個計算設(shè)備顯示所述至少一個選擇的語法單元,包括:
顯示所述至少一個文檔內(nèi)的排名的所述語法單元,包括每個顯示的排名的語法單元的視覺指定,所述視覺指定指示對應(yīng)的排名順序。
10.根據(jù)權(quán)利要求9所述的計算機程序產(chǎn)品,其中所述視覺指定包括與對應(yīng)的排名的語法單元相鄰地被顯示的排名標識符。
11.根據(jù)權(quán)利要求9所述的計算機程序產(chǎn)品,其中所述視覺指定包括響應(yīng)于對應(yīng)的用戶輸入并且按照所述排名的順序連續(xù)地突出顯示所述至少一個文檔內(nèi)的各個語法單元。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于奧多比公司,未經(jīng)奧多比公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811039364.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





