[發(fā)明專利]文本跨度的智能選擇有效
| 申請?zhí)枺?/td> | 201480055252.2 | 申請日: | 2014-10-01 |
| 公開(公告)號: | CN105637507B | 公開(公告)日: | 2019-03-08 |
| 發(fā)明(設(shè)計(jì))人: | P·潘特爾;M·蓋蒙;A·D·富克斯曼;B·科爾邁爾;P·基拉卡馬里 | 申請(專利權(quán))人: | 微軟技術(shù)許可有限責(zé)任公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35 |
| 代理公司: | 永新專利商標(biāo)代理有限公司 72002 | 代理人: | 劉瑜;王英 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 跨度 智能 選擇 | ||
預(yù)測形成用戶想要選擇的單個(gè)詞或一系列兩個(gè)或更多個(gè)詞的文本跨度。文檔和指示文檔中特定位置的位置指針被接收并且被輸入到不同的候選文本跨度生成方法。從不同的候選文本跨度生成方法中的每一個(gè)接收關(guān)于一個(gè)或多個(gè)記分候選文本跨度的排名列表。機(jī)器學(xué)習(xí)總體模型用于對從不同的候選文本跨度生成方法中的每一個(gè)接收到的每個(gè)記分候選文本跨度進(jìn)行重新記分。所述總體模型是利用機(jī)器學(xué)習(xí)方法和來自真實(shí)意圖用戶文本跨度選擇數(shù)據(jù)集的特征來訓(xùn)練的。從所述總體模型接收重新記分候選文本跨度排名列表。
背景技術(shù)
在當(dāng)今的生產(chǎn)力環(huán)境中,用戶在各應(yīng)用中消費(fèi)或著作各種內(nèi)容的同時(shí)不斷地研究話題,其中這些應(yīng)用可以包括諸如電子閱讀器等閱讀器應(yīng)用以及諸如文本處理器、電子表單、演示程序和社交網(wǎng)絡(luò)等生產(chǎn)力應(yīng)用。用戶通常使用萬維網(wǎng)(下文簡稱為Web)來研究話題。例如,用戶可以在當(dāng)前對他們顯示的文檔內(nèi)選擇文本跨度,并且隨后可以針對選定的文本跨度搜索Web。
由于諸如經(jīng)濟(jì)全球化和正在進(jìn)行中的計(jì)算、數(shù)據(jù)通信和計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)方面的進(jìn)步的因素,全球范圍的用戶正在變得越來越移動(dòng)化。現(xiàn)在各種類型的移動(dòng)計(jì)算設(shè)備可通過商業(yè)方式獲得,其允許用戶普遍且方便地在移動(dòng)的同時(shí)執(zhí)行完全獨(dú)立的計(jì)算與數(shù)據(jù)通信活動(dòng)。智能手機(jī)和平板式計(jì)算機(jī)是此種移動(dòng)計(jì)算設(shè)備的兩個(gè)示例。移動(dòng)計(jì)算設(shè)備的普及度持續(xù)快速增長,可獲得的移動(dòng)計(jì)算應(yīng)用的類型也持續(xù)快速增長。因此,常規(guī)地使用移動(dòng)計(jì)算設(shè)備來執(zhí)行它們的在線計(jì)算、通信和信息管理任務(wù)(諸如剛剛描述的話題研究)的用戶數(shù)量持續(xù)快速地增長。事實(shí)上,移動(dòng)計(jì)算設(shè)備已經(jīng)變成了許多用戶的主要計(jì)算設(shè)備。
發(fā)明內(nèi)容
提供該發(fā)明內(nèi)容以便以下文在具體實(shí)施方式部分中進(jìn)一步描述的簡化形式來引入概念的選集。該發(fā)明內(nèi)容不意在確定權(quán)利要求主題的關(guān)鍵特征或重要特征,也不意在用來輔助確定權(quán)利要求主題的范圍。
本文所描述的智能選擇技術(shù)實(shí)施例一般涉及對形成用戶想要選擇的單個(gè)詞或一系列的兩個(gè)或更多個(gè)詞的文本跨度進(jìn)行預(yù)測。在一個(gè)示例性實(shí)施例中,包括字符串的文檔被接收到,并且指示文檔中特定位置的位置指針也被接收到。然后,文檔和位置指針輸入到多個(gè)不同的候選文本跨度生成方法。然后,從不同的候選文本跨度生成方法中的每一個(gè)接收關(guān)于一個(gè)或多個(gè)記分候選文本跨度的排名列表。然后,使用機(jī)器學(xué)習(xí)總體模型(machine-learned ensemble model)來對從不同候選文本跨度生成方法中的每一個(gè)接收到的每個(gè)記分候選文本跨度進(jìn)行重新記分,其中總體模型是利用機(jī)器學(xué)習(xí)方法和來自真實(shí)意圖的用戶文本跨度選擇數(shù)據(jù)集的特征來訓(xùn)練的。然后,從總體模型接收重新記分候選文本跨度的排名列表。
在另一示例性實(shí)施例中,將文檔和位置指針輸入到機(jī)器學(xué)習(xí)超鏈接意圖模型。然后,從超鏈接意圖模型接收記分候選文本跨度的排名列表。
附圖說明
結(jié)合下面的說明書、隨附權(quán)利要求和附圖,將更好的理解本文所描述的智能選擇技術(shù)實(shí)施例的具體的特征、方面和優(yōu)點(diǎn),在附圖中:
圖1是示出用于預(yù)測形成用戶想要選擇的單個(gè)詞或一系列兩個(gè)或更多個(gè)詞的文本跨度的過程的簡化形式的一個(gè)實(shí)施例的流程圖。
圖2是示出用于預(yù)測形成用戶想要選擇的單個(gè)詞或一系列兩個(gè)或更多個(gè)詞的文本跨度的總體學(xué)習(xí)架構(gòu)的簡化形式的示例性實(shí)施例的圖。
圖3是示出用于構(gòu)建由本文所描述的智能選擇技術(shù)實(shí)施例所使用的真實(shí)意圖的用戶文本跨度選擇的數(shù)據(jù)集的大規(guī)模群集源方法的簡化形式的示例性實(shí)施例的流程圖。
圖4是示出使用超鏈接意圖模型方法來識(shí)別預(yù)測用戶想要選擇什么的候選文本跨度的過程的簡化形式的示例性實(shí)施例的流程圖。
圖5是提供用于圖4示范的過程的譯碼流的示例性實(shí)施例的簡化形式的圖形圖示的圖。
圖6A和6B是示出用于預(yù)測形成用戶想要選擇的單個(gè)詞或一系列兩個(gè)或更多個(gè)詞的文本跨度的過程的簡化形式的另一實(shí)施例的流程圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微軟技術(shù)許可有限責(zé)任公司,未經(jīng)微軟技術(shù)許可有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201480055252.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





