日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]標記搜索語義角色的結構化查詢信息表達方法有效

專利信息
申請號: 202011640600.6 申請日: 2020-12-31
公開(公告)號: CN112685440B 公開(公告)日: 2022-03-22
發明(設計)人: 王程 申請(專利權)人: 上海欣兆陽信息科技有限公司
主分類號: G06F16/242 分類號: G06F16/242;G06F40/30;G06N20/00
代理公司: 合肥市科融知識產權代理事務所(普通合伙) 34126 代理人: 劉冉
地址: 200030 上海*** 國省代碼: 上海;31
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 標記 搜索 語義 角色 結構 查詢 信息 表達 方法
【權利要求書】:

1.標記搜索語義角色的結構化查詢信息表達方法,其特征在于,從用戶輸入的搜索查詢中提取結構化查詢信息,將自然語言文本表示成結構化數據,準確解析用戶的搜索意圖,提升用戶的搜索滿意度;基于查詢的潛在語義結構并對搜索結構化查詢信息提取進行形式化的表示,提出標記搜索語義角色的概念并給出其完整定義:將用戶輸入的搜索查詢表示為受核心詞支配的結構化數據格式,標記出搜索查詢中的核心詞和受其支配的語義論元;

標記搜索語義角色從語句的結構特征上對用戶輸入的搜索查詢進行解析,理解把握用戶的搜索意圖,主要包括標記搜索語義角色的架構、基于半監督條件隨機域的查詢核心詞識別、基于半監督條件隨機域的結構化查詢信息提取,具體為:

第一,標記搜索語義角色的架構,對用戶輸入的搜索查詢進行深層次的解析,把用戶輸入的搜索查詢切分成若干個獨立的語義單元并將其分配到預先設定的語義類別,采取一種遞進的方式實現標記搜索語義角色的方法,包括兩部分:首先識別出用戶輸入查詢的關鍵成分,即核心詞,關鍵成分直接表示用戶真正的搜索查詢意圖,當無法對搜索查詢進行深層次的結構化解析時,核心詞保證相關性在可控范圍內;其次對用戶輸入的搜索查詢進行深層次解析,從用戶輸入的搜索查詢中提取結構化的信息,識別用戶真正的搜索意圖和潛在需求;

第二,基于半監督條件隨機域的查詢核心詞識別,對用戶輸入的搜索查詢建立模型,識別出搜索查詢中的核心詞并將其分類,從概率角度推導查詢語句的生成過程,采用一種三層貝葉斯半監督概率模型建立模型,將搜索查詢中的核心詞視為文本,將核心詞的上下文信息作為組成文本的詞匯,核心詞的類別作為主題,采用一種半監督條件隨機域模型進行核心詞的挖掘和分類;

第三,基于半監督條件隨機域的結構化查詢信息提取,采用一種半監督條件隨機域模型來提取結構化查詢信息,將用戶輸入的自然語言文本表示成結構化查詢數據,首先提出一種半自動標記方法對大量的查詢進行前置標記,然后綜合采用少量的人工標記數據和大量的半自動標記數據來訓練模型并對未標記數據進行標記,采用半監督條件隨機域的方法訓練模型對未標記數據進行結構化查詢信息提取。

2.根據權利要求1所述的標記搜索語義角色的結構化查詢信息表達方法,其特征在于,語義角色標記是標記一個語句中的謂語和受其支配的其它成分,是對語句的結構進行深入剖析從而進行語義層面解析的一種方法,語義角色標記識別出一個語句中的謂語和受其支配的其它語義論元,標記搜索語義角色對搜索查詢中各個語義角色進行自動標記,分析查詢的結構從而深層次解析用戶的搜索意圖,查詢語句受核心詞支配,查詢中的其它成分從屬于核心詞;

標記搜索語義角色的定義為:將用戶輸入的搜索查詢表示為受核心詞支配的結構化的數據格式,標記出搜索查詢中的核心詞和受其支配的其它語義論元,其形式化定義為:

p→{ProWord;SeUnit1,SeUnit2,…,SeUnitn}

其中p表示用戶輸入的搜索查詢,ProWord表示查詢中的核心詞,SeUniti表示需要標記的語義單元,n表示定義的語義單元的個數。

3.根據權利要求1所述的標記搜索語義角色的結構化查詢信息表達方法,其特征在于,引入主題模型:在判斷文本相關性時不僅考慮詞語共現的情況,而且考慮文本所表達的深層次語義,引入主題模型進行語義分析,主題模型中的主題表示為一組相同概念的泛化表述形式,用生成模型來闡述文本的生成過程:一篇文本包含若干的主題,每個主題以概率選擇若干詞匯,一篇文本的生成過程表示為:

q(詞匯|文本)=∑主題q(詞語|主題)*q(主題|文本)

主題模型的矩陣形式:其中等式左邊的矩陣表示每個文本中每個詞語的詞頻,即詞語出現的概率;等式右邊第一個矩陣表示每個主題中每個詞語的出現概率;等式右邊第二個矩陣表示每個文本中不同主題出現的概率,給定一系列文本,預先對文本進行前置處理,然后統計每個文本中單詞出現的頻率得到左邊的“文本-詞語”矩陣,主題模型是對左邊這個矩陣進行分解,學習出右邊兩個矩陣;

條件隨機域主題模型對文字隱含的主題建立模型,并從海量的文本中把表述同一語義主題的文本聚在一起,采用一種三層貝葉斯半監督概率模型識別查詢核心詞,核心詞對應于文本,核心詞的上下文信息對應文本中的詞匯,核心詞的類別對應主題。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海欣兆陽信息科技有限公司,未經上海欣兆陽信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011640600.6/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产精品人人爽人人做av片| 午夜码电影| 亚洲一区欧美| 国产99久久久国产精品免费看| 狠狠躁天天躁又黄又爽| 国产69精品久久久久777| 欧美福利三区| 狠狠色噜噜狠狠狠色综合| 午夜伦理片在线观看| 日韩精品一区二区免费| 中文字幕一区一区三区| 女女百合互慰av| 999亚洲国产精| 久久一区欧美| 亚洲欧美日韩国产综合精品二区| 精品一区二区在线视频| 91精品国产高清一区二区三区| 国产精欧美一区二区三区久久久| 亚洲激情中文字幕| 久久综合伊人77777麻豆最新章节| 国产精品视频久久久久| 国产一区二区麻豆| 国产欧美一区二区精品性色超碰| 国产精品乱综合在线| 91精品黄色| 国产剧情在线观看一区二区| 挺进警察美妇后菊| 欧美激情精品久久久久久免费 | 精品国产一区二区三区国产馆杂枝| 日韩不卡毛片| **毛片免费| 秋霞av电影网| 欧美日韩精品在线播放| 日本一区二区三区免费播放| 久久国产这里只有精品| 91婷婷精品国产综合久久| 国产欧美一区二区三区免费| 国产一区二区三区精品在线| 久久久精品a| 国产高清在线一区| 国产精品日韩一区二区三区| 国产精品综合一区二区| 毛片大全免费观看| 精品99在线视频| 欧美日韩一区二区三区精品| 午夜一级免费电影| 国产91麻豆视频| 欧美片一区二区| 国产在线一区观看| 国产一二区在线| 在线中文字幕一区| 亚洲四区在线| 九九精品久久| 午夜a电影| 91国产在线看| 996久久国产精品线观看| 亚洲网久久| 综合色婷婷一区二区亚洲欧美国产 | 国产一区二区三区午夜| 免费精品99久久国产综合精品应用| 香蕉久久国产| 中文字幕一区二区三区日韩精品| 免费超级乱淫视频播放| 99久久夜色精品| 欧美乱妇在线视频播放| 色就是色欧美亚洲| 国产精品女同一区二区免费站| 午夜毛片在线观看| 亚洲精品主播| 国产欧美日韩精品在线| 国产精品久久久久久久龚玥菲| 国产精品电影免费观看| 午夜码电影| 国产床戏无遮挡免费观看网站 | 欧美精品五区| 97久久精品人人做人人爽50路| 亚洲精品456| 神马久久av| 国产精品日韩电影| 国产亚洲精品久久午夜玫瑰园 | 国产精品69久久久| 国产91一区|