[發明專利]調研樣本判斷方法及系統、灰名單生成方法及系統在審
| 申請號: | 201611089799.1 | 申請日: | 2016-11-30 |
| 公開(公告)號: | CN106649268A | 公開(公告)日: | 2017-05-10 |
| 發明(設計)人: | 劉姍 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 北京律智知識產權代理有限公司11438 | 代理人: | 闞梓瑄,王衛忠 |
| 地址: | 100195 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 調研 樣本 判斷 方法 系統 名單 生成 | ||
技術領域
本公開涉及數據處理技術領域,具體而言,涉及一種調研樣本判斷方法、調研樣本判斷系統、灰名單生成方法以及灰名單生成系統。
背景技術
隨著移動互聯網的普及,大數據在產品的發展中扮演著越來越重要的角色。通過選定目標人群并提前利用在線調研的方式進行產品調研,這對提高產品的各方面價值起到了非常大的作用。在線調研目前被頻繁地利用在新產品定位(推出新產品,進入新市場)、品牌曝光(提升銷量與復購率)、市場洞悉(洞悉市場先機、了解消費傾向、購物行為與態度)、滿意度反饋(獲取售后反饋,提升用戶滿意度)等方面。
在大數據時代,如何在繁多的樣本中尋找到有價值的樣本數據對提高調研質量尤為重要。目前,為了提高調研問卷的回收率和吸引力,發布調查問卷的平臺通常會給予問卷答題者一定的獎勵(如,現金獎勵、平臺優惠券、各種平臺的電子現金獎勵等)。然而,在線調研對問卷答題者僅設置有較小的安全防御,當遇到較大獎勵的問卷時,黃牛答題者會頻繁且低質量地回答問卷,這將導致發布調查問卷的平臺無法按預期回收有效的答題樣本,另外,也可能會使用戶喪失對發布調查問卷的平臺的信任感。
目前,通常以在調研問卷中加入陷阱題的方式解決調研樣本質量低的問題。陷阱題可以為常識題目,當問卷答題者答錯時,問卷答題者所作出的答題樣本將被視為無效樣本,并且不會發放問卷獎勵。然而,這種加入陷阱題的方式形式單一,并且具有一定的規律性,容易被黃牛答題者識別,這導致有效樣本的問卷答題者不能按預期獲得應有的獎勵。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本公開的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
本公開的目的在于提供一種調研樣本判斷方法及系統、灰名單生成方法及系統,進而至少在一定程度上克服由于相關技術的限制和缺陷而導致的一個或者多個問題。
根據本公開的一個方面,提供一種調研樣本判斷方法,包括:
接收一調研樣本,并對所述調研樣本中的每個題目的解答內容進行分詞處理;
對所述分詞處理得到的詞語進行情感傾向分析,并根據所述情感傾向分析的結果標注具有情感傾向的詞語,以得到標注詞語;
根據各所述題目的解答內容包含的所述標注詞語確定每個所述題目的解答內容的情感傾向值;
配置每個所述題目的加權系數,根據每個所述題目的加權系數以及對應的解答內容的情感傾向值獲得所述調研樣本的情感傾向值;以及
判斷所述調研樣本的情感傾向值是否為一預設值,在所述調研樣本的情感傾向值為所述預設值的情況下,所述調研樣本為無效樣本。
在本公開的一種示例性實施例中,所述根據各所述題目的解答內容包含的所述標注詞語確定每個所述題目的解答內容的情感傾向值包括:
對每個所述題目的解答內容進行分段處理以及分句處理;
判斷所述分段處理得到的段落的首尾句是否包含所述標注詞語;
在判斷出所述分段處理得到的段落的首尾句包含所述標注詞語時,結合所述首尾句包含的所述標注詞語確定所述段落的情感傾向值,以計算出每個所述題目的解答內容的情感傾向值;
在判斷出所述分段處理得到的段落的首尾句不包含所述標注詞語時,獲取所述段落中所有句包含的所述標注詞語,并根據所有句包含的所述標注詞語確定所述段落的情感傾向值,以計算出每個所述題目的解答內容的情感傾向值。
在本公開的一種示例性實施例中,根據所有句包含的所述標注詞語確定所述段落的情感傾向值包括:
判斷每一句的句式,所述句式的結構包括轉折結構和/或遞進結構;
在判斷出句子的句式為所述轉折結構時,結合所述轉折結構中的轉折部分的所述標注詞語確定所述句子的情感傾向值;
在判斷出句子的句式為遞進結構時,根據所述該句子中所有的所述標注詞語確定所述該句子的情感傾向值。
根據本公開的一個方面,提供一種灰名單生成方法,包括:
根據上述任意一項所述的調研樣本判斷方法獲取無效樣本;
將所述無效樣本的答題者的客戶端IP以及答題時間保存至一存儲元件;
獲取一指定時間內所述存儲元件記錄的各無效樣本的數據;
判斷各所述無效樣本的數據是否滿足一預設無效樣本灰名單判斷規則;以及
在判斷出一所述無效樣本的數據滿足所述預設無效樣本灰名單判斷規則的情況下,建立包括所述該無效樣本的答題者的客戶端IP的無效樣本灰名單。
在本公開的一種示例性實施例中,還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611089799.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種通過文本主題挖掘推測用戶大五人格的方法及系統
- 下一篇:椅子





