[發明專利]偏見最小化的自動概括在審
| 申請號: | 202010434049.3 | 申請日: | 2020-05-21 |
| 公開(公告)號: | CN111984781A | 公開(公告)日: | 2020-11-24 |
| 發明(設計)人: | M·A·巴黑得;K·德伊;N·馬達安;S·納加爾;S·梅赫塔 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F16/34 | 分類號: | G06F16/34 |
| 代理公司: | 中國貿促會專利商標事務所有限公司 11038 | 代理人: | 程晨 |
| 地址: | 美國*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 偏見 最小化 自動 概括 | ||
1.一種計算機實現的方法,包括:
由處理器接收記錄,其中,所述記錄包括一個或多個文本片段;
用指示符標記每個文本片段,其中,所述指示符表示每個相應的文本片段中的特定的偏見實例;
自動地生成所述記錄的概要,其中,所述記錄的概要包括文本片段的集合,并且其中,所述文本片段的集合具有與所述記錄不同的整體偏見;以及
向用戶顯示所述記錄的概要。
2.根據權利要求1所述的方法,其中,用指示符標記每個文本片段包括:
使用自然語言處理技術對所述一個或多個文本片段進行分析;以及
根據所述分析識別所述一個或多個文本片段中的每個文本片段內的關鍵文本觸發器,其中,所述關鍵文本觸發器是被識別為指示偏見的一個或多個單詞。
3.根據權利要求2所述的方法,其中,識別關鍵文本觸發器包括:
攝取訓練記錄的一個或多個語料庫,其中,所述訓練記錄包括參考的偏見實例;
根據所述訓練記錄的上下文確定所述訓練記錄中的每個訓練記錄的偏見程度;以及
將所述訓練記錄中的每個訓練記錄的偏見程度與相應的單詞相關聯。
4.根據權利要求3所述的方法,還包括:
確定所述一個或多個文本片段中的一個片段包括第一相應單詞;以及
基于所述第一相應單詞將所述偏見程度與所述一個片段相關聯。
5.根據權利要求1所述的方法,其中,生成所述記錄的概要包括:
識別要用于所述概要的設定的數量的文本片段;
針對能夠基于所述設定的數量生成的所述一個或多個文本片段的每種排列生成鏈,其中,所述鏈基于文本的指示符的每個片段;以及
選擇對所述整體偏見具有改變的第一鏈,其中,自動地確定對所述整體偏見的改變,以限制最初的整體偏見。
6.根據權利要求5所述的方法,其中,針對能夠基于所述設定的數量生成的所述一個或多個文本片段的每種排列生成鏈包括:
一次一個鏈接地為每個鏈生成鏈接,一直到所述設定的數量;
在包括新的鏈接之后對每個鏈進行分析;
在每個新的鏈接之后確定一個或多個鏈是否在偏見閾值以上;以及
排除所述一個或多個鏈中的在所述偏見閾值以上的每個鏈,不向該鏈添加新的鏈接,并且不認為該鏈是要用于所述概要的鏈。
7.根據權利要求5所述的方法,其中,選擇對所述整體偏見具有改變的第一鏈包括:
從針對所述一個或多個片段的每種排列的每個鏈中識別出每個鏈的相應的預測偏見;
排除具有在偏見閾值以上的相應的預測偏見的每個鏈;
排除具有在信息閾值以下的相應的預測偏見的每個鏈;以及
在排除具有在所述偏見閾值以上的相應的預測偏見的每個鏈并且排除具有在所述信息閾值以下的相應的預測偏見的每個鏈之后,對每個剩余的鏈進行排名,其中,所述第一鏈是排名在剩下的其他鏈中的每個鏈以上的鏈。
8.一種系統,包括:
存儲器;以及
與所述存儲器通信的處理器,所述處理器被配置為執行操作,所述操作包括:
接收記錄,其中,所述記錄包括一個或多個文本片段;
用指示符標記每個文本片段,其中,所述指示符表示每個相應的文本片段中的特定的偏見實例;
自動地生成所述記錄的概要,其中,所述記錄的概要包括文本片段的集合,并且其中,所述文本片段的集合具有與所述記錄不同的整體偏見;以及
向用戶顯示所述記錄的概要。
9.根據權利要求8所述的系統,其中,用指示符標記每個文本片段包括:
使用自然語言處理技術對所述一個或多個文本片段進行分析;以及
根據所述分析識別所述一個或多個文本片段中的每個文本片段內的關鍵文本觸發器,其中,所述關鍵文本觸發器是被識別為指示偏見的一個或多個單詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010434049.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于表面致動的扁平形換能器
- 下一篇:一種窗口、介質及光存儲方法





