[發明專利]一種基于可變分組的偏態分布最優參數估計方法有效

申請號：	202010525101.6	申請日：	2020-06-10
公開（公告）號：	CN111639443B	公開（公告）日：	2023-06-30
發明（設計）人：	張翼飛;山石	申請（專利權）人：	上海海事大學
主分類號：	G06F30/20	分類號：	G06F30/20
代理公司：	上海元好知識產權代理有限公司 31323	代理人：	張妍;周乃鑫
地址：	201306 上海市***	國省代碼：	上海;31
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種基于可變分組分布最優參數估計方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種基于可變分組的詞頻分布模型的最優參數估計方法，其特征在于，包括以下步驟：

S1、分別對詞頻分布模型定義域范圍內的每個待估計參數采用可變分組法將呈偏態分布的詞頻理論分布分成若干組；

S2、計算每個待估計參數針對詞頻理論分布可變分組后的統計量Z，并選擇數值最小的統計量所對應的待估計參數作為詞頻分布模型的最優參數估計值；

所述的詞頻分布模型為離散型詞頻分布模型或連續型詞頻分布模型；

所述的詞頻理論分布為離散型詞頻理論分布或連續型詞頻理論分布；

所述的可變分組法包括以下步驟：

S1.1、根據實際樣本情況選擇詞頻理論分布初始分組數n，則每個初始分組的概率為

S1.2、將較粗略的待估計參數代入詞頻理論分布函數中，并以∑_ip_i匹配詞頻理論分布函數，使得詞頻理論分布函數保留小數點后數字為與p_i相一致的精度；

S1.3、對∑_ip_i和匹配后的離散型詞頻理論分布函數F(k)在樣本觀察點k逐一進行比較；若∑_ip_i等于F(k)，則保留初始分組中的第i組并將其記為可變分組的第j組；若∑_ip_i小于F(k)，則舍去初始分組中的第i組；若∑_ip_i等于若干個不同樣本觀察點k時的理論值F(k)，則對該若干個樣本觀察點k進行合并，共同記為可變分組的第j組；

對∑_ip_i和匹配后的連續型詞頻理論分布函數F(x)在樣本觀察區間(x_a,x_b]逐一進行比較；若∑_ip_i等于F(x_ax≤x_b)，則保留初始分組中的第i組并將其記為可變分組的第j組；若∑_ip_i小于F(x_ax≤x_b)，則舍去初始分組中的第i組；若∑_ip_i等于若干個不同樣本觀察區間(x_a,b]的理論值F(x_ax≤x_b)，則對該若干個樣本觀察區間(x_a,x_b]進行合并，共同記為可變分組的第j組；

其中，j＝1,...,m，m為可變分組數；

S1.4、對可變分組中組數j重新按照自然數進行序號標記；

所述步驟S2中，統計量Z的計算公式為：

式中，j為可變分組的組數序號，m為總可變分組數，N為樣本容量，Np_j為第j組觀察值的期望值，N_j為樣本中屬于第j組的觀察值的個數。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于上海海事大學，未經上海海事大學許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010525101.6/1.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06F 電數字數據處理

免登錄下載普通用戶下載升級VIP會員，免費下載

[發明專利]一種基于可變分組的偏態分布最優參數估計方法有效

專利文獻下載