在统计学中,估计量的偏差(或偏差函数)是此估计量的期望值与估计参数的真值之差。偏差为零的估计量或决策规则称为无偏的。否则该估计量是有偏的。在统计中,“偏差”是一个函数的客观陈述。 偏差也可以相对于中位數来衡量,而非相对于均值(期望值),在这种情况下为了与通常的“均值”无偏性区别,称作“中值”无偏。偏差...
10 KB (1,777 words) - 15:14, 11 March 2023
在统计学中,偏差(英語:bias)是指会导致结果与事实之间存在差异的系统性倾向。数据分析的许多过程,包括数据的来源、选择的估计量和分析数据的方式,都可能存在偏差。例如: 有偏采样是对总样本集非平等采样。有偏采样会难以分析或引起不准确甚至错误的推断。 有偏估计则是指高估或低估要估计的量。有偏估计在某些情况下也有一些好的特性,例如较小的方差。...
1 KB (133 words) - 03:37, 14 January 2023
在统计学中,估計量(Estimator),亦稱推定量,是基于观测数据计算一个已知量的估计值的法则:于是估计量(estimator)、被估量(estimand)和估计值(estimate)是有区别的。 估计量用来估计未知总体的母數,它有时也被称为估计子;一次估计是指把这个函数应用在一组已知的数据集上,求函数的...
10 KB (671 words) - 10:16, 11 July 2023
估計糖果罐內糖果數量時,若可以看到其中的一半,那總數量就可以估計為看到個數的二倍,若看到的是100顆糖果,其估計值可能會是200顆,這種估計方式最接近實際值的單一數值,稱為点估计。不過点估计不準的機率較高,以此例來說,若糖果不是均勻分佈,略有偏差,估計值就可能不準。另外一種作法是區間估計...
6 KB (919 words) - 07:25, 1 September 2024
在统计学中,点估計(英語:point estimation)是指以样本数据来估计总体母數, 估计结果使用一个点的数值表示“最佳估计值”,因此称为点估计。由样本数据估计总体分布所含未知参数的真實值,所得到的值,称为估计值。 点估计可以与区间估计形成对比:这种区间估计通常是在频率论推断的情况下的置信区间 ,或在贝叶斯推断的情况下的可信区间...
5 KB (584 words) - 20:57, 8 February 2024
均方根误差 (category 统计偏差和离散度)
均方根偏差是常用於衡量模型预测值或估计量(样本值或总体值)与观测值之间差异的一种指标。均方根偏差代表預測值和觀察值之差的二阶样本矩的平方根(樣本標準差),或該差值的平方平均数。當這些离差是以用來計算估計量的數據樣本本身來計算時,通常稱差值為殘差(residual);當差值不基於樣本得出的估計量時,通常稱為误差(error)或預測誤差(prediction...
10 KB (1,432 words) - 07:54, 11 May 2025
均方误差 (category 估计理论)
error,MSE)或均方误差,又称均方偏差(mean-square deviation,MSD)、均方差,是预测值或估计值与真实值的差异平方的均值。均方误差越小说明模型的预测或者参数的估计精度越准确。 对于无法观察的参数 θ {\displaystyle \theta } 的一个估计函数T;其定义为: MSE...
4 KB (603 words) - 08:00, 11 May 2025
在统计学中,抽樣誤差指的是抽樣時造成的偏差。由於樣本不可能包含母體的所有成員,因此樣本的估计量通常與整體的母數不同,所以估计量與母數之間會存在差異,這種差異就是抽樣誤差。例如如果對一百萬人口中的一千個個體的身高進行測量,這一千個人的平均身高通常與該國所有一百萬人的平均身高不同。 Sarndal, Swenson...
725 bytes (92 words) - 05:46, 17 August 2023
的变异度来推估计总体的变异度。 在概率統計中,标准差最常作為评估一組數值的離散程度之用。標準偏差(标准差)的操作型定義为: 一群数值与其算术平均数之差异的平方,再取算术平均数,此时得变异数(variance,σ2,s2)又称方差,最后取二次方根;即“方差開算术平方根”。 标准差可反映组内個體間的...
15 KB (2,348 words) - 08:11, 11 May 2025
岭回归 (category 未列明參考文獻頁碼的條目)
的模型中。一般来说,该方法提高了参数估计问题的效率,以换取可容忍的偏差量(参见偏差-方差权衡)。 该理论最初由Hoerl和Kennard于1970年在他们发表在《Technometrics》上的论文《RIDGE回归:非正交问题的偏差估计》(英語:RIDGE regressions:...
5 KB (523 words) - 19:17, 9 December 2024
误差 (category 统计偏差和离散度)
的概念,二者均是统计样本中某一元素的观测值(英语:observed value)与其“真值”(未必可直接观测得到)之间的离差的度量。观察的误差是观测值与相关量(例如总体平均值)的真值之间的差值。残差是观测值与统计量的估计值(例如样本均值)之间的...
7 KB (971 words) - 01:43, 27 August 2023
离差 (category 统计偏差和离散度)
的一个观测值与某个特定的参照值(通常是该变量的平均值,此时称为离均差或距平)之间差异的度量。离差的正负表示差异的方向(观测值超过参照值时偏差为正),绝对值的大小表示差异的大小。 观测值与关注量的真值(期望值,例如总体平均值)之间的离差称为误差(error)。 观测值与真值的估计...
3 KB (484 words) - 17:28, 16 October 2022
拉普拉斯分布 (category 使用过时图像语法的页面)
{1}{N}}\sum _{i=1}^{N}\left\vert x_{i}-{\hat {\mu }}\right\vert } (揭示了拉普拉斯分布和最小绝对偏差(LAD)之间的联系)。 在回归分析中,如果误差具有拉普拉斯分布,则最小绝对偏差估计(LADE)将作为最大似然估计(MLE)出现。...
5 KB (665 words) - 05:44, 1 February 2021
mean-square error,缩写MMSE)估計是一种使均方误差(MSE)最小化的估计函数,其通常被称为最优估计。 贝叶斯估计量(英语:Bayesian estimator) 均方误差 最小二乘法 最小方差無偏估計 正交性原理(英语:Orthogonality principle)...
830 bytes (90 words) - 14:36, 22 July 2022
V-统计量是von Mises统计量的简称,以奥地利数学家Richard von Mises命名,其在统计学的估计理论中出现。 V-统计量与U-统计量形式相似,且统计性质上有紧密联系。每个V-统计量对应一个U-统计量,很多情况下,V-统计量的渐近分布,只是相应的U-统计量的渐近分布经过一些修饰的版本。...
2 KB (349 words) - 02:08, 5 November 2023
拉奥-布莱克韦尔定理 (category 估计理论)
称为“原始估计量” ,将 δ1(X)称为“改进后的估计量” 。重要的是改进后的估计器是可观察的,即它不依赖于θ。通常,在给定这些数据的另一个函数的情况下,这些数据的一个函数的条件期望值确实取决于θ,但上面给出的充分性的定义本身就意味着这个不成立。 一个估计量的均方误差是它与待估计的参数θ的偏差的平方的期望值。...
13 KB (2,432 words) - 01:21, 18 February 2024
U-统计量是统计学中一类特定的、具有对称性的统计量,它在估计理论中扮演重要角色。名称中的“ U”为无偏(unbiased)之意。在初等统计学中,U-统计量与最小方差无偏估计量 (UMVUE) 有密切联系。 U-统计量的一个重要性是,对概率分布来说,其可估计参数的最小方差无偏估计量 是一个U-统计量。...
10 KB (1,926 words) - 00:29, 17 December 2024
估計量的基礎。此外,polytomous Rasch mode(英语:polytomous Rasch model)能檢驗反應出態度或特質的增加程度的句子的假說。例如,模型的應用往往表明了中立的類別並非表示為介於同意或不同意類別之間的態度或特性。 此外,並非所有李克特量化選項的集合都能使用Rasch...
9 KB (1,378 words) - 07:41, 12 February 2025
标准误差 (category 统计偏差和离散度)
量的估计。在这些情况下,需要清楚业已完成的和尝试去解决的标准误差仅仅可能是一个估量。然而,这通行上不太可能:人们可能往往采取更好的估量方法,而避免使用标准误,例如采用最大似然或更形式化的方法去测定信賴區間。第一个众所周知的...
8 KB (1,252 words) - 18:13, 4 February 2025
\sigma _{Y}^{2}} 给出的是总体方差的有偏估计量,偏差为 n − 1 n {\displaystyle {\frac {n-1}{n}}} 。因此, σ Y 2 {\displaystyle \sigma _{Y}^{2}} 称为有偏样本方差。 将偏差纠正后,可得到无偏样本方差,记为 s...
19 KB (3,561 words) - 08:13, 8 April 2025
控制变量法 (category 含有英語的條目)
控制变量法(英語:control variates)是在蒙特卡洛方法中用于减少方差的一种技术方法。该方法通过对已知量的了解来减少对未知量估计的误差。 假设要估计的参数为 μ {\displaystyle \mu } 。同时对于统计 m {\displaystyle m} ,其期望值为 μ {\displaystyle...
4 KB (648 words) - 00:57, 11 April 2018
刀切法 (category 含有英語的條目)
统计学中,刀切法(英語:jackknife)是一种重抽样方法,常用于对统计量的方差和偏差的估计。样本的刀切法估计量是指将样本去除每个元素后重新计算估计量,再将这些估计量取平均值。刀切法是自助法的一个线性近似。“刀切法”的名字由美国数学家约翰·图基提出,意在说明本方法像便携式小刀一样简单但实用,可解决多种统计问题。...
977 bytes (113 words) - 10:18, 8 January 2024
腎絲球濾過率 (category 包含医学声明的条目)
估計導致了低估肌酸酐清除率,因而提供了GFR較低的偏差估計值 不過目前GFR及CCr。已經可以精確地由在血液和尿液的物質比較測量而計算出,或則只用驗血結果(檢驗兩個參數eGFR(估計腎小球濾過率)及eCCr(估計肌酸酐清除率))的公式估算。 這些檢驗的結果在評估腎臟的排泄功能機制是相當重要的...
43 KB (6,543 words) - 16:06, 29 October 2024
是相互关联的,相关的分布(称为联合)适用于这些数量的总和。 当标准不确定度通过对输入量的估计值的多次重复观察计算出,则为A类评定。其他对标准不确定度的评估方法为B 类标准不确定度。B类评定的信息来源包括: 以前的测量数据; 对有关技术材料和测量仪器特性的经验或了解; 生产厂提供的技术说明书; 校准证书或其他证书提供的数据;...
16 KB (2,011 words) - 05:09, 20 March 2025
卡尔曼滤波 (category 估计理论)
filter)是一种高效率的递归滤波器(自回归滤波器),它能够从一系列的不完全及包含雜訊的测量中,估计动态系统的状态。卡尔曼滤波會根據各測量量在不同時間下的值,考慮各時間下的联合分布,再產生對未知變數的估計,因此會比只以單一測量量為基礎的估計方式要準。卡尔曼濾波得名自主要貢獻者之一的鲁道夫·卡尔曼。...
35 KB (6,999 words) - 00:38, 4 February 2025
在统计学中,最大似然估计(英語:maximum likelihood estimation,簡作MLE),也称极大似然估计,是用来估計一个概率模型的参数的一种方法。 下方的讨论要求读者熟悉概率论中的基本定义,如概率分布、概率密度函数、随机变量、数学期望等。读者還須先熟悉连续实函数的基本性质,比如使用微分来求一个函数的极值(即极大值或极小值)。...
15 KB (3,375 words) - 16:26, 22 April 2024
统计学 (category 含有访问日期但无网址的引用的页面)
的推論。這個推論可能以對/錯問題的答案所呈現(假設檢定),對於數字特徵量的估計(估計),對於未來觀察的預測,關聯性的預測(相關性),或是將關係模型化(迴歸)。其他的模型化技術包括變異數分析,時間序列,以及数据挖掘。 相關的觀念特別值得被拿出來討論。對於資料集合的統計分析可能顯示兩個變數(母群體中的...
25 KB (3,819 words) - 09:49, 30 March 2025
估计理论是统计学和信号处理中的一个分支,主要是通过测量或经验数据来估计概率分布参数的数值。这些参数描述了实质情况或实际对象,它们能够回答估计函数提出的问题。 例如,估计投票人总体中,给特定候选人投票的人的比例。这个比例是一个不可观测的参数,因为投票人总体很大;估计值建立在投票者的一个小的随机采样上。...
11 KB (2,244 words) - 17:38, 2 March 2023
集中趋势 (category 多變量統計)
的中間值。最常見的幾種集中趨勢包括算數平均數、中位數及眾數。集中趨勢可以由有限的數組(如一群樣本)中或理論上的機率分配(如常態分佈)中求得。有些人使用集中趨勢(或集中性)這個詞以表示「數量化的資料之中央值的趨勢」。在這種意義下,我們可以利用資数据的離散程度(例如標準偏差或四分差等相似的統計量)判別其集中趨勢的程度。...
5 KB (859 words) - 22:58, 16 April 2023
平均意见分数 (section 用于语音和音频质量估计的 MOS)
量表的语言。 然而,研究表明无法证明量表翻译对所得结果存在显著影响。 通常获取 MOS 分数的测试方法中还存在另外几个偏差。 除了上面提到的非线性感知的量表问题之外,还有一个所谓的“范围均衡偏差”:在主观实验过程中,受试者倾向于给出的分数横跨整个评分量表。如果两个主观测试提供的...
9 KB (1,346 words) - 12:37, 31 January 2022
廣義線性模型 (category 含有过时参数的引用的页面)
model,缩写作 GLM)是一種應用灵活的線性迴歸模型。该模型允许因变量的偏差分布有除了正态分布之外的其它分布。此模型假設實驗者所量測的隨機變數的分佈函數與實驗中系統性效應(即非隨機的效應)可經由一鏈結函數(link function)建立可解釋其相關性的函數。 約翰·內爾德(英语:John...
10 KB (1,430 words) - 01:34, 8 February 2024