• 向量自我迴歸模型(英語:Vector Autoregression model,简称VAR模型)是一种常用的计量经济模型,由计量经济学家和宏观经济学家克里斯托弗·西姆斯(英語:Christopher Sims)提出。它擴充了只能使用一個變量的自我迴歸模型(簡稱:AR模型),使容納大於1個變量,因此經常用在多變量時間序列模型的分析上。...
    4 KB (1,012 words) - 06:00, 3 July 2025
  • 種自然資源產量等;對於受社會因素影響較大的經濟現象,不宜採用自我迴歸,而應改採可納入其他變數的向量迴歸模型向量迴归模型(VAR模型) 移动平均模型 (MA模型迴歸滑動平均模型(ARMA模型) 差分迴歸滑動平均模型(ARIMA模型) 格蘭傑因果關係(Granger Causality)...
    2 KB (392 words) - 21:19, 14 July 2025
  • 邏輯斯諦迴歸(英語:Logistic regression,又譯作邏輯斯迴歸、羅吉斯迴歸、邏輯迴歸、对数几率迴归),在统计学中是一種对数几率模型(英語:Logit model,又译作逻辑斯谛模型、评定模型、分类评定模型),是离散选择法模型之一,属于多元变量分析范畴,是社会学、生物统计学、临床、数量...
    9 KB (1,187 words) - 08:51, 15 November 2024
  • ARMA模型(英語:Autoregressive moving average model,全稱:自我迴歸滑動平均模型)。是研究时间序列的重要方法,由迴歸模型(简称AR模型)与移动平均模型(简称MA模型)为基础“混合”构成。在市场研究中常用于长期追踪资料的研究,如:Panel研究中,用于消费行为模...
    3 KB (593 words) - 10:24, 4 June 2025
  • 迴歸分析(英語:Regression Analysis)是一種統計學上分析數據的方法,目的在於了解兩個或多個變數間是否相關、相關方向與強度,並建立數學模型以便觀察特定變數來預測研究者感興趣的變數。更具体的来说,回归分析可以帮助人们了解在只有一个变量变化时因变量的变化量。一般来说,通过回归...
    9 KB (1,193 words) - 19:55, 8 June 2025
  • 在统计学中,线性回归(英語:linear regression)是利用称为线性回归方程的最小平方函數对一个或多个变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个变量的情况称为简单回归,大于一个变量情况的叫做多元回归(multivariable...
    21 KB (3,686 words) - 12:31, 5 July 2025
  • 机器学习概述 (category 2024年2月需要查證來源的維基百科條目)
    状态-动作-奖励-状态-动作 (SARSA) 时差学习 (TD) 学习动机 监督学习 平均单依赖估计器 (AODE) 人工神经网络 基于案例的推理 高斯过程回归 基因表达编程 数据处理组方法 (GMDH) 归纳逻辑编程 实例基于学习 懒惰学习 学习动机 学习向量量化 逻辑模型树 最小消息长度(决策树、决策图等) 最近邻算法...
    11 KB (1,351 words) - 03:42, 12 July 2025
  • 在机器学习中,支持向量机 (台湾称支援向量機,英語:support vector machine,常简称為SVM,又名支援向量网络)是在分类与迴歸分析中分析数据的監督式學習模型与相关的学习算法。给定一组训练实例,每个训练实例被标记为属于两个类别中的一个或另一个,SVM训练算法建立一个将新的实例分配...
    38 KB (6,189 words) - 01:27, 4 July 2025
  • 模型可以学习注意力权重,这些权重决定了对每个英语输入状态向量的关注程度。 在RNN模型中添加注意力机制能提高模型的性能。而Transformer架构的发展表明,注意力机制本身就足够强大,并且不需要像RNN模型一样再对数据进行顺序循环处理。Transformer模型采用了没有RNN模型...
    22 KB (2,969 words) - 07:09, 28 June 2025
  • 回归实验的第一个设计出现在1815年的 Gergonne 的论文中。 在二十世纪,多项式回归回归分析的发展中起着重要作用,更加强调设计和推理的问题。 回归分析的目标是根据变量(或变量向量)x 的值来模拟因变量 y 的期望值。在简单的线性回归中,使用模型 y = β 0 +...
    11 KB (1,742 words) - 11:14, 17 March 2023
  • 向量数据库(Vector database)、向量存储或向量搜索引擎是一种能够存储向量(固定长度的数值列表)及其他数据项的数据库。向量数据库通常实现一种或多种近似最近邻(Approximate Nearest Neighbor,ANN)算法,使用户可以使用查询向量搜索数据库,以检索最匹配的数据库记录。...
    5 KB (508 words) - 20:46, 29 March 2025
  • 格蘭傑因果關係 (category 迴歸分析)
    {\displaystyle y} 的原因。它的基礎是迴歸分析當中的迴歸模型迴歸分析通常只能得出不同 變量間的同期 相關性;迴歸模型只能得出同一 變量前後期 的相關性;但諾貝爾經濟學獎得主克萊夫·格蘭傑(Clive Granger)於1969年論證,在迴歸模型中透過一系列的檢定進而揭示不同變量之間的時間落差相關性是可行的。...
    14 KB (2,060 words) - 18:16, 25 June 2025
  • Scikit-learn(曾叫做scikits.learn与sklearn)是用于Python编程语言的自由并开源的机器学习库。它包含了各种分类、回归和聚类算法,包括多层感知器、支持向量机、随机森林、梯度提升、k-平均聚类和DBSCAN,它被设计协同于Python数值库NumPy和和科学库SciPy。 scikit-learn计划开始于scikits...
    6 KB (590 words) - 01:39, 4 September 2024
  • R n {\displaystyle \mathbf {x} \in \mathbb {R} ^{n}} 代表由一组相互独立的变量组成的向量,其泊松回归模型形式为: log ⁡ ( E ⁡ ( Y ∣ x ) ) = α + β ′ x , {\displaystyle \log(\operatorname...
    8 KB (1,533 words) - 10:49, 5 July 2025
  • 线性代数 (category 2012年1月需要专业人士关注的页面)
    消元法和矩阵分解的有效算法上。线性代数成为数字模拟和模型的基本工具。 线性代数起源于对二维和三维直角坐标系的研究。在这里,一个向量是一个有方向的线段,由长度和方向同时表示。这样向量可以用来表示物理量,比如力,也可以和标量做加法和乘法。这就是实数向量空间的第一个例子。 现代线性代数已经扩展到研究任意或无限维空间。一个维数为...
    21 KB (2,549 words) - 13:16, 5 July 2025
  • Lasso算法 (category 回归分析)
    回归分析方法,旨在增强统计模型的预测准确性和可解释性,最初由斯坦福大学统计学教授罗伯特·蒂布希拉尼于1996年基于Leo Breiman的非负参数推断(Nonnegative Garrote, NNG)提出。Lasso算法最初用于计算最小二乘法模型...
    22 KB (4,081 words) - 22:10, 30 November 2024
  • 大型语言模型(英語:large language model,LLM),也称大语言模型,是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用监督学习或半监督学习对大量未标记文本进行训练。大语言模型在2018年左右出现,并在各种任务中表现出色。...
    62 KB (6,352 words) - 03:45, 15 July 2025
  • 机器学习 (category 大型语言模型)
    在机器学习系统中,已经研究和应用了多种类型的模型。为特定任务选择最合适的模型的过程被称为模型选择(model selection)**。 具体的机器学习模型有: 构造间隔理论分布:聚类分析和模式识别 人工神经网络 决策树 感知器 支援向量機 集成学习AdaBoost 降维与度量学习 聚类 贝叶斯分类器 构造条件概率:回归分析和统计分类...
    24 KB (3,383 words) - 03:46, 12 July 2025
  • 横截面回归 曲线拟合 经验贝叶斯方法 逻辑斯蒂回归 M估计 非参数回归 多元适应回归样条 Lack-of-fit sum of squares 截断回归模型 删失回归模型 简单线性回归 分段线性回归 非线性最小二乘法 曲线拟合 广义线性模型 局部回归 RJOosterbaan,1994,频率和回归...
    8 KB (1,143 words) - 20:12, 8 March 2024
  • 模型中的标记一样对待。 在图像生成领域,著名的的Transformer架构包括:DALL-E、Parti、Phenaki和Muse。其中,DALL-E 不是扩散模型(这与后来别的图像生成模型不同),而是使用一个仅包含解码器的Transformer模型,通过回归...
    9 KB (1,147 words) - 02:42, 8 July 2025
  • 自由度 (统计学) (category 2015年12月需要专业人士关注的页面)
    {\displaystyle n-1} 。 统计模型的自由度等于可自由取值的变量的个数。如在回归方程中,如果共有 p {\displaystyle p} 个参数需要估计,则其中包括了 p − 1 {\displaystyle p-1} 个变量(与截距对应的变量是常量)。因此该回归方程的自由度为 p − 1 {\displaystyle...
    4 KB (622 words) - 04:43, 6 July 2025
  • analysis of covariance),普通线性回归,t检验和F检验。一般线性模型是对多于一个因变量的情况的多元线性回归的推广。如果Y,B和U是列向量,则上面的矩阵方程将表示多元线性回归。 使用一般线性模型的假设检验可以通过两种方式进行:多变量或多个独立的单变量(英语:Uni...
    4 KB (664 words) - 01:43, 8 January 2024
  • 偏最小二乘回归(英語:Partial least squares regression, PLS回归)是一种统计学方法,与主成分回归有关系,但不是寻找响应和独立变量之间最小方差的超平面,而是通过投影预测变量和观测变量到一个新空间来寻找一个线性回归模型。因为数据X和Y都会投影到新空间,PLS系列的方法...
    18 KB (2,455 words) - 02:48, 21 May 2025
  • 模型或计算模型,用于对函数进行估计或近似。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种适应系统(adaptive system),通俗地讲就是具备学习功能。现代神经网络是一种非线性统计性数据建模(概率模型...
    27 KB (3,855 words) - 00:53, 3 July 2025
  • 高斯-馬可夫定理(英語:Gauss-Markov Theorem),在統計學中陳述的是在线性回归模型中,如果线性模型满足高斯马尔可夫假定,则回归系数的“最佳线性无偏估计”(BLUE,英語:Best Linear unbiased estimator)就是普通最小二乘法估计。最佳估计是指相较于其他估计...
    7 KB (1,186 words) - 05:17, 23 September 2023
  • 人工智能术语表 (category 2025年5月未完成列表)
    监督学习——机器学习术语 支持向量机——用於監督統計學習的一套方法 符号人工智能 符號奠基問題 系统神经科学 技术奇点 时序差分学习——一類無模型強化學習方法 TensorFlow——機器學習軟件庫 理论计算机科学 计算理论——数学领域 时间复杂度——计算机科学概念 主题模型 迁移学习...
    10 KB (1,706 words) - 15:17, 14 July 2025
  • 基于转换器的生成式预训练模型(英語:generative pre-trained transformers,GPT)是一种大型语言模型(LLM),也是生成式人工智慧的重要框架。首个GPT由OpenAI于2018年推出。GPT模型是基于Transformer模型...
    52 KB (4,298 words) - 15:28, 24 June 2025
  • 虚拟变量 (category 迴歸變數選擇)
    模型同时包含男性和女性虚拟变量,则这些向量的总和是全一向量,因为每个观察都要么归为男性,要么归为女性。因此,这个总和等于常数项的回归量,即第一个向量。结果,即使使用典型的伪逆法,回归方程也无法求解。换句话说:如果全一向量(常数项)回归量和一组穷举的虚拟变量同时存在,则会出现完全多重共线性,回归...
    26 KB (3,625 words) - 10:00, 8 September 2024
  • 编码器(英語:autoencoder)也称自动编码器,是一种人工神经网络,用于学习无标签数据的有效编码;属一种无监督学习。 编码(autoencoding)的目的是:学习对高维度数据做低维度“表示”(“表征”或“编码”);因此, 通常用于降维。最近,编码的概念广泛地用于数据的生成模型...
    7 KB (1,003 words) - 18:14, 12 June 2025
  • 模型选择和训练:这一步涉及到从多种统计分类算法中选择合适的模型,并用训练数据来训练模型。训练数据是已经有类别标签的数据,用于让模型学习分类规则。常用地统计分类算法有逻辑回归、朴素贝叶斯、支持向量机、决策树、随机森林、神经网络等。 模型评估和优化:这一步涉及到用测试数据来评估模型...
    3 KB (508 words) - 10:41, 13 May 2024
  • Word2vec是一群用來產生詞向量的相關模型。這些模型為淺层雙層的神經網路,用來訓練以重新建構語言學之詞文本。網路以詞表現,並且需猜測相鄰位置的輸入詞,在word2vec中词袋模型假設下,詞的順序是不重要的。 訓練完成之後,word2vec模型可以把每個詞映射到一個向量,來表示詞与詞之間的關係。該向量為神經網路的隱藏層。...
    5 KB (464 words) - 08:18, 26 October 2022