线性预测编码(英語:LPC, Linear predictive coding)是主要用于音频信号处理与语音处理中,根据线性预测模型的信息用压缩形式表示数字语音信号谱包络(spectral envelope)的工具。它是有效的语音分析技术之一,也是低位速下编码方法高质量语音有用的方法之一,它能够提供非常精确的语音参数预测。...
6 KB (1,065 words) - 12:46, 14 September 2024
JPEG 2000(使用小波、量化、熵编码的图像压缩) TTA(使用线性预测编码,用于无损音频压缩) FLAC(用于无损音频压缩的线性预测编码) ATRAC(Adaptive Transform Acoustic Coding,自適應聽覺轉換編碼)為SONY公司於1992年所開發之音訊有損數據壓縮技術,也是相關技術名詞之總稱。...
11 KB (1,650 words) - 04:41, 12 October 2023
线性预测是根据已有采样点按照线性函数计算未来某一离散信号的数学方法。 在数字信号处理中,线性预测经常称为线性预测编码(LPC),因此也可以看作是数字滤波器的一部分。在系统分析中,线性预测可以看作是数学建模或者最优化的一部分。 最常见的表示是 x ^ ( n ) = − ∑ i = 1 p a i x...
4 KB (718 words) - 06:37, 11 September 2022
码激励线性预测(英語:Code-excited linear prediction,简称CELP)是一种語音編碼算法,最早由M. R. Schroeder(英语:Manfred R. Schroeder)和B. S. Atal(英语:Bishnu S. Atal)在1985年提出。在当时,它能提供...
4 KB (546 words) - 14:14, 3 December 2023
預測編碼的歷史相當之久。最早可以追溯到40年代提出的Delta編碼(Delta modulation),乃至於到今日我們都還可以常常在學術性期刊上看到線性預測編碼的論文。一個領域研究了五十多年還繼續有新的結果不斷的出現,一方面很少見,另一方面也足見有其重要性了。 預測編碼是屬於時間領域的編碼...
15 KB (3,040 words) - 09:02, 2 November 2023
regression)。 在线性迴归中,数据使用线性预测函数来建模,并且未知的模型参数也是通过数据来估计。这些模型被叫做线性模型。最常用的线性迴归建模是给定X值的y的条件均值是X的仿射函数。不太一般的情况,线性迴归模型可以是一个中位数或一些其他的给定X的条件下y的条件分布的分位数作为X的线性...
21 KB (3,686 words) - 10:14, 4 November 2024
Opus整合了兩種聲音編碼的技術:以語音編碼為導向的SILK和低延遲的CELT。Opus可以无缝调节高低比特率。在编码器内部它在较低比特率时使用线性预测编码在高比特率时候使用变换编码(在高低比特率交界处也使用两者结合的编码方式)。Opus具有非常低的演算法延遲(預設為22.5 ms),非常適合用於低延遲語音通話的編碼...
49 KB (4,543 words) - 11:23, 10 February 2025
LPC匯流排(Low Pin Count Bus),主要用於PC的Super I/O及電源管理,原理基於ISA匯流排。 LPC (程式語言) 線性預測編碼 《I Love You,You Are Perfect,Now Change》,簡稱LPC 加拿大自由黨(Liberal Party of Canada)...
393 bytes (48 words) - 08:24, 10 February 2019
of London)的Denes已经将语法概率加入语音识别中。 1960年代,人工神经网络被引入了语音识别。这一时代的两大突破是线性预测编码Linear Predictive Coding (LPC), 及动态时间规整Dynamic Time Warp技术。 语音识别技术的最重大突破是隐含马尔科夫模型Hidden...
26 KB (4,776 words) - 14:13, 5 January 2024
整流線性單位函数(Rectified Linear Unit, ReLU),又称修正线性单元,是一种人工神经网络中常用的激勵函数(activation function),通常指代以斜坡函数及其变种为代表的非线性函数。 比较常用的线性整流函数有斜坡函数 f ( x ) = max ( 0 , x )...
8 KB (1,022 words) - 16:19, 13 July 2022
Transformer架构 (section 编码器-解码器架构)
,它从编码器生成的编码中提取相关信息。这种机制也可以称为编码器-解码器注意力(encoder-decoder attention)。 与第一个编码器一样,第一个解码器也将输出序列的位置信息和嵌入作为其输入。因为模型不能使用当前或未来的输出来预测输出,因此必须对输出序列进行部分屏蔽以防止这种反向信息流...
22 KB (2,950 words) - 04:58, 26 April 2025
这些模型能够更灵活地拟合和预测现实中复杂的数据关系。 多元线性回归(Multivariate Linear Regression)是在传统线性回归的基础上扩展而来的,用于同时处理多个因变量(输出变量)的情况。这种方法通过拟合一个多维线性模型,来估计一组输入变量与多个输出变量之间的关系。 多元线性回归特别适用于以下场景:...
24 KB (3,381 words) - 06:00, 12 April 2025
高效率視訊編碼(HEVC)中的幀內編碼(英語:Intra Coding,又稱畫面內編碼)可以視為高階視訊編碼(Advanced Video Coding,H.264/AVC)的擴展,因為他們都是利用空間上的取樣預測來編碼,而高效率視訊編碼的幀內編碼包含以下基本元素: 基於四元樹(Quadtree)編碼結構...
9 KB (1,446 words) - 10:51, 24 April 2024
1978年,德州仪器介绍了第一款单芯片线性预测编码语音合成器。在1976年,德州仪器即开始了一个存储强度应用方面的研究,很快他们开始聚焦于语音方面的应用。这个研究的结果就是TMC0280型单芯片线性预测编码(Linear predictive coding...
26 KB (2,969 words) - 00:43, 11 March 2025
许可证)——作为WebRTC开源项目的一部分。它适合用于VoIP应用程序、流媒体音频,以及文档和消息通信。该算法是一个线性预测编码的独立块版本,选择了长度20、30毫秒的数据帧。编码的块必须封装在一个合适的传输协议中,通常是实时传输协议(RTP)。 iLBC能以良好的语音质量处理丢帧。丢帧通常因连接...
8 KB (670 words) - 06:58, 16 February 2021
Speak & Spell是德州仪器生产的一系列手持式电子儿童计算机(英语:Educational toy),它包含一个TMC0280线性预测编码语音合成器、一个键盘以及插槽。这款玩具聲稱可以帮助7岁以上儿童学习拼写和发音。 第一款 Speak & Spell于1978年6月在夏季消費電子展上推出。2009年,Speak...
3 KB (259 words) - 21:45, 11 February 2025
卡尔曼滤波 (category 线性滤波器)
函数f可以用来从过去的估计值中计算预测的状态,相似的,函数h可以用来以预测的状态计算预测的测量值。然而f和h不能直接的应用在协方差中,取而代之的是计算偏导矩阵(Jacobian)。 在每一步中使用当前的估计状态计算Jacobian矩阵,这幾個矩阵可以用在卡尔曼滤波器的方程中。这个过程,实质上将非线性的函数在当前估计值处线性化了。...
35 KB (6,974 words) - 00:38, 4 February 2025
kbit/s的比特率。它也可以使用一个25ms的低延迟(英语:Latency (audio))算法(20ms帧大小+5ms预留)。参考实现采用C语言编写。该编解码器的技术基于线性预测编码(LPC)。 SILK有二进制SDK提供。 SILK编解码器拥有专利,并且SILK SDK有独立的许可协议。该编解码器是一个开源的免费软件,可以有限定的買斷式授權用于使用和分发。...
12 KB (1,036 words) - 18:00, 6 March 2021
编码器将标记表示转化为图像。Parti 是一个既有编码器又有解码器的Transformer模型,编码器处理文本提示,解码器生成图像的标记表示。Muse 是一个仅包含编码器的Transformer,训练目标是从未遮掩的图像标记中预测...
9 KB (1,147 words) - 16:13, 20 March 2025
剪接方式并不是唯一的(参看替代剪接),所以外显子只能在成体mRNA中被看出。即使是使用生物信息学方法,要精确预测外显子的位置也是非常困难的。 真核生物的基因,其线性表达被内含子阻断,这就是所谓的断裂基因(split gene),该现象的发现者理察·羅伯茨(Richard J. Roberts)和菲利普·夏普(Phillip...
2 KB (230 words) - 10:51, 8 July 2024
wij 连接到下一层的每个节点。 MLP 在感知器中进行学习,通过每次处理数据后改变连接权重,降低输出与预测结果的误差量。这是有监督学习的一个例子,通过反向传播来实现,反向传播是线性感知器中最小均方算法的推广。 我们可以将输出节点 j 的第 n 个数据点的误差表示为 e j ( n ) = d...
7 KB (1,285 words) - 15:03, 5 May 2025
於初始時将图片划分为编码树单元,可以為64×64、32×32或16×16,而像素块尺寸提升通常会提高時编码的效率。 規範指定HEVC以 4×4、8×8、16×16 和 32×32 四个变换单元 (transform units) 大小来对预测残差进行编码,編碼樹單元可以递归地劃分超過四個变换单元。...
81 KB (7,184 words) - 20:17, 3 January 2025
线性判别分析(英語:Linear discriminant analysis,縮寫:LDA)是对费舍尔的线性鉴别方法的归纳,这种方法使用统计学,模式识别和机器学习方法,试图找到两类物体或事件的特征的一个线性组合,以能够特征化或区分它们。所得的组合可用来作为一个线性分类器,或者,更常见的是,为后续的分类做降维处理。...
26 KB (4,104 words) - 16:24, 18 January 2025
21世纪10年代的一些最强大的人工智能在深度神经网络中采用了自编码器。 最简单的自编码器形式是一个前馈的、非循环的神经网络,用一层或多层隐藏层链接输入和输出。输出层节点数和输入层一致。其目的是重构输入(最小化输入和输出之间的差异),而不是在给定输入的情况下预测目标值,所以自编码器属于无监督学习。 最简单的自编码...
7 KB (1,073 words) - 12:10, 9 January 2025
classifier)线性分类器。SVM模型是将实例表示为空间中的点,这样映射就使得单独类别的实例被尽可能宽的明显的间隔分开。然后,将新的实例映射到同一空间,并基于它们落在间隔的哪一侧来预测所属类别。 除了进行线性分类之外,SVM还可以使用所谓的核技巧(英语:kernel...
38 KB (6,189 words) - 16:09, 3 February 2025
稱為共振峰聲碼器;利用同態濾波技術,如對話音信號進行積分變換、取對數和反變換以獲得各參數的,稱為同態聲碼器;直接編碼和傳輸話音的基帶(如取200~600赫的頻帶)展現聲源特性的,稱為聲激勵聲碼器。此外,還有相位聲碼器、線性預測聲碼器(線性預測編碼)等。 Homer Dudley. Signal Transmission US Patent...
4 KB (700 words) - 06:30, 5 March 2023
線性預測聲碼器都是典型的參數編碼。 混合編碼:混合編碼採用參數編碼和波形編碼的混合編碼形式。該類演算法的共同特魚點是:先進行線性預測分析,去掉語音信號的短時相關性,然後利用合成分析法及感覺加權均方誤差最小原則分析出合適的替代冗餘訊號的最佳激勵源,最後對LP參數和激勵訊號源進行編碼...
14 KB (2,565 words) - 01:19, 3 November 2023
G.723是1996年ITU制定的語音編碼,是雙速率語音編碼,有5.3kbps和6.3kbps兩種模式,分別採用代數碼激勵線性預測(ACELP)和多脈衝最大似能量化(MP-MLQ)。目前G.723是H.323的功能之一。 ITU-T page of G.723(页面存档备份,存于互联网档案馆) G.723...
809 bytes (79 words) - 09:46, 7 August 2022
(ML)、多數決原則(MV)和最大后验概率(MAP)。 在语音识别中使用音频特征、基于音频启发系数构建自动识别目标的系统已被完成。这些系数包括 线性预测编码(Linear predictive coding,LPC)系数 倒頻譜(Cepstral linear predictive coding,LPCC)系数...
7 KB (1,000 words) - 10:05, 9 February 2022
线谱对(LSP)或线谱频率(LSF)用于表示在信道上传输的线性预测系数(LPC)。LSP具有一些特性,如对量化噪声的敏感度较小,优于LPC的直接量化。因此,LSP在语音编码中非常有用。 LSP表示法是日本电信电话的板倉文忠于1975年发明的。1975年到1981年,他研究了基于LSP的语音分析与合...
9 KB (1,678 words) - 05:46, 11 March 2024
预测,并将通信和沟通方面的概念应用到现实中。 大多数传播过程模型都或多或少的受到批评,批评者认为传播过程模型“太过简单”、遗漏了真正通信或信息传播过程中比较重要的内容。通信模型整体通常采用图表的形式,大多数模型都有一些组件和流程高度相似,例如发送者以讯息的形式编码...
64 KB (5,875 words) - 07:14, 9 March 2025