因为所收到的码字都是预先约定好的码字(许用码)。即再加一位重复码元,这样两个码字之间的差别有两位。增加的重复码元称为监督码元。如果将接通编为“111”,断开编为“000”,即有两位重复监督码元。条件概率按式(4-1)计算式中 CL——许用码字;ri——接收码字的第i位元素;CLi——许用码字CL的第i位元素。......
2025-09-29
如果把输出必须和输入相等的限制放松,同时利用线性代数中基的概念,即O=a1Ф1+a2Ф2+…+anФn,Фi是基,ai是系数,可以得到这样一个优化问题:
Min|I-O|
其中,I表示输入,O表示输出。
通过求解这个最优化式子,我们可以求得系数ai和基Фi,这些系数和基就是输入的另外一种近似表达。
因此,它们可以用来表达输入I,这个过程也是自动学习得到的。如果在上述式子上加上L1的Regularity限制,得到:
Min|I-O|+u(|a1|+|a2|+…+|an|)
这种方法被称为稀疏编码(sparse coding)。通俗地说,就是将一个信号表示为一组基的线性组合,而且要求只需要较少的几个基就可以将信号表示出来。“稀疏性”定义为:只有很少的几个非零元素或只有很少的几个远大于零的元素。要求系数ai是稀疏的意思就是说,对于一组输入向量,只想有尽可能少的几个系数远大于零。选择使用具有稀疏性的分量来表示输入数据是有原因的,因为绝大多数的感官数据,比如自然图像,可以被表示成少量基本元素的叠加,在图像中这些基本元素可以是面或者线。同时,比如与初级视觉皮层的类比过程也因此得到了提升,人脑有大量的神经元,但对于某些图像或者边缘只有很少的神经元兴奋,其他都处于抑制状态。
稀疏编码算法是一种无监督学习方法,它用来寻找一组“超完备”基向量来更高效地表示样本数据。虽然形如主成分分析(principal component analysis,PCA)技术能方便地找到一组“完备”基向量,但是这里想要做的是找到一组“超完备”基向量来表示输入向量,基向量的个数比输入向量的维数要大。超完备基的好处是它们能更有效地找出隐含在输入数据内部的结构与模式。然而,对于超完备基来说,系数ai不再由输入向量唯一确定。因此,在稀疏编码算法中,另加了一个评判标准“稀疏性”来解决因超完备而导致的退化(degeneracy)问题。
比如在图像特征提取的最底层要做边缘检测器的生成,那么这里的工作就是从原始图片中随机选取一些小块,通过这些小块生成能够描述他们的“基”,如图7-2右边的8×8=64个主成分组成的主成分,然后给定一个测试小块,可以按照上面的式子通过主成分的线性组合得到,而稀疏矩阵就是a,a中有64个维度,其中非零项只有3个,故称“稀疏”。(https://www.chuimin.cn)
把底层作为边缘检测器,不同方向的边缘能够描述出整幅图像,所以不同方向的边缘自然就是图像的主成分了,而上上层又是上一层的组合主成分。
稀疏编码分为两个部分。
1)训练阶段:给定一系列的样本图片[x1,x2,…],需要学习得到一组基[Ф1,Ф2,…],也就是字典。
稀疏编码是k-means算法的变体,其训练过程也差不多,最大期望(expectation maximization,EM)算法的思想:如果要优化的目标函数包含两个变量,如L(W,B),那么可以先固定W,调整B使得L最小,然后再固定B,调整W使L最小,这样迭代交替,不断将L推向最小值。训练过程就是一个重复迭代的过程,按上面所说,交替的更改a和Ф使得下面这个目标函数最小。
每次迭代分两步:
①固定字典Ф[k],然后调整a[k],使得上式,即目标函数最小,即解最小绝对收缩和选择算法(least absolute shrinkage and selection operator,LASSO)问题。
②固定住a[k],调整Ф[k],使得上式即目标函数最小,即解凸二次规划(quadratic programming,QP)问题。
不断迭代,直至收敛。这样就可以得到一组可以良好表示这一系列x的基,也就是字典。
2)编码阶段:给定一个新的图片x,由上面得到的字典,通过解一个LASSO问题得到稀疏向量a。这个稀疏向量就是这个输入向量x的一个稀疏表达。
相关文章
因为所收到的码字都是预先约定好的码字(许用码)。即再加一位重复码元,这样两个码字之间的差别有两位。增加的重复码元称为监督码元。如果将接通编为“111”,断开编为“000”,即有两位重复监督码元。条件概率按式(4-1)计算式中 CL——许用码字;ri——接收码字的第i位元素;CLi——许用码字CL的第i位元素。......
2025-09-29
假设离散无记忆信源输出有限个符号xi,i=1,2,…离散信源编码就是对每个符号用一定长度的代码来表示。在信息论中已经证明,每个符号的二进制代码平均长度最短不应小于信源的熵。设信源共有L种符号,则需要的编码长度N 由log2L决定。当符号等概出现,但L不为2的整数次幂时,信源的平均信息量H与编码长度N 之间最多相差1bit。为了提高编码效率,对符号出现概率不相等的信源采用不等长编码。......
2025-09-29
为寻找更为理想的基窗函数,借助LMS算法思想提出了“基于LMS准则以apSW为模型的基窗函数设计方法”。图3-21 余弦基神经自适应网络图3-21 余弦基神经自适应网络图3-22 apSW基窗LMS设计算法按照流程图,设计截止频率为π/4的32阶低通apSW的窗函数F。......
2025-09-29
二维奇偶监督码不仅可以检测每行的奇数个错和每列的奇数个错,而且行列交叉可以检测每行和每列的偶数个错。此外,二维奇偶监督码的编码方式也具有较高的效率。图4-6二维奇偶监督码的图示表4-1垂直奇偶校验2.水平奇偶校验水平奇偶校验是将数据以适当的长度划分成组,然后对水平方向的码元进行偶监督,排列见表4-2。......
2025-09-29
图3-31 基于最小二乘的基窗F卷积窗C及滤波器特性实现上述结果的MATLAB代码如下:图3-31 基于最小二乘的基窗F卷积窗C及滤波器特性实现上述结果的MATLAB代码如下:卷积窗C性能参数B=0.2165,A=-14dB,D=-10.15dB。对比图3-16七种基窗可看出,利用最小二乘得到的基窗综合性能最好。此外,基于此结果基窗F的滤波器具有最小的均方误差。......
2025-09-29
Stone对全隐式差分方程提出了新的迭代解法——强隐式迭代解法,简称SIP方法。由于这种迭代方法利用解方程组对全部格点同时加以改进,迭代效率非常高,已经十分接近直接解法,因而也就更加有效。Trescott等所做的比较研究表明:对于复杂的实际问题,SIP方法明显优于其他的迭代方法。表5-3-1ADI算法时间为500天时浓度场计算结果表5-3-2SIP算法时间为500天时浓度场计算结果图5-3-6SIP算法实例验证图算例2作者对三维SIP算法也进行了编程验证,作为......
2025-09-29
聚类分析发现强相关的对象组,而特异检测发现不与其他对象强相关的对象。图3.8K-means聚类方法与CpecuFind发现特异数据能力ROC曲线K-means聚类;CpecuFind表3.6K-means与CpecuFind发现特异数据能力ROC曲线面积对比上述对比说明,只简单地以簇类大小和对象与类心距离来评估对象的特异程度结果很粗糙,其评价特异数据的能力远不如Cpecu Find方法。......
2025-09-29
由此可得动能和化学能共同作用下的开孔孔径dc图6.35活性聚能侵彻体作用混凝土靶开孔效应2.内爆超压模型活性聚能侵彻体贯穿混凝土靶后,在目标内部发生剧烈爆燃反应,形成超压场。图6.37靶后1 m处内爆超压时程曲线图6.38靶后2 m处内爆超压时程曲线活性聚能侵彻体等效TNT当量为100 g时,不同爆心位置处,靶后1 m和2 m处超压时程曲线分别如图6.39和图6.40所示。图6.41靶后超压时程曲线......
2025-09-29
相关推荐