概述
按道理讲,这些东西应该熟记于心的。但是自己真心不喜欢记这种东西,看到一个总结不错的博客,转载过来以便于自己查看把!原文
1. 几种范数
矩阵 X∈Rm×n X∈Rm×n, σi(X) σi(X) 表示 X X 的第 i i 大奇异值(即 XX′ XX′ 的第 i i 大特征值的均方根){cite recht2010guaranteed}。 r r 表示矩阵 X X 的秩(Rank),也等于 X X 非零奇异值的个数。对维度相同的两个矩阵 X X 和 Y Y,我们定义在 Rm×n Rm×n上的内积为
1. Frobenius范数
矩阵的Frobenius范数又称Hilbert-Schmidt范数,用 ∥⋅∥F ‖⋅‖F 表示。Frobenius范数也等于奇异值向量的Euclidean范数(或称 ℓ2 ℓ2 范数),基于内积 (1) (1)来计算,即
2. 算子范数
矩阵的算子范数(operator norm)也称诱导2范数( induced 2-norm),等于最大奇异值(也就是奇异值向量的 ℓ∞ ℓ∞ 范数),即
3. 核范数
矩阵的核范数(nuclear norm)等于矩阵奇异值的和,即
核范数通常被称为其他一些名字,如Schatten的 1-norm,Ky Fan的 r-norm,或迹范数(trace class norm)。由于奇异值均非负,核范数等于奇异值向量的 ℓ1 ℓ1 范数。
对于任意秩不超过 r r 的矩阵 X X,以上三种范数满足以下不等式条件
2. 对偶矩阵
对于内积空间上的任意范数 ∥⋅∥ ‖⋅‖,存在一个对偶范数(dual norm) ∥⋅∥d ‖⋅‖d,其定义如下:
特别地,对偶范数的对偶范数为原范数。
对于 Rn Rn 上的向量, ℓp ℓp 范数 1<p<∞ 1<p<∞ 的对偶范数为 ℓq ℓq 范数, p,q p,q 满足 1p+1q=1 1p+1q=1。类似地, ℓ∞ ℓ∞ 的对偶范数为 ℓ1 ℓ1。同样,我们可以推广到我们定义的矩阵范数。例如,Frobenius范数的对偶范数还是Frobenius范数,这可以简单的微积分(或Cauchy-Schwarz)来验证,因为
就等于 ∥X∥F ‖X‖F,且当 Y=X/∥X∥F Y=X/‖X‖F时取得最大值。类似地,算子范数的对偶范数是核范数(后面会具体说明)。
3. 秩和势函数的凸包络
凸包络(Convex envelope)的定义:给定一个凸集 C C,一个函数(可以为非凸的) f:C→R f:C→R 的凸包络为使得对所有 x∈C x∈C 均有 g(x)≤f(x) g(x)≤f(x) 的最大凸函数 g g 。凸包络的定义表明,在所有的凸函数中, g g 是对 f f 最佳的逐点近似。特别的,如果最优的 g g 可以方便的描述出来,函数 f f 近似的最小值可以高效地求得。
由链式不等式 (5) (5)可以得到 对所有 X X 有 rank(X)≥∥X∥∗/∥X∥ rank(X)≥‖X‖∗/‖X‖。对所有 ∥X∥≤1 ‖X‖≤1,均有 rank(X)≥∥X∥∗ rank(X)≥‖X‖∗,因此在算子范数定义的单位球内,核范数是秩函数的较小的凸边界。事实上核范数也是其最紧致的凸边界,即:在集合 X∈Rm×n:∥X∥≤1 X∈Rm×n:‖X‖≤1 上,核范数 ∥X∥∗ ‖X‖∗ 是秩函数 rank(X) rank(X) 的凸包络。
4. 秩的可加性
次可加性(subadditivity):如果从一个线性空间 S S 映射到 R R 的函数 f f 满足 f(x+y)≤f(x)+f(y) f(x+y)≤f(x)+f(y)。
可加性(additivity):如果从一个线性空间 S S 映射到 R R 的函数 f f 满足 f(x+y)=f(x)+f(y) f(x+y)=f(x)+f(y)。
对于向量来说,势函数和 ℓ1 ℓ1 范数均满足次可加性。
最后
以上就是危机发带为你收集整理的几种常用的矩阵范数的全部内容,希望文章能够帮你解决几种常用的矩阵范数所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复