稀疏表示介绍(上)

声明

之前虽然听过压缩感知和稀疏表示，实际上昨天才正式着手开始了解，纯属新手，如有错误，敬请指出，共同进步。

主要学习资料是 Coursera 上 Duke 大学的公开课——Image and video processing, by Pro.Guillermo Sapiro 第 9 课。

由于对图像处理的了解也来自与该课程，没正经儿看过几本图像方面的书籍，有些术语只能用视频中的英文来表达，见谅哈！

1. Denoising 与 MAP

故事从 denoising 说起，话说手头上有一张含有噪音的图片 Lena，如何除去噪音得到好的 clean image 呢？

对于上面的问题，用 x 值表示某个像素的灰度值，我们可以建立这样一个最小化的数学模型：

其中， y 表示已知的观测值，也就是含有噪声的原图， x 表示要恢复成 clean image 的未知值。

模型的第一项的直观作用就是，预测值 x 不要离观测值 y 太远。数学上的解释是， x 的取值概率可以看做是以 y 为均值的高斯分布，即图像带有 Gaussian noise，第二项是规则化项。由来如下：假设 x 本来是就带有某种先验概率的分布，现在又已知观测值 y，根据贝叶斯原理，现在 x 的分布（后验）正比于先验概率分布与高斯分布的乘积。如果先验概率分布也正是指数分布，将乘积取负对数，就可以得到上述在机器学习里非常常见的 MAP 模型。

现在的问题是：最好的先验 (prior) 究竟是什么？ G(x) 应该取什么形式？定义图像信号的最好空间是什么？

在学术界，这方面的工作已经做得非常多，对这个问题的探讨过程可以比喻成类人猿向人类进化的过程:

第一张图， prior 假设 clean image 能量尽量小， x 要尽可能地小。第二张图， prior 认为恢复后的图像要光滑，于是产生了 Laplacian 和 low energy 的结合，朝前进化了一步。第三张图，prior 认为要考虑 edges 是不光滑滴，需要不同情况不同处理…… Sparse and Redundant 是正在讨论的问题，目前是最新的进化版本，而后面也有一些算法，虽然也成功进化成人类，可惜太胖了，行动不便—— computationally expensive and difficult。 Sparse modeling 的先验究竟是什么？要回答这个问题，还需要了解一些基础概念。

2. Sparsity and Lp Norm

How to Represent Sparsity

表示一个向量的稀疏程度可以用 Lp norm，对于 alpha 向量的某一个元素为 x， Lp norm 的计算公式和函数图像如下：

我们希望不管 x 多大，它非零的惩罚是相同的，L0 norm 正好满足这个要求，它表示的意思是数出 alpha 向量中非零的个数。

Sparse Modeling of Signal

一张 8×8 的图片，可以表示成 64 维的向量 x ，如何进行稀疏表示？下图中假设 N = 64：

左边矩阵 D 是字典矩阵，由 K 个 N 维的列向量组成。根据 K 与 N 的关系，又可以划分为：

K > N: over-complete, 这种情况在稀疏表示里面最常见

K = N: complete, 例如傅里叶变换和 DCT 变换都是这种情况

K < N: under-complete

中间列向量 alpha 是一个稀疏向量，特点是非零项很少，图中只有三个非零项，代表 D 矩阵对应行向量的线性组合。

最后 x 向量表示恢复后的向量。

atoms 表示 D 的列向量

实际上 DCT 变换也可以看做是一种稀疏表示，它的 D 向量是由固定的且刚好完备的正交基向量组成，并且 alpha 向量也具有一定稀疏性。

对于上图，假设 D 矩阵 K > N，并且是满秩的，那么对于任意个 N 维的向量 b （图中是 x ），肯定有 Ax = b。现在加入 Lp norm 的约束条件，限制只能用少量的 A 的列向量 (atoms 作为基，向量 b 就被固定在某个 span 内，成为了一个 Lp 优化问题：

用紫色表示平面，用青色表示 norm 取同一个值的球形(等高线)，问题如下：在平面 Ax = b 平面内选出 norm 最小的最优解

当 p >= 1时，norm ball和平面的交点有多个。这是一个凸优化问题，可以用拉格朗日乘子来解决这个问题。

当 0 < p < 1 时， norm ball 可行解十分稀疏，是一个非凸优化问题，解决这类问题很难，但是却有很好的稀疏性。

当 p = 0 时， norm ball 上的点除了坐标轴，其他部分无限收缩，与平面的交点在某一个坐标轴上，非零系数只有一个。

回到第一节将的 MAP 模型， Sparse Modeling 模型就是非零系数限制在 L 个之内（意味着解在至多 L 个 atoms 组成的 span 里），尽可能接近平面:

这样，我们用少量的 atoms 组合成真实信号，而 noise cannot be fitted very well, 在投影到低维空间的过程中起到了降噪的作用。

3. Some Issues：

模型可以改成 L0 norm 的形式和其他形式来计算或者求近似吗？

解集 alpha 向量是唯一的吗？我们可以求它的近似吗？如果可以，如何估计近似程度?

应该采用什么样的字典矩阵 D 才能较好地消除噪声？字典 D 如何确定？

参考资料：

[1]:Image and video processing, by Pro.Guillermo Sapiro 第 9 课

[2] http://hi.baidu.com/chb_seaok/item/bdc0903472229990b80c030f

by：daniel-D
from：http://www.cnblogs.com/daniel-D/

稀疏表示介绍(上)

1. Denoising 与 MAP

2. Sparsity and Lp Norm

3. Some Issues：

Explain

vector中insert的用法

最新文章

盲目从众心理研究及实例

如何在百度上提问让别人回答(百度问题登录)

美容去皱纹（皱纹怎么去除？）

西餐厅服务员的基本服务流程是什么

胡歌演过的电视剧（胡歌评分最高的6部剧集）

北京市空气污染指数的影响因素

吴京安演的电视剧（著名演员吴京安）

乒乓球拍的握拍方法有哪些

重庆理工大学怎么样（重庆理工大学是一本还是二本院校）

算命，看风水，揭露真相

标签

热评文章

网上的大流量卡怎么取消_流量卡如何退订(135G高速大流量卡)

网上的手机流量卡那么便宜_网上的流量卡怎么那么便宜(29元的流量卡到底是坑还是真)

网上的无限流量卡测评_网上卖的无限流量卡是真是假(网上卖的无限流量卡可靠吗)

网上的流量卡不用了_网上的流量卡不用了怎么销户(流量卡不用了需要销户吗)

网上的流量卡为何发货很慢_为什么网上买的流量卡流量走的特别快(29元的流量卡到底是坑还是真)

稀疏表示介绍(上)

1. Denoising 与 MAP

2. Sparsity and Lp Norm

3. Some Issues：

Explain

vector中insert的用法

最新文章

盲目从众心理研究及实例

标签

热评文章

网上的大流量卡怎么取消_流量卡如何退订(135G高速大流量卡)

网上的手机流量卡那么便宜_网上的流量卡怎么那么便宜(29元的流量卡到底是坑还是真)

网上的无限流量卡测评_网上卖的无限流量卡是真是假(网上卖的无限流量卡可靠吗)

网上的流量卡不用了_网上的流量卡不用了怎么销户(流量卡不用了需要销户吗)

网上的流量卡为何发货很慢_为什么网上买的流量卡流量走的特别快(29元的流量卡到底是坑还是真)

关注我们的公众号