主要服务项目
如何申请专利

技术交底书模板-多视点视频编码边信息融合的方法

(一)技术交底书的要求:
□应清楚、完整地写明发明或实用新型的内容;
□使所属技术领域的普通技术人员能够根据此内容实施发明创造;
□使上述人员相信本发明确实可以解决现有技术不能解决的问题。
(二)技术交底书的具体样本如下:
 1)发明创造的名称:

一种多视点视频编码边信息融合的方法

 2)所属技术领域:
技术领域:
      本发明涉及一种多视点视频编码边信息融合的方法。
 3)背景技术
      3.1)详细介绍技术背景,并描述申请人所知的与发明方案最接近的已有技术(应详细介绍,以不需再去看文献即可领会该技术内容为准,如果现有技术出自专利、期刊、书籍,则提供出处);
      3.2)对现有技术存在的缺点进行客观的评述(现有技术的缺点是针对于本发明的优点来说的;如果找不出对比技术方案及其缺点,可用反推法,根据本发明的优点来找对应的缺点;本发明不能解决的缺点,不需提供;缺点可以是成本高、处理时间慢等类似问题)。
背景技术:

      近年来,传统的视频编码技术在诸如无线传感器网络等应用时遇到瓶颈,如何减轻编码端的运算负担成为重要的课题。针对这一问题,学者所提出的分布式视频编码技术可以将运算负担由编码端转移至解码端。同时,多视点视频可从多个不同的视角对场景进行观测,能够获取更为丰富的信息,使得多视点视频编码被大量应用于教育、娱乐、生产等诸多领域。
      在分布式视频编码中,边信息的质量是关乎系统性能的重要因素,同样,在分布式多视点视频编码的研究中,如何得到高质量的边信息亦是关键所在。多视点带来了视点间的相关性,有学者们开始在如何利用时间,视点间的联合相关性以期得到质量更好的边信息的方向上进行了一些有意义的探索与尝试,并取得了可观的成果。但现有的相关技术多具有因主观性过强而导致普适性较差的缺陷,导致作者在论文中所进行的实验难以得到复现,而当测试视频序列有变化时,解码性能的波动是较明显的。本项发明就是致力于减少这种主观性的影响,使得所提出的边信息生成技术更具有普遍适用的特性。
      在现有的相关技术中,通过制定相应的评价准则以实现对时间与视点间边信息的融合。这其中,目标物体的运动显著与否是重要的评价因素。在已有的技术中,多通过设定阈值以进行评价判决,而阈值的合理设定并非易事。
 4)发明内容:
      4.1)正面描述本发明所要解决的技术问题(对应现有技术的所有缺点;本发明解决不了的,不需提供);
      4.2)清楚完整的叙述发明创造的技术方案,应结合工艺流程图、原理框图、电路图、仿真图、布局图、设备结构图进行说明(越详细越好,可与第6部分合写;发明中每一功能的实现都要有相应的技术实现方案,不能只有原理,也不能只做功能介绍;需要详细提供与现有技术的区别技术和关联技术;每个附图都应有对应的文字描述,以他人不看附图即可明白技术方案为准;所有英文缩写都应中文注释):
      对于机械产品的发明创造应详细说明每一个结构零部件的形状、构造、部件之间的连接关系、空间位置关系、工作原理等;
      对于电器产品应描述电器元件的组成、连接关系;
      对于无固定形状和结构的产品,如粉状或流体产品、化学品、药品,应描述其组分及其含量、制造工艺条件和工艺流程等;
      对于方法发明,应描述操作步骤、工艺参数等;
      4.3)简单点明本发明的关键点和欲保护点(逐项列出1、2、3、、、),并简单介绍与最好的现有技术相比,本发明有何优点(一两个自然段即可;结合技术方案来描述,做到有理有据,即用推理或因果关系的方式推理说明;可以对应所要解决的技术问题或发明目的来描述)。
发明内容:

      本发明所要解决的技术问题是提出一种杜绝了阈值设定等所带入的主观因素的影响的多视点视频编码边信息融合的方法。
      具体如何设定阈值,没有明确的量化标准来界定,即没有量化标准来界定何为显著。因而基于控制论中的模糊控制技术,本发明提出了一种基于模糊控制的边信息融合技术,不需要设定阈值来获取边信息。
      具体来说,本发明提供一种多视点视频编码边信息融合的方法,包括如下步骤:
      参考帧步骤:在一时刻点,标准视点获取目标帧,并同时分别在所述标准视点附近的第一参考视点和第二参考视点获取第一参考帧和第二参考帧;所述标准视点在该时刻点前获取前参考帧,在该时刻点之后获取后参考帧;
      运动估计步骤:采用运动估计的方式,分别由所述前参考帧估计出标准视点在该时刻点的前估计帧,由所述后参考帧估计出标准视点在该时刻点的后估计帧,并获得所述前估计帧和后估计帧的加权值为时间估计帧;
      视差估计步骤:采用视差补偿的方式,分别由第一参考帧估计出该目标帧在所述第一参考视点的第一估计帧,由第二参考帧估计出该目标帧在所述第二参考视点的第二估计帧,并获得所述第一估计帧和第二估计帧的加权值为空间估计帧;
      边信息估计步骤:构建隶属度函数,并获得所述时间估计帧和空间估计帧的该隶属度函数值,由此获得边信息。
      上述技术方案基于模糊控制理论,构造一个隶属度函数,以期能够更加充分地利用视点内、视点间的联合相关性。本方法阵对环形摄像机阵列,给定需解码的当前帧作为目标帧,分别确定其视点内与视点间的参考帧。利用运动估计得到视点内时间上预测结果,并通过视差补偿得到视点间的预测结果。由所构造的隶属度函数得到相应的权值,对所得到的两种预测结果进行融合,得到解码所需的边信息。
      不同于传统的阈值判别进行信息融合,在降低了阈值设定所带入的主观因素的影响。在上述技术方案中,不仅进行融合时的权值是跟随视频内容的特点自适应调节的,且隶属度函数也能够进行自适应的调整,这就提高了本方法的普遍适用性。同时,在实践过程中,可以对隶属度函数的形式加以后期改进,具有较大的发展空间。且该技术方案方法计算简单,易于物理实现。
      优选的,所述运动估计步骤包括:
      分别估计出前参考帧对目标帧的前运动向量,和后参考帧对目标帧的后运动向量;
      由所述前运动向量和后运动向量分别获得所述前估计帧和前后估计帧。
      进一步的,所述运动估计步骤中,设所述前运动向量为专利说明书附图,所述后运动向量为专利说明书附图,所述前估计帧为专利说明书附图,所述后估计帧为专利说明书附图;所述时间估计帧为专利说明书附图,则:
专利说明书附图  。
      优选的,所述视差估计步骤包括:
      分别估计出第一参考帧对目标帧的第一运动向量,和第二参考帧对目标帧的第二运动向量;
      由所述前第一运动向量和第二运动向量分别获得所述第一估计帧和第二后估计帧。
      进一步的,所述视差估计步骤中,设所述第一运动向量专利说明书附图,所述第二运动向量为专利说明书附图,所述第一估计帧为专利说明书附图,所述第二估计帧为专利说明书附图,所述空间估计帧为专利说明书附图,则:
专利说明书附图   。
      优选的,所述边信息估计步骤包括如下步骤:
      构建隶属度函数专利说明书附图
      分别定义专利说明书附图,以及专利说明书附图
      则边信息为:专利说明书附图
      优选的,所述第一参考视点设置在标准视点左边,所述第二参考视点设置在标准视点右边。
      与现有技术相比,本发明的技术方案的优点在于,不仅避免了阈值设定所带入的主观因素的影响,还在进行融合时的权值是跟随视频内容的特点自适应调节的,而且,隶属度函数也能够进行自适应的调整,这样该技术方案更加具有良好的普遍适用性。
 5)附图:实用新型专利必须提供附图,附图中构成件可以有标记,尺寸和参数不必标注。
附图说明:

      图1是本发明的方法一种实施例中获取相应的图像帧的硬件设置结构示意图;
      图2是本发明的方法一种实施方式的结构示意图。
 6)优选具体实施方式(可与第4部分合写;尽量写明所有同样能完成发明目的的替代方案,所述替代可以是部分结构、器件、方法步骤的替代,也可以是完整的技术方案):
      对于产品发明应描述产品构成、电路构成或者化学成分、各部分之间的相互关系、工作过程或操作步骤;对于方法发明应写明步骤、参数、工艺条件等,可提供多个具体实施方式。
具体实施方式

      下面结合附图,对本发明的较优的实施例作进一步的详细说明:
      如图1所示,为一环形摄像机阵列。
      其中,摄像机M为标准视点,摄像机L为第一参考视点,摄像机R为第二参考视点,分别对观测场景获取图像帧。
      如图2所示,一种多视点视频编码边信息融合的方法包括如下步骤:

  1. 在分布式多视点视频编码中,对摄像机M所给定需要解码的当前帧专利说明书附图作为目标帧,确定该帧在视点内时间顺序上的前后两个参考帧专利说明书附图专利说明书附图,以及左右相邻摄像机L、R的视点在同一时刻的两个参考帧专利说明书附图专利说明书附图。在其他的实施例的实时系统中,也可设定一个虚拟后向参考帧,令其与前向参考帧相等,本方法同样适用;
  2. 通过运动估计技术分别得到视点内参考帧对目标帧的前后运动向量专利说明书附图专利说明书附图。可将视频帧分为若干像素块,从参考帧的某个位置的等大小的块对目标帧的当前块进行预测,预测的过程中只有平移,平移的大小被称为运动向量;
  3. 根据所得的运动向量可以分别计算得到时间预测结果专利说明书附图专利说明书附图
  4. 采用视差补偿技术分别得到视点间参考帧对目标帧的左右方向两个运动向量专利说明书附图专利说明书附图。视差补偿技术在原理上类似于运动补偿技术,将时间顺序上的参考帧用摄像机之间的参考帧代替,对目标帧进行预测,以获取运动向量;
  5. 根据所得的运动向量可以分别计算得到视点间预测结果专利说明书附图专利说明书附图
  6. 计算四个运动向量的模专利说明书附图专利说明书附图专利说明书附图专利说明书附图
  7. 通过

    专利说明书附图
      得到时间预测结果专利说明书附图

  1. 计算

    专利说明书附图
      得到视点间预测结果专利说明书附图

  1. 构造隶属度函数

   专利说明书附图
      该隶属度函数具有以下特点:

  1. 单调递增性;
  2. 由于视点内时间相关性在多数情况下是强于视点间关联性的,所以即使有x=1时,函数值不应为1,以保证视点内时间相关性的可利用性;
  3. 由于t为一变量,所构造的函数具有自适应调节能力,可根据视频内容进行调节。上述三点也是在构造合适隶属度函数是所必须考虑的因素。
  4. 定义:

    专利说明书附图
专利说明书附图
      通过所构造的模糊变量与隶属度函数分别得到进行融合时视点间边信息与视点内 边信息所占有的权重,利用这种方式得到的权值可根据视频内容进行自适应调整,消除了阈值设定等环节所带来的主观因素影响。

  1. 解码所需的边信息为:

   专利说明书附图
      以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。


 

说明书附图

 专利说明书附图 



专利说明书附图
图1

专利说明书附图
图2