新型视频语义编码技术白皮书(2024年).pdf

新型视频语义编码技术白皮书(2024年).pdf
这份白皮书探讨了新型视频语义编码技术的发展趋势和关键技术。随着5G、人工智能等技术的发展,以及VR视频、全景视频等新型视频内容的涌现,传统的视频编码技术面临新的机遇和挑战。视频语义编码技术基于视频内容和语义特征进行编码,旨在突破传统编码方法的性能瓶颈,并推动视频产业的高质量发展。 白皮书重点介绍了视频语义编码的关键技术,包括: * **视觉感知编码**:利用人眼视觉系统(HVS)的特性,去除人眼无法感知的视觉冗余。代表性的技术包括JND编码和ROI编码。 * **生成式编码**:利用生成对抗网络(GAN)在极低码率下补充高频纹理细节,甚至直接生成高感知的图像和视频。 * **跨模态编码**:将图像或视频中的冗余信息转变为简明的文本描述特征,再利用生成对抗网络从文本领域重建图像。 * **机器视觉编码**:面向机器视觉任务,自适应地选择或生成与机器视觉任务强相关的语义信息。 * **编码数据传输**:介绍了媒体封装(TS、MP4、FLV等格式)和流媒体传输(MPEG-DASH、HLS、RTP、RTMP等协议)的相关技术。 白皮书还总结了国内外标准化组织在视频编码领域的工作进展,并对AI视频编码、VR视频编码、多视点视频编码和面向机器的视频编码等方向的标准化提出了建议。 最后,白皮书展望了视频语义编码技术未来的发展趋势,包括延伸至6DoF视频、利用预训练多模态大模型、与AIGC技术结合、视觉内容的高效表征、异构计算架构、促进视频传输技术的优化升级等。总而言之,视频语义编码技术作为视频业务的底层关键技术,将推动视频业务的创新发展,并促进新兴视频业务的大规模应用落地。
在线阅读 下载完整报告 | 9.09 MB | 32页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告