《Generative Image Coding with Diffusion Prior》
《Generative Image Coding with Diffusion Prior》
近日,由中国电信云计算研究院常建慧博士撰写的论文《Generative Image Coding with Diffusion Prior》已被多媒体技术领域的顶级国际学术会议——IEEE International Conference on Multimedia & Expo(IEEE ICME 2025)接收,并将于近期正式发表。该研究提出的基于扩散先验的生成式图像编码框架,为解决当下复杂视觉内容编码难题带来了新突破。
随着生成技术的蓬勃发展,视觉内容的构成日益复杂多样,传统编码技术和现有智能编码方法在高压缩比下难以兼顾主观重建质量、视觉保真度和通用性。此项研究的核心在于借助预训练扩散模型的强大先验知识,通过精心设计预优化编码器、轻量级适配器以及注意力融合模块,将压缩后的潜在表示与预训练模型内部特征紧密结合,同时设计分布归一化方法显著提升重建保真度。
该图像编码技术能够大幅提升海量图像视频数据在云端的存储和传输效率,减少存储成本和传输带宽需求。从网络架构角度看,该技术加速了图像数据处理的云原生化进程,有助于构建更为高效、灵活的“云 + 网”融合能力体系。其在语义通信、智能融合终端以及无线卫星通信、低空视觉通信等场景的应用潜力,与智能泛在云“无处不在、按需服务”的理念高度契合,能够为各类政企客户提供定制化的视觉通信服务。
作为中国电信的高层次学术研究机构,中国电信云计算研究院密切关注在智能泛在云环境下,数据的高效处理和传输问题,致力于通过技术创新推动算力网络的深度融合,为多元行业场景提供更优质、高效的服务。
国际多媒体与展览会议(IEEE International Conference on Multimedia & Expo,ICME)由IEEE于 2000 年创立,作为多媒体技术及应用领域的顶尖国际学术会议,在全球范围内备受瞩目。其会议议题深度覆盖多媒体信号处理、计算机视觉、人机交互、增强现实与虚拟现实,以及人工智能驱动的多媒体解决方案等多个前沿领域。ICME 是中国计算机学会 B 类推荐会议,拥有极为严格的审稿流程,被该会议收录的论文会被 EI 数据库检索,在计算机多媒体技术领域具备较高的国际影响力,已成为国内科研成果对外展示的关键窗口之一,为国内科研人员在国际学术舞台上发声、提升中国在多媒体技术领域的国际话语权发挥着重要作用。
版权保护: 本文由 电信网,中国电信,中国电信网上营业厅,中国电信客服电话,中国电信营业厅,中国电信宽带,电信宽带套餐价格表,电信宽带套餐,中国电信宽带官网 原创,转载请保留链接: https://www.189e.com/xingyedongtai/2025/0423/13397.html
- 上一篇:中国电信云计算研究院在JCST期刊发表综述论文,
- 下一篇:没有了