火山引擎与中国科学技术大学IMCL团队共同夺得NTIRE比赛盲压缩图像增强赛道的冠军荣誉

近日,第2024届CVPR Workshop下属的NTIRE大赛公布比赛结果,在盲压缩图像增强赛道,火山引擎多媒体实验室联合中国科学技术大学智能媒体计算实验室(IMCL)团队自主研发的算法获得了冠军,技术能力达到行业领先水平。

火山引擎与中国科学技术大学IMCL团队共同夺得NTIRE比赛盲压缩图像增强赛道的冠军荣誉参赛队伍大赛背景

NTIRE(New Trends in Image Restoration and Enhancement)是新兴的计算机视觉国际竞赛,每年在模式识别和机器视觉顶级国际会议CVPR(CCF-A)上举行。该比赛旨在鼓励学者和研究人员探索计算机视觉中图像恢复和提升的新技术和方法,并且促进学术交流,在计算机视觉领域获得了广泛的关注和参与,吸引了众多高校和业界知名公司参加。

  盲压缩图像增强比赛结果

随着数字图像和视频内容的快速增长,有损图像压缩技术,作为降低图像传输带宽和存储开销的必要技术,早已在各种工业应用中普及。在流行的压缩编解码器中,考虑到计算效率和复杂度,在实际应用中,JPEG备受青睐。然而,在受限码率下,JPEG压缩后图像往往会带有复杂压缩失真,且较难获取压缩等级。在这个背景下,盲压缩图像增强竞赛应运而生,旨在实现任意等级JPEG压缩失真的恢复,提升真实场景中解码图像的画质,打破未知压缩失真对增强算法的限制。

冠军算法介绍

盲压缩图像恢复的主要挑战在于如何让网络感知到图像的压缩失真程度的同时,也能感知到图像的内容,从而达到修复的目的。在此次竞赛中,团队提出了一种巧妙利用动态提示(Dynamic Prompt)的盲图像恢复方法,名叫PromptCIR。与之前直接估计压缩质量因素来进行指导的方法不同,PromptCIR通过提示组件之间的动态组合以及从失真图像特征生成的提示权重隐式地学习编码压缩信息,从而为盲恢复提供更多的失真自适应能力。

值得一提的是,大多数现有的基于提示学习的压缩图像恢复方法将提示大小设置为与图像特征大小相同,限制了对各种输入大小的泛化能力。为了缓解这个问题,我们采用了内容感知的动态提示。具体来说,我们将提示大小设置为1 x 1,并生成与图像特征相同分辨率的空间位置感知的提示权重,以避免过度适应训练图像大小的潜在问题。此外,为了提高内容感知和失真感知表征能力,我们使用多个提示基动态模版编码任务自适应信息,从而自适应地编码压缩质量信息,并保留必要的空间位置知识。

不仅是算法上的改进,团队还重新审视了其他辅助技术,如数据增强、数据合成等,以减少过拟合和数据偏差,最终超过其他竞争对手,获得第一名的成绩。

PromptCIR方法图

论文链接:https://arxiv.org/pdf/2404.17433

总结

火山引擎多媒体实验室联合中国科学技术大学智能媒体计算实验室(IMCL)团队在盲压缩图像恢复领域实现了突破性的进展,并获得了该赛道冠军。自研的技术方案可以帮助修复成千上万的被压缩数字图像内容,从而给用户提供更为清晰、精细的图像展现效果,有助于推动数字媒体行业向着更加智能化、高效化的方向发展。

火山引擎多媒体实验室是字节跳动旗下的研究团队,致力于探索多媒体领域的前沿技术,参与国际标准化工作,其众多创新算法及软硬件解决方案已经广泛应用在抖音、西瓜视频等产品的多媒体业务,并向火山引擎的企业级客户提供技术服务。实验室成立以来,多篇论文入选国际顶会和旗舰期刊,并获得数项国际级技术赛事冠军、行业创新奖及最佳论文奖。

火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和工具开放给外部企业,提供云基础、视频与内容分发、大数据、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长。

猜你喜欢

weyvv5国产的suv免费:探索未来出行新选择与科技相结合的卓越表现
weyvv5国产的suv免费:探索未来出行新选择与科技相结合的卓越表现

weyvv5国产的suv免费,乃新颖之模式,符合消费者之实际需求,且有其独特之魅力。此车广受瞩目,展现出对环保与科技的重视,极为适合现代出

私密直播全婐APP免费:探索无尽社交乐趣,随时随地畅享精彩直播体验
私密直播全婐APP免费:探索无尽社交乐趣,随时随地畅享精彩直播体验

私密直播全婐APP免费之兴起,乃现代社交之新潮流,集合了诸多网络直播所未及之特性。此应用使用户能随心所欲,与志趣相投之人共聚一堂,畅

尖叫之夜免费直播:揭示这一盛事背后的精彩与期待
尖叫之夜免费直播:揭示这一盛事背后的精彩与期待

尖叫之夜免费直播乃一盛事,四方聚集,众贤共襄,热爱者翘首以盼。此夜之际,诸多人尽情欢愉,尽展其才,欢声雷动,非同凡响。然其背后,隐

成品短视频CRM入口在哪里打开:探寻短视频管理平台之路径
成品短视频CRM入口在哪里打开:探寻短视频管理平台之路径

成品短视频CRM入口在哪里打开,此问因时代之变迁,短视频之盛行,逐渐成为各行各业之必需品。众所周知,短视频之制作与管理,须借助专业之

17cc网黑料爆料一区二区三区:揭秘17cc网黑料背后的真相与影响
17cc网黑料爆料一区二区三区:揭秘17cc网黑料背后的真相与影响

17cc网黑料爆料一区二区三区者,时下网络盛行之中,频频见诸报端,令人驻足思量。此类黑料,所称即为对于各类事件之深度挖掘与曝光,内容包

音乐老师的饺子水好多免费:传承传统美食与音乐教育的完美结合
音乐老师的饺子水好多免费:传承传统美食与音乐教育的完美结合

音乐老师的饺子水好多免费,饺子者,中华民族之传统美食也。音乐与饺子,同样为生活之苦乐结合。于此,音乐老师之饺子水借其技巧,寓教于乐

好想c1v1骨科:探索骨科领域中的创新技术和治疗方案
好想c1v1骨科:探索骨科领域中的创新技术和治疗方案

好想c1v1骨科乃今日医学之重要分支,其所治之诸症与人之生活息息相关。伴随科技进步,骨科领域日新月异,诸如微创手术、人工关节等新技术不

没带罩子让他吃了一天的没事吧:流行文化的变迁与健康意识的提升
没带罩子让他吃了一天的没事吧:流行文化的变迁与健康意识的提升

没带罩子让他吃了一天的没事吧此事始于一人,未携罩子,然其食一日,未觉有碍,反惹众人关注。此事引发社会对食品安全与卫生理念之广泛讨论

国产精产国品一二三在观看:论国产品质之卓越与潜力
国产精产国品一二三在观看:论国产品质之卓越与潜力

国产精产国品一二三在观看,者乃国人智慧与匠心之结晶,堪为良品之典范。近年来,国产之优质产品日益崭露头角,不仅在国内市场渐得人心,且

老师趴讲台把腿张开让学生背单词:课堂情境教育的新探索,引发热议与思考
老师趴讲台把腿张开让学生背单词:课堂情境教育的新探索,引发热议与思考

老师趴讲台把腿张开让学生背单词,乃是一场课堂教学中颇具争议之举。此举振奋了课堂气氛,亦引发了对教育方式的深思。学生们在这种特殊的情