GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型_热议

来源:程序员客栈   时间:2023-03-29 06:06:56


【资料图】

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

自从 DALL·E 2 之后,在图像生成方面扩散模型替代GAN成了主流方向,比如开源的文生图模型stable diffusion也是基于diffusion架构的。近日, Adobe研究者在论文Scaling up GANs for Text-to-Image Synthesis提出了参数量为10亿(1B)的GAN模型:GigaGAN,其在文生图效果上接近扩散模型效果,而且推理速度更快,生成512x512大小图像只需要0.13s,生成16M像素图像只需要 3.66s。同时GigaGAN也支持latent空间的编辑功能,比如latent插值,风格混合,以及向量运算等。

GigaGAN改进了StyleGAN架构,采用两阶段训练策略:一个是64x64的图像生成器和一个512x512的图像超分2器,其图像生成器架构如下所示(这里也是采用CLIP text encoder来引入text condition):GigaGAN在 LAION2B-en和 COYO-700M数据集上训练,其在COCO数据集上的FID达到9.09,超过stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s):GigaGAN除了文生图能力,还可以实现可控的合成,比如风格混合,如下图所示:更多效果图和技术细节见论文https://arxiv.org/abs/2303.05511和网站https://mingukkang.github.io/GigaGAN/

关键词:

上一篇:

下一篇:

文章推荐

  • 香港中文大学(深圳)校长徐扬生:用4年的时间等到花开

    当你们急于一件事情的结果,或者焦虑于为何落后于人的时候,不妨想一想校园里的蓝花楹,我们用了4年的时间等到了花开。只要你认准了路,慢

    深圳商报 2022-05-23
  • 哈尔滨铁路迎节后返程高峰 推出复工专列服务

    中新网哈尔滨2月6日电 (周晓舟 记者 史轶夫)中国铁路哈尔滨局有限公司6日发布消息,哈尔滨铁路迎来春节后返程客流高峰,6日至7日预

    中新网 2022-02-07
  • 冬奥动车组设5G超高清演播室 “瑞雪迎春”号智能化人性化结合

    中新网北京2月6日电 (记者 刘文曦)在时速350公里的高铁列车上首设5G超高清演播室,为北京冬奥会量身定制的新型奥运版智能复兴号动车组瑞

    中新网 2022-02-07
  • 中欧班列“签证官”:日行10公里 用锤子“听诊”

    (新春走基层)中欧班列“签证官”:日行10公里 用锤子“听诊”  中新网郑州2月6日电 题:中欧班列“签证官”:日行10公里,用锤子“

    中新网 2022-02-07
  • 西湖守兰人的春节美丽故事:花苞为伴 手留余香

    中新网杭州2月6日电 (记者 谢盼盼)守望花苞,这是西湖守兰人许晔的春节故事,春节正是兰花花苞开花的重要时期。  今年春节里,浙江

    中新网 2022-02-07
  • 广告

    X 关闭

    X 关闭

  • 众测
  • more+

    GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型_热议

    点蓝色字关注“机器学习算法工程师”设为星标,干货直达!自从DALL·E2之后,在图像生成方面扩散模型替代GAN成了主流方向,比如开源的文生图模

    环球信息:instagram是什么意思英语_instagram是什么意思

    1、instagram是什么意思2、Instagram是一款最初运行在iOS平台上的移动应用,它以快速、精彩、有趣的方式

    世界速讯:农行信阳分行东城支行:竭诚竭心竭力 只为客户满意

    河南广电·大象新闻记者吴彦飞通讯员袁志磊吕泓昊陈晨为贯彻农行信阳分行竭心竭力为民服务的理念,在认真落实规范化服

    天津之眼新轿厢更换完成 有哪些新的亮点

    如不能正常浏览请选用IE浏览器  天津北方网讯:为了进一步提升游客的观光体验,天津之眼摩天轮从去年底开始,就对全部48个轿厢,进行了更换