中国财富新闻网

您的位置:首页 > 财经评论 >

英伟达从图像中抽象出概念再生成新的图像,网友:人类幼崽这个技能AI终于学

2岁的人类幼崽能做什么,AI居然会学。

直到现在,这个终于被科学家攻克了!

有网友评价:很爽这可能是我最近几个月看到的最好的项目了

它是如何工作的。

我们先来看几个例子。

当你上传3张不同角度的陶瓷猫照片时,你可能会得到以下4张新图像:两只在船上钓鱼的陶瓷猫,陶瓷猫书包,班克斯的艺术风格猫和陶瓷猫主题饭盒。

同样的例子是艺术品:

装甲:

碗:

AI不仅可以从图像中提取物体,还可以生成具有特定风格的新图像比如如下图,AI提取了输入图像的绘画风格,生成了一系列这种风格的新绘画

更神奇的是,它还可以将两组输入的图像进行组合,提取一组图像中的物体,然后提取另一组的图像风格,将两者组合生成一幅全新的图像。

除此之外,通过这个功能,你还可以启动一些经典的图像,给它们添加一些新元素。

那么,如此神奇的功能背后是什么原理呢。

虽然近两年来,大规模的文本—图像模型,如DALL,CLIP,GLIDE等,已经被证明有很强的自然语言推理能力

但有一点:如果用户提出一些具体的要求,比如生成一张新的包含我最喜欢的童年玩具的照片,或者把孩子的涂鸦变成一件艺术品,这些大规模的模型是很难做到的。

为了应对这一挑战,提出了一种固定的,预训练的文本图像模型和一小组描述概念的图像目标是从这个小集合中找到一个单词来嵌入和重建图像因为这种嵌入是通过优化过程发现的,所以称为文本倒置

具体来说,就是先把用户输入的图像中的物体或样式抽象出来,转换成伪词s此时,这个伪词可以被视为任何其他词

S在沙滩上的照片,挂在墙上的S的油画,画一个S2风格的S1。

值得注意的是,这项研究使用了小规模,有计划的数据集,因此在生成图像时可以有效避免刻板印象。

比如下图,当提示医生时,其他模型倾向于生成白人和男性的图像,而该模型生成的图像中增加了女性和其他种族的数量。

目前这个项目的代码和数据已经开源,有兴趣的伙伴可以关注一下。

参考链接:

栏目导读

消博会“神仙打架”:国际巨头入华抢滩新赛道,本土品牌欲出海

消博会“神仙打架”:国际巨头入华抢滩新赛道,本土品牌欲出海

作者:叶子琪

作者:周嘉宝尽管上半年本土疫情的反复让零售市场承压,但中国这片消费热土仍被所有人寄予厚望。7月25日,第二届中国国际消费品博览会在海南海口拉开帷幕。时代财经发现,上半年零售市场的低迷情绪并没有蔓延至这场规格颇高的展会中。作为此次展会主战场,...

2023年定为“消费提振年”,广州消费市场大派“红包”

2023年定为“消费提振年”,广州消费市场大派“红包”

作者:子墨

兔年第一个工作日,刷屏的除了有“开工大吉”,还有政府派发的“大红包”。1月28日,全省高质量发展大会在广州召开。紧随其后,当天下午,广州召开全市高质量发展大会。会上,广州市商务局局长洪谦透露一个重磅信息——广州将2023年定为“消费提振年”...

无人货架凉了新零售的发展新机会在哪?

无人货架凉了新零售的发展新机会在哪?

作者:张璠

摘要:正如电商概念的完善和发展经历了一个过程一样,新零售的发展同样要经历一个从萌芽到成熟的过程。从这个逻辑来看,当前出现的无人货架困境是新零售概念发展成熟的过程当中必然要经历的一个阶段。图片来源:视觉中国从某种程度上来讲,无人货架打了新零售...

华润啤酒欲牵手喜力啤酒业“利润时代”打响高端之争

华润啤酒欲牵手喜力啤酒业“利润时代”打响高端之争

作者:苏婉蓉

中新经纬客户端3月13日电(贺陈慧)积极探索并购机会的华润啤酒,正在加快对啤酒高端市场的布局。3月9日,因传华润啤酒欲收购喜力中国业务,华润啤酒发布价格和成交量异常波动的公告,公告中提到,公司及公司控股股东经常探索和进行有关潜在交易的商业和...