升级版|在花了两小时体验英伟达升级版“神奇画布”后,整个人都凌乱了( 二 )


GauGAN 2 “魔法”之初体验虽然英伟达把GauGAN 2的能力宣传得如此神奇,但本着对科学负责任的态度,硅星人还是决定要亲自上手“验验货”。
此次英伟达免费为大众开放了一个GauGAN 2的体验平台。整个平台的构成很简单:左边是绘画区,右边是图片生成区,上方是文本输入栏和绘画工具栏。打开该平台后,会有一个简单的使用指南,教你如何使用文本和绘画工具生成和修饰图片。
升级版|在花了两小时体验英伟达升级版“神奇画布”后,整个人都凌乱了
文章插图
一开始,硅星人的体验还是非常顺利的,一度为AI创作出来的效果而惊叹。
硅星人首先尝试使用了简笔涂鸦转换图片的功能。目前GauGAN系统内提供了建筑、土地、景观和植物四大类别的涂鸦选择,每个大类下设置了一些子类。
硅星人以先“海山礁石”为主题来做了一幅画,分别选择了“海”、“石头”的选项,然后在画布上涂鸦画了一通。
点击生成后,左侧就立马出现了一幅跟画布上格局一样的风景画,同时还生成了落日、星空等不同种类的天空背景选项。接着,硅星人在天上画了一块云,在海上画了一颗树。左侧就立马生成了令人惊叹的云彩效果和一颗棕榈树。
升级版|在花了两小时体验英伟达升级版“神奇画布”后,整个人都凌乱了
文章插图
接着,硅星人尝试在文本区域分别尝试输入了Rainy的天气描述,令人惊喜的是,整个画面也会瞬间变成阴雨天。
升级版|在花了两小时体验英伟达升级版“神奇画布”后,整个人都凌乱了
文章插图
在体验了涂鸦功能后,硅星人也单独尝试了此次重点更新的文本输入功能。
在输入“Endless tall mountains in a sunny day(晴天下连绵的高山)”之后,左侧立刻就生成了符合文本描述的景象。
升级版|在花了两小时体验英伟达升级版“神奇画布”后,整个人都凌乱了
文章插图
自此,硅星人的整个体验都处于“哇”的状态。但就在硅星人准备将GauGAN称之为魔法之时,随着更多的尝试,画风开始逐渐走偏。
AI也有翻车的时候在按照英伟达给出的范例、测试了最简单的转换之后,硅星人尝试按照自己的想法,输入比描述性短句更加复杂的文本。而这时,返回的作品就开始凌乱了。
当硅星人在文本框输入“一座坐落在宁静湖边的房子(A house near the peaceful lake)”时,系统并没有返回正常的湖泊或者房子的图像,而是呈现了一些非常抽象的图。
升级版|在花了两小时体验英伟达升级版“神奇画布”后,整个人都凌乱了
文章插图
这是啥?黑暗城堡、长在天上的树,还是云端的战舰?怎么看都跟湖边小屋没啥关系。
此外,硅星人还发现,目前GauGAN 2的文本识别好像是只局限在建筑、土地、景观和植物这四大类之中。比如,当我们输入“一顿感恩节火鸡大餐(A Thanksgiving turkey dinner)”时,系统返回的图像仿佛是什么外星来物,跟火鸡、甚至晚餐根本都不沾边。
升级版|在花了两小时体验英伟达升级版“神奇画布”后,整个人都凌乱了
文章插图
输入单词“沙发(Sofa)”时,返回来的图是这样的。如果有人看懂了这跟沙发之间的关系,麻烦留言解释一下。
升级版|在花了两小时体验英伟达升级版“神奇画布”后,整个人都凌乱了
文章插图
输入单词“圣诞树(Chritmas tree)”时,返回的图片是这样的。感觉不像是圣诞树,倒有点中国春节灯会的感觉。
升级版|在花了两小时体验英伟达升级版“神奇画布”后,整个人都凌乱了
文章插图
而除了文本转换,涂鸦模式也在接下来的体验中屡屡翻车。比如硅星人想画一个“小河边一座房子,房旁立着一颗树”的情景,在使用各种类别的画笔在画不上画出布局之后,生成的图像里就没有小河,画风也非常诡异,完全跟想要呈现的宁静画面大相径庭。

推荐阅读