当AI像抽象派大师那样作画

广州专业治疗白癜风 http://yyk.99.com.cn/baiyun/101764/

AI作画让人人都可能成为毕加索。

在过去的几个月里，黑客们通过对OpenAI模型的修改，制作出令人吃惊的图像，由人工智能生成的艺术场景已经爆炸性地发展起来。

你所要做的就是引导这些系统，通过文字提示它们。例如，你可以用文字提示它们，“在悉尼的黑人”，有了这个提示，15分钟内就生成了你看到的图像。

图片来源：abc

与之前的人工智能艺术工具不同的是，这些工具所创建的图像清晰、连贯、高分辨率。

新工具的主要引擎是一个最先进的图像分类人工智能，称为CLIP，是OpenAI公司在1月宣布的。CLIP被设计成一个有特定用途，功能性强大的工具。它是一个通用的图像分类器，可以决定图像与提示的对应程度，例如，将一个苹果的图像与“苹果”这个词相匹配。这就是全部。”看起来它和艺术没什么联系，”加州大学伯克利分校计算机科学学生查理·斯奈尔（Charlie Snell）在接受采访时说，他一直在关注这个新场景。

但在它发布后不久，像机器学习大师和工程师瑞安·默多克（Ryan Murdock）这样的黑客想出了如何将其他AI连接到CLIP上，创造一个图像发生器。默多克在接受采访时说：“在我把玩它几天后，我意识到我可以生成图像。”

在几个月里，黑客们尝试着将CLIP与越来越好的AI连接起来。3月4日，默多克成功地将CLIP和VQ-GAN连接起来。“花了很多时间来弄清楚如何让这个系统很好地工作，”默多克说。他继续完善该系统，直到它能够产生清晰的图像。现在，CLIP和VQ-GAN的组合是新工具中使用最广泛的版本。

这些工具逐渐开始流行，并产生了一个全新的、由计算机生成的艺术场景。

“这些是第一批公开可用的好东西，”斯奈尔说，“这些系统是第一批真正有点符合’实现从文本到图像’的系统。”

斯奈尔认为它们也许是自2015年DeepDream以来人工智能艺术领域最大的创新——DeepDream被广泛用于创造致幻的图像。”这绝对是我见过最大的事情，"Snell说。

以前，像VQ-GAN这样的生成工具在对大量图像进行训练后，可以合成类似的新图像，然而，GANs（类似VQ-GAN的图像处理工具）本身不能通过提示生成图像。除了GANs之外，其他种类的网络工具也可以识别人发出的文字提示，”但它们不是很好用，"斯奈尔说，"这算是一种新的方法。"

新的工具CLIP+VQ-GAN对任何想使用它们的人来说都是现成的。6月27日，Twitter用户@images_ai在Twitter上发布了计算机科学家凯瑟琳·克罗森（Katherine Crowson）关于如何使用其中一个最新模型的热门教程。按照说明，一个用户可以在几分钟内运行该系统。

推特用户生成的图片，来源：ABC

克罗森在一封电子邮件中说：“结果是如此令人震惊，以至于对许多人来说，它们似乎是难以置信的。”CLIP在4亿个图像/文本上进行训练，她说，“在这种规模下，我们开始看到以前只在人类艺术家身上看到的能力，如抽象，或者对实体的艺术加工。”

网络上已经有了数量可观的令人惊叹的作品。有抽象的美丽的落日，有田园牧歌式的乡村房屋，以及巨型城市。有令人不安的武器，有的则是埃舍尔式的结构，这些图像都从中心向外扭曲。

图片来源：vice

人们已经被这些工具的作画能力所吸引，艺术家们也已经开始广泛采用它们。”默多克说：“在机器学习和艺术推特上，他们已经成了不能忽视的存在。”

“那些机器学习和艺术大师们不断尝试新的调整，试图让它变得更好，”斯奈尔说，“而且它正在变得更好。每周感觉他们都有一些改进。”

新工具确实有局限性，例如其生成图像的大小。但是，制作图像的工具能够被建立起来本身就是一个惊喜。

基于CLIP的模型是一种全新的艺术工具，一种新的计算机画笔。斯奈尔指出，工程师们还觉得这不算是一个完美的工具，“作图最让人惊讶的部分是，它并不总是受你思想控制和影响。” 但是，这种类似人类的独创性是新工具吸引力的一个重要部分。

它们会产生什么样的影响，还有待观察。目前，CLIP+VQ-GAN主要由黑客们制作和完善，功能强大，但公司和合作机构依然很容易改进这些工具。更多的人可以用CLIP+VQ-GAN进行工作，娱乐，甚至艺术创作——现在，它已经变得像说话一样简单，任何人都能成为毕加索。

鲜花

握手

雷人

路过

鸡蛋

邀请

米粒信息网

当AI像抽象派大师那样作画

最新评论(0)

微信扫描