广州专业治疗白癜风 http://yyk.99.com.cn/baiyun/101764/ AI作画让人人都可能成为毕加索。 在过去的几个月里,黑客们通过对OpenAI模型的修改,制作出令人吃惊的图像,由人工智能生成的艺术场景已经爆炸性地发展起来。 你所要做的就是引导这些系统,通过文字提示它们。例如,你可以用文字提示它们,“在悉尼的黑人”,有了这个提示,15分钟内就生成了你看到的图像。 图片来源:abc 与之前的人工智能艺术工具不同的是,这些工具所创建的图像清晰、连贯、高分辨率。 新工具的主要引擎是一个最先进的图像分类人工智能,称为CLIP,是OpenAI公司在1月宣布的。CLIP被设计成一个有特定用途,功能性强大的工具。它是一个通用的图像分类器,可以决定图像与提示的对应程度,例如,将一个苹果的图像与“苹果”这个词相匹配。这就是全部。”看起来它和艺术没什么联系,”加州大学伯克利分校计算机科学学生查理·斯奈尔(Charlie Snell)在接受采访时说,他一直在关注这个新场景。 但在它发布后不久,像机器学习大师和工程师瑞安·默多克(Ryan Murdock)这样的黑客想出了如何将其他AI连接到CLIP上,创造一个图像发生器。默多克在接受采访时说:“在我把玩它几天后,我意识到我可以生成图像。” 在几个月里,黑客们尝试着将CLIP与越来越好的AI连接起来。3月4日,默多克成功地将CLIP和VQ-GAN连接起来。“花了很多时间来弄清楚如何让这个系统很好地工作,”默多克说。他继续完善该系统,直到它能够产生清晰的图像。现在,CLIP和VQ-GAN的组合是新工具中使用最广泛的版本。 这些工具逐渐开始流行,并产生了一个全新的、由计算机生成的艺术场景。 “这些是第一批公开可用的好东西,”斯奈尔说,“这些系统是第一批真正有点符合’实现从文本到图像’的系统。” 斯奈尔认为它们也许是自2015年DeepDream以来人工智能艺术领域最大的创新——DeepDream被广泛用于创造致幻的图像。”这绝对是我见过最大的事情,"Snell说。 以前,像VQ-GAN这样的生成工具在对大量图像进行训练后,可以合成类似的新图像,然而,GANs(类似VQ-GAN的图像处理工具)本身不能通过提示生成图像。除了GANs之外,其他种类的网络工具也可以识别人发出的文字提示,”但它们不是很好用,"斯奈尔说,"这算是一种新的方法。" 新的工具CLIP+VQ-GAN对任何想使用它们的人来说都是现成的。6月27日,Twitter用户@images_ai在Twitter上发布了计算机科学家凯瑟琳·克罗森(Katherine Crowson)关于如何使用其中一个最新模型的热门教程。按照说明,一个用户可以在几分钟内运行该系统。 推特用户生成的图片,来源:ABC 克罗森在一封电子邮件中说:“结果是如此令人震惊,以至于对许多人来说,它们似乎是难以置信的。”CLIP在4亿个图像/文本上进行训练,她说,“在这种规模下,我们开始看到以前只在人类艺术家身上看到的能力,如抽象,或者对实体的艺术加工。” 网络上已经有了数量可观的令人惊叹的作品。有抽象的美丽的落日,有田园牧歌式的乡村房屋,以及巨型城市。有令人不安的武器,有的则是埃舍尔式的结构,这些图像都从中心向外扭曲。 图片来源:vice 人们已经被这些工具的作画能力所吸引,艺术家们也已经开始广泛采用它们。”默多克说:“在机器学习和艺术推特上,他们已经成了不能忽视的存在。” “那些机器学习和艺术大师们不断尝试新的调整,试图让它变得更好,”斯奈尔说,“而且它正在变得更好。每周感觉他们都有一些改进。” 新工具确实有局限性,例如其生成图像的大小。但是,制作图像的工具能够被建立起来本身就是一个惊喜。 基于CLIP的模型是一种全新的艺术工具,一种新的计算机画笔。斯奈尔指出,工程师们还觉得这不算是一个完美的工具,“作图最让人惊讶的部分是,它并不总是受你思想控制和影响。” 但是,这种类似人类的独创性是新工具吸引力的一个重要部分。 它们会产生什么样的影响,还有待观察。目前,CLIP+VQ-GAN主要由黑客们制作和完善,功能强大,但公司和合作机构依然很容易改进这些工具。更多的人可以用CLIP+VQ-GAN进行工作,娱乐,甚至艺术创作——现在,它已经变得像说话一样简单,任何人都能成为毕加索。 ![]() |
![]() 鲜花 |
![]() 握手 |
![]() 雷人 |
![]() 路过 |
![]() 鸡蛋 |
分享
邀请