从 AI 绘画到 ChatGPT,聊聊生成式 AI

版主 又拍云 2023-3-2 887


我们小时候经常有幻想,未来不用再去上班了,在工厂工作的都是机器人。在家也不用打扫卫生,机器人可以包揽一切。不知不觉间,我们小时候的幻想已经慢慢变成现实,工厂里有了多种型号的机械臂,代替了部分流水线功能。家里也有了扫地机器人,不用再一遍一遍地扫地了。

这些技术实现的背后都有 AI 的身影,2022 年 AI 行业更是热闹非凡。2022 年 9 月,由 Midjourney 创作生成的画作《太空歌剧院》在科罗拉多州博览会数字艺术创作类比赛中获得一等奖,AI 绘画进一步破圈,受到大众关注。


△ 画作《太空歌剧院》(图片来源于互联网,侵删)



什么是生成式AI?


就在大家都认为 AI 绘画是 AI 发展的里程碑级应用,可就在短短 2 个多月后,ChatGPT 横空出世,到今年 1 月,平均每天约有 1300 万独立访客使用 ChatGPT,累计用户超 1 亿,创下了互联网最快破亿应用的纪录。而 ChatGPT 的“智慧”也再一次刷新人们对 AI 的认知。

无论是 AI 绘画,还是现在风靡全球的 ChatGPT,它们都属于 AI 的一个分支——生成式AI(Generative AI)。生成式 AI 可以通过让机器学习模型研究历史数据,并且利用先进的深度学习技术来创造一个全新生成的作品,这作品可以是一段文字、一张图片、一段音频或者是一部影片。

相较于传统的 AI 模型,生成式 AI 是一种特定类型的 AI,它专注于创建新内容。


生成式AI的简单原理


生成式 AI 的工作原理,是从大量数据中集中学习,并使用这些知识产生与训练数据相似的新数据。这通常是使用一种生成模型的机器算法来完成的,生成式模型有许多不同类型,每一种类型都使用不同的方法生成新数据。其中常见的生成模型类型包括 GAN、VAE 和回归模型。

聊这些模型之前,我们先简单说下深度学习。深度学习其实是一种模仿人脑思维过程的方法,利用多层神经网络进行学习,通过组合低层特征形成更加抽象的高层表述属性类别和特征,最后作出判断。举个例子,你要让 AI 认识一只猫,需要给它提供大量的样本学习,而 AI 在学习了大量的基础之后,建立起一个模型,来判断图片中有没有猫。要训练一个 AI 能够顺利实现对猫的识别,可能需要上百万张,甚至上千万张与猫相关的图片。
如果没有那么多的数据该怎么办呢?大家可能有听过这么个玩笑,程序员对 AI 说,“你已经是个成熟的 AI 了,应该自己生成数据,自己训练自己了。”这也就是我们前面提到过生成模型 GAN 的基本原理了。
GAN 的全称为对抗生成网络,最早是由著名的深度学习理论专家伊恩·古德费洛(IanJ.Goodfellow) 在 2014 年提出的。在原理上,生成式对抗网络使用两个神经网络相互对立,一个生成器和一个判别器。生成器或生成网络是一个神经网络,负责生成类似于源数据的新数据或内容。判别器或判别网络是负责区分源数据和生成数据之间的神经网络。这两个神经网络都经过交替周期训练,生成器不断学习生成更逼真的数据,判别器则更善于区分假数据和真实数据。
△ GAN 基本原理(图片来源于互联网,侵删)
古德费洛打了一个形象的比方:GAN 就像是构造了一个警察抓小偷的游戏。小偷不想被警察抓住,因此他需要不断揣摩警察的行为,并据此来隐藏自己是小偷这个事实。而警察则想要抓住小偷,因此他就需要不断学习小偷的伪装办法,并据此调整自己的抓捕策略。这样,经过不断地“斗法”,小偷的伪装技巧和警察的抓捕策略都可以得到大幅改善,并且这种迭代的速度会非常快。
当然,GAN 只是其中一个生成模型。以 ChatGPT 为例,GAN 难以保证回答内容的准确性。要对回答内容准确性进行验证,必须依靠人力。用户在使用 ChatGPT 的同时,其实也充当着免费 AI 训练师的角色,帮助 ChatGPT 成长。这也就为什么 OpenAI 会把 ChatGPT 放到网上让用户免费使用的原因之一。


生成式AI未来趋势


既然生成式 AI 这么强大,那么它会跟文章开头一样取代现有的一些岗位吗?针对大众普遍担心的失业问题,ChatGPT 有分享一篇帖子写到:“AI 不会取代你,一个使用 AI 的人可能会取代你。”

那生成式 AI 会在未来带来什么呢?我们来简单畅想下:
生成式 AI 可用于创造很多新内容,例如音乐、文字或者图像,为创意人员提供更多的想象力。例如,作者可以使用生成式 AI 创造的文章,对其进行编辑和完善,可以让自己更专注于需要想象力和创作的地方。这样创造出来的作品可能更上一层楼。同样,生成式 AI 可以将创作者的作品转换成任意语言,让创作者的作品一开始就在全球流行。
生成式 AI 也有可能会被应用于未来的机器人。相比较现在的机器人,未来的机器人在好看的皮囊下,提供类似于ChatGPT 这样的模型对话能力,能让未来的机器人更加聪明、智慧,更像人,也更好地陪伴、服务于人类。
生成式 AI 也有可能被应用于游戏,创建新关卡和地图,生成新的对话或故事线,以及创建新的虚拟环境等。现在已经有利用生成式 AI 来生成纹理和天空盒艺术。在未来,游戏可能会使用生成式 AI 模型为玩家每次玩游戏时创建一个全新的独特关卡,或者根据玩家的行动为 NPC 角色生成新的对话选项。它可以用来增加游戏体验的活力和多样性,让玩家感到更有吸引力和沉浸感。
现在生成式 AI 仍然非常早期,Midjourney 和 ChatGPT 让我们看到了未来的无限可能,相信在几十年后,生成式 AI 将深深融入我们的工作、创作和娱乐方式。虽然这在现在看起来仍然非常不可思议,但科技进步的速度是惊人的,上面这些遥不可及的畅想,可能用不了多少时间,就能变得触手可及。


返回