科普|关于AIGC的十问十答

转载
687 天前
2329
国盛区块链研究院

文章转载来源:国盛区块链研究院

图片来源:由无界版图AI工具生成

关于AIGC的十问十答

1、AIGC是什么?

AIGC(Artificial Inteligence Generated Content),指的是通过人工智能技术自动生成内容的生产方式。

2、AIGC能生成什么?

AIGC目前的范围包括绘画、文字、音频、视频。主要的创作内容形式都可由AI生成,更长远来看包括虚拟人行为与思维、游戏剧情与NPC交互等数字世界的绝大部分内容都可由AI生成,我们把AIGC看做面向Web3时代的生产力工具。

3、AIGC如何实现?

AIGC领域的技术包含了:生成对抗网络(GAN)、变微分自动编码器(VAE)、标准化流模型(NFs)、自回归模型(AR)、能量模型和扩散模型(Diffusion Model)。总体趋势来看,大模型、大数据、大算力是未来的发展方向。

目前两个常用的模型是【生成对抗网络GAN】和【扩散模型Diffusion Model】,算法模型的突破是近年来AIGC得以快速突破的催化剂。这两种模型的实现原理如下:

1)对抗式生成网络GAN

GAN,是一种深度神经网络架构,由一个生成网络和一个判别网络组成。生成网络产生“假”数据,并试图欺骗判别网络;判别网络对生成数据进行真伪鉴别,试图正确识别所有“假”数据。在训练迭代的过程中,两个网络持续地进化和对抗,直到达到平衡状态,判别网络无法再识别“假”数据,训练结束。

GAN模型的生成基于生成期和判别期的,这会导致也是可以做这个创作,但创作之后不确定性非常强,可能生成了一张图,但是不是你想要的就很难说。另外,更多是在一个生成,一个判别,是对原始图的模仿做的,这一块会导致生成的图像质量分别率比较差的。因此主要用于AI实验室,而更常见于商业应用的扩散模型。

2)扩散模型Diffusion Model

扩散模型的生成逻辑相比其他的模型更接近人的思维模式,也是为什么近期 AIGC拥有了开放性的创造力。本质上,扩散模型的工作原理是通过连续添加高斯噪声来破坏训练数据,然后通过反转这个噪声过程来学习恢复数据。训练后,我们可以通过简单地将随机采样的噪声传递给学习的去噪过程来生成数据。

从更技术的角度来看,扩散模型是一个潜在变量(latentvariable)模型,通过马尔科夫链映射到潜在空间。马尔可夫链是状态空间中经过从一个状态到另一个状态的转换的随机过程,下一状态的概率分布只由当前状态决定。在这一过程中逐步添加高斯噪声来获得近似的后验概率q(