谷歌Parti生成器依靠200亿参数将文本转成栩栩如生的图像
(来自:GoogleParti)
据悉,Parti 全称为“Pathways Autoregressive Text-to-Image”(路径自回归文本转图像)。随着可使用参数数量的增长,其输出的图像也能够更加逼真。
本例中,Parti 在生成最终图像之前,已经研究了 200 亿量级的参数。相比之下,Imagen 是 Google 设计用于扩散学习的文本转图像生成器。
工作期间,它会通过向图像添加“噪声”来训练计算机模型,让它初步生成模糊的静态图像,然后模型会通过学习来尝试解码静态图像。
随着模型的改进,系统可以将一系列随机点,逐渐变成我们最终看到的栩栩如生的重新生成图像。
最后,除了 Parti 和 Imagen,我们还有听说过其它文本转图像模型 —— 比如 Dall-E、VQ-GAN+CLIP 和 Latent Diffusion Models 。
转载声明:本文为转载发布,仅代表原作者或原平台态度,不代表我方观点。今日澳洲仅提供信息发布平台,文章或有适当删改。对转载有异议和删稿要求的原著方,可联络content@sydneytoday.com。
相关新闻
今日评论
网友评论仅供其表达个人看法,并不表明网站立场。
最新评论(0)
暂无评论
热评新闻