一、背景 最近 AI 创作内容火爆网络,让我们看到 AI 在设计上充满想象力的未来。关于 AI 在设计上应用的探索由来已久,从早几年的智能广告素材,智能 Logo 再到如今的 AIGC ,AI 的成长突飞猛进。本文尝试梳理 AI 目前在设计领域应用的最新进展,展望设计行业在 AI 技术影响下可能发生的变革。
更多AI落地干货:
8大实战案例!AIGC在网易落地项目中的运用 AIGC 全称 AI Generated Content,是利用人工智能技术来生成内容,AIGC 绘画属于 AIGC 的分支。
阅读文章 >
二、AI 与设计相关的最新技术 1. 自动化内容生成(AIGC)
从文本-图像、文本-视频、文本-3D 模型到智能字体、智能文本,AI 在各类内容的创造上已经突飞猛进,强大到让人惊叹地步。
① 文本-图像技术
近一两年以来,各大平台推出的 AI 绘画工具,用户只要通过简单学习,输入文本,进行关键词调教,即可生产各种风格的画作。关于文本-图像的原理可粗略分为文本理解和图像生成两个部分,目前主流的 AI 绘画工具,文本理解部分大多基于 CLIP 模型,图像生成部分大多基于 Diffusion 模型。相较之前的技术,AI 在关键词理解和生成画作的多元性有了大幅提升。下边简要为大家介绍最受欢迎、效果也最出色的 4 款 AI 绘画工具的特色,关于每种工具使用教程以及如何生成高质量作品,大家可以自行研究。
Disco Diffusion
Disco Diffusion 是发布于 Google Colab 平台的一款开源免费的绘画工具,可以在 Google Drive 直接运行,也可以部署到本地。Disco Diffusion 在生成图前需要完成一些基本参数设置,好处是可以按定制方式生成图片,缺点是交互不如其他几个工具便捷,操作较为复杂,生成时间也比较长。Disco Diffusion 擅长抽象氛围图,色彩华丽丰富,但在人像生成上效果不太理想。
描述“A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and thomas kinkade, Trending on artstation.”
图片来源:@x1ao4,关键词 ”ancient Chinese village“
Midjourney
Midjourney 是一款部署在 Discord 上的绘画工具,需申请测试资格,在收到邀约邮件后,加入 Discord 频道,即可通过关键词输入完成绘画。它的优点在于操作非常简单,用户仅需通过关键词输入即可完成作画,不用设置其他参数。它支持在生成图片后,在已生成图片基础上进行调整。初次加入会赠送免费体验资格,额度用完以后就需要按月/年付费完成绘画。
Midjourney 对关键词理解出色,无论出图速度和完整度都优于 Disco Diffusion,而且它对各类艺术风格模仿较为出色,通过设定风格,可以有帮助 AI 更好理解你想要的画作效果。
来自 Midjourney 的一组对知名艺术家风格模仿的画作
最近发布的 V5 版本在细节上又提升一步,写实效果堪比照片,同时支持更多风格选择,也解决了之前 AI 手部表达错乱问题。
AIGC神器 Midjourney V5 强势更新!逼真到令人发指! 大家好,这里是和你们一起探索 AI 绘画的花生~ 备受期待的 Midjourney V5 在上周四终于上线了,而且一发布就引起了不小的轰动,因此这次 V5 模型的图像生成效果“太惊人了”,无限逼近真实照片,让人难辨真假。
阅读文章 >
DALL-E 2
Dall-E2 是由 OpenAI 实验室发布的,目前也处于内测阶段,可在官网上申请体验,但开放体验资格有限。注册后首次会免费获赠生成机会,额度用完后需要按次付费生成。它不仅操作简单,而且可控性比较强,但目前图片比例是固定 1:1 方图。DALL-E2 可以根据描述生成一幅画,如果对图效果不满意,可以针对该图生成 3 张新的图片。而且如果对图片局部不满意,它可以支持选择不满意部分,单独设置关键词后再生成。此外,它还可以根据描述对现有图像进行编辑,以及按给定原图生成同一风格的不同画像。
按描述“一个宇航员+骑马+超现实风格”生成的画
按描述“选一个位置加一只火烈鸟”生成的画
根据戴珍珠耳环的少女风格生成的画
Stable Diffusion
Stable Diffusion 是开源免费的,使用起来相当亲民。使用渠道多样,可以在官网、Google Colab、本地部署等方式使用,官网会默认给你点数,生成图消耗点数,消耗完成需要充值使用,但通过 Google Colab 或本地部署基本可以不受数量限制。它可控参数丰富,功能齐全,满足各种个性化需求,因此使用范围最广。而且 Stable Diffusion 支持插件,很多第三方在源代码基础上进行了 2 次开发,比如有的团队就发布程序,让用户可以使用自己提供的图像训练 Stable Diffusion,形成个性化数据模型,生成带有自己风格的图像。Stable Diffusion 在抽象的氛围感上可能不如 Disco 和 Midjourney 出色,但它的想象力和创作力非常丰富,风格多样,人物写实。
超详细!外婆都能看懂的Stable Diffusion入门教程 一、前言 上次发的 Midjourney 教程《奶奶看了都会的 Midjourney 入门教程!
阅读文章 >
Stable Diffusion 官网示例图
AI 绘画工具吸引了大量用户进行尝试,他们形成了各自的社区,彼此分享作品、交流创作过程。虽然很多时候 AI 画作效果不错,但目前仍有一些待解决问题:
生成的结果会有一些随机性,无法按照严格需求的方式生产; 关键词描述对最终效果影响较大,对关键词的描述技巧需要慢慢摸索; 如果对内容一致性要求比较高的话,需要对模型进行训练,有一定的技术挑战。 ② 文本-3D 模型技术
在 Text-Image 技术基础上,各大科技巨头都纷纷入局尝试 Text-3D 技术,目前公开了研究论文和初步效果的技术主要有:Google 推出的 DreamFusion、NVIDIA 的 GET3D、Meta 的 MAV3D,还有 OpenAI 的 Point-E。这项技术还处在初期发展阶段,有很多不完善的地方,比如缺乏几何细节、缺乏纹理,在合成过程智能使用神经渲染器,3D 软件没法通用等问题。还有一个普遍的缺点,就是生成速度缓慢,生成单个 3D 模型的常常需要数个小时。而 OpenAI 推出的 Point-E 仅需几秒到几分钟就能产出一个 3D 模型。英伟达的 AI 科学家 Jim Fan 在推特上表示,Point-E 的生成速度约能达到 DreamFusion 的 600 倍。
OpenAI 生成的 3D 模型
DreamFusion 可以在任意角度、任意光照条件、任意三维环境中基于给定的文本提示生成模型
③ 文本-视频技术
文本生成视频技术也是建立在文本图片技术基础之上,它主要是通过文本图像对和无文本视频来学习,根据文本理解生成几个关键帧。建立插帧模型,基于关键帧补充关键帧之间的图片,提高视频流畅度。最后再进行每帧分辨率的提升,提高整体的视频质量。AI 在文本生成视频的技术相对较新,Meta/Google 在去年 10 月分别官宣对应的视频生成器 Make-a-video/Imagen Video,目前只公开了研究论文和几个官网示例,但得益于文本图片质量的飞速提升,可以预期很快图片视频技术也将大幅提升能力。
Google Imagen Video 生成“一个开车的熊猫”
虽然目前通过文本生成视频技术只能生成简单的变化或动作、无法生成基于文本描述的细节以及多场景复杂故事的视频。但通过 AI 对视频内容进行智能处理技术,已经有很多让人惊艳效果,这部分在本文第 2 章节详细展开介绍。
④ 智能字体
日本筑波大学开发了一套以人工智能为基础的汉字字型设计系统,可以让原本需要人工设计上万字的流程,缩短为只要完成五个手工汉字的设计,AI 就可以自动生产超过 14,000 个相同字体的汉字。
该系统通过学习大量已有字体,再从这几个手工设计的字体范例中提取特征,通过调整参数值输出为新的字型。而且它使用的是矢量图,可以将其输出为字体文件,让字体制作所需的时间大大缩短。
2. AI 特效及内容处理
① AI 视频特效
视频风格化
在线视频编辑网站 Runway 于最近发布了 AI 视频处理工具 Gen-2,该工具针对视频处理的能力很强大,不仅可以通过文本、文本+图片、图片生成视频,还可以对视频进行各种风格化处理,比如只需要把你想要叠加的风格用图片或者文字叠加上去,可很快按要求生成风格化的视频。
原视频通过添加一张驱动图像即可生成风格化视频
智能 CG 角色替换
由《头号玩家》主演 Tye Sheridan 创立公司推出的 Wonder Studio 是一个可以为上传的 CG 模型自动制作动画、HDR 打光、合并到真人场景的 AI 工具。
② AI 图形特效
智能编辑
Adobe 最近发布了 AI 编辑工具 Firefly,虽然目前可体验功能仅有图片生成、文字效果 2 项功能。但根据介绍来看它具有强大的图片编辑能力,包含随手涂鸦作画、上传草图即可生成矢量字体文件、一键修改画面场景、关键词生成设计模板等等能力;
当视频无法加载时请刷新页面, 或前往PC获得最佳体验。
智能生成
NVIDIA Canvas 早于 Adobe 发布了自家的涂鸦出图能力,帮助 设计师 加快概念图创作探索,并腾出更多时间进行创意表达。用户通过调色板绘制简单的形状和线条,AI 模型会在屏幕上实时呈现出与之相呼应的风景图像。用户可以通过切换材质来自定义图像效果,Canvas 提供 9 种风格的可视化效果和 20 种不同材质,比如将雪地改为草地,图像将呈现从冬日仙境变为热带天堂的视觉感受。
当视频无法加载时请刷新页面, 或前往PC获得最佳体验。
③ AI 辅助 UI 设计
AI 生成 UI 版式
近期已经有团队开始实践在 AI 辅助下的 UI 设计。比如 Habitable 开发的 Figma 插件“AI designer”,在展示视频里,它可以通过一段描述生成复杂的页面。
AI 生成内容素材
Microsoft Designer 是一款智能生成图文内容的设计工具,搭载 Dall-E2,根据用户输入文字指令,可以为用户自动生成设计素材,如社群贴图、营销 Banner 等高质量的排版。
当视频无法加载时请刷新页面, 或前往PC获得最佳体验。
3. 塑造虚拟人
虚拟人是近年很火的领域,虚拟人应用前景广阔,如虚拟偶像、助手、主持人等等,是未来虚拟世界最重要的存在之一。如何塑造虚拟人的人格化特征,实现虚拟人功能,背后都依托的是 AI 技术的加持。
在虚幻引擎最新发布会上,发布了 MetaHuman 新功能 Animator。它可以让你使用 iPhone 或立体头戴式摄像机(HMC)在 MetaHuman 角色上以高保真动画的形式重现任何面部表演。有了它,你就能捕捉到演员表演中的个性、真实感和保真度,将每个细节和微妙变化转移到任意 MetaHuman 身上,在虚幻引擎中为他们注入生命力。
当视频无法加载时请刷新页面, 或前往PC获得最佳体验。
三、AI 对设计的价值 1. 助力设计师表达创意
设计师可以将 AI 工具应用在工作中,比如当需要探索视觉概念时,可以使用简单的文本说明生成一些素材供创意师提供灵感和参考;还可以借助 AI 将已有素材尝试其他不同风格元素,探索可能性;再有就是利用一些 AI 图形处理工具,快速生成系列内容比较筛选。
比如,数码艺术家 Karen X Cheng 和时尚杂志《Cosmopolitan》团队一起创造了首个由 AI 生成的艺术封面。虽然渲染这张图片只用了 20 秒,但团队为了达到更满意的效果,将大量时间投入到创意方向的讨论和关键词的挑选与组合上,他们尝试输入了数百次创意关键字组合进行调试,最终找到了想要的效果。
使用提示词 “a strong female president astronaut warrior walking on the planet Mars, digital art synthwave.”生成的几组图像
使用提示词 “wide-angle shot from below of a female astronaut with an athletic feminine body walking with swagger toward camera on Mars in an infinite universe, synthwave digital art.” 生成的最终封面效果,
2. 提供更新颖的营销方式
AI 如今也成为广告营销领域必不可少的工具,通过 AIGC 或 AI 内容编辑功能,来实现营销内容的个性化、可互动性等特征,来强化产品吸引力,提升品牌形象。
亨氏 AI 番茄酱
番茄酱品牌亨氏 Heinz 去年借助 AI 自动生成图像的话题制作了趣味性的广告,向广大消费者证明了人工智能更喜欢亨氏番茄酱的事实。广告中,亨氏利用 Dall-E2,输入“蕃茄酱”后,AI 自动生成了一款有亨氏经典外型包装的番茄酱。当继续输入“文艺复兴番茄酱”、“印象派番茄酱”、“外太空番茄酱”等更复杂的文字指令时,生成的图像结果无论在风格上如何变化,所呈现的番茄酱外型和 LOGO 位置都与亨氏番茄酱极为相似,这也印证了广告中的那句话:“连 AI 都认为番茄酱就是亨氏”。同时,亨氏还邀请了世界各地的粉丝参与到用 AI 创作番茄酱的活动中,粉丝们通过输入各种词汇,生成怪异、有趣的番茄酱图像,并发布到网络,亨氏将其中较为出色的案例分享到了官方社交平台,利用 AI 生成视觉效果的热点,成功帮助品牌进行了推广传播。
QQ 音乐 MUSE AI 具像化歌曲海报
AIGC 已经遍布 QQ 音乐的各处细节中,从听歌体验、视觉呈现、社交分享等多个维度,做了不少有趣的创新尝试。与以往的歌曲专辑封面播放不同,QQ 音乐新上线的 AI 播放器是国内音乐行业首个在 AIGC 领域运用的视觉尝试,其原理是通过在 AI 工具输入关键词,让 AI 算法组合各种元素,生成有创意的播放器风格。现在,QQ 音乐已推出机械装甲、雪山白、积木游戏、工业灰等 6 款供用户选择,据悉还将结合场景,有更多样式可以期待。
当视频无法加载时请刷新页面, 或前往PC获得最佳体验。
3. 扩展品牌语言
设计师可以寻找更具创造性的方式与 AI 合作,比如创作品牌语言。杰西卡·沃尔什 (Jessica Walsh) 使用 AI 为虚拟核能影响者 Isodope 创建品牌语言,将核能重新塑造为一种向善的力量。Isodope 是巴西模特伊莎贝尔·博梅克 (Isabelle Boemeke) 创建的在线角色,目标是利用 Isodope 超凡脱俗的形象和创意风格在 TikTok 上吸引人们的注意力,来改变人们对核能争议的看法,倡导将核能作为解决气候变化和能源紧缺的手段。
Isodope 的品牌元素和排版完全由 AI 打造,Walsh 团队将创意想法通过 DALL-E,创造出一种全息插画风格的品牌语言,通过易于分解的视觉元素和前卫的风格表达来缓解人们对核的恐惧,Walsh 说:“你必须推动这个工具并学习如何与它对话,才能产生更复杂、更有趣、感觉更原始的东西。” DALL·E 还帮助品牌创建了各色贴纸,以便于创建社交资产。借助 AI 使 Isodope 团队围绕核能概念扩展和创造更多的品牌元素。
4. 打造全新的交互方式
依赖于 AI 支撑的虚拟人和 Chatgpt 能力,未来人们面向虚拟世界的交互模式将由原来的文本、图片、视频等内容升级为拟人化的互动方式。这将大大提升虚拟产品互动的友好性,同时提升用户对虚拟产品的情感链接。
日本便利店巨头罗森(Lawson)在东京开设首家配备虚拟店员的“Green Lawson”门店。接待顾客的为显示屏上的虚拟店员,一项研究数据表明,它通过线上发放优惠券领取率是 10%,通过人发领取率为 70%,而通过虚拟人发领取率为 57%,可见未来这种交互方式在商业领域的广阔前景。
四、总结 很多人看到 AI 的发展现状,不免担心 AI 未来会在很多方面取代设计师。事实上大可不必如此看待问题,AI 虽然在图像生成、图像编辑和插图排版等方面有着让人赞叹的效果。但就目前来看,它的内容生成还存在很多问题。即时 AI 在将来内容生成上已经炉火纯青,在情感表达、创意等很多方面,AI 还需要人的调教和指导才能产生很好的价值。
得益于 AI 在设计领域的快速发展,人工智能势必会大大简化设计师的工作,提升设计师处理各种图像的效率。设计师也不必将时间浪费在去除背景等费力、重复的任务上,并且将有机会以最少的努力探索更多创意。学习和研究 AI 在设计上最新的能力,将这种能力找到一个很好的契合点,应用在项目中,必将为为项目带来不一样的亮色。
参考文献:
AI 艺术的背后:详解文本生成图像模型 | 集智俱乐部 极市开发者平台-计算机视觉算法开发落地平台 如何通俗理解扩散模型?- 知乎 一起用 AI | AI 工具导航 | AI 教程 | AI 集合 | OpenAI 建模师也危险了?OpenAI 公布 Point-E,AI 迈出“生成 3D 模型”第一步 | 游戏大观 | GameLook.com.cn 欢迎关注作者微信公众号:「腾讯ISUX」