请先登录以管理你的Prompts

搞定Nano Banana,用这份提示词框架

Gemini
Nano Banana

Key Takeaway

  • Nano Banana优势:Google图像生成模型,指令遵循性极强,提供“言出法随”体验;但多数用户描述随缘,导致不确定性。
  • 提示词框架:JSON结构化9部分(shot主体镜头、subject主体细节、environment环境、lighting光线、camera拍摄、color_grade色彩、style风格、quality质量、negatives排除),提升可控性/效率,适合生产。
  • 填充方法:用AI从参考图片提取描述填框架(分别针对各部分,拼装调整);简单规避玄学,可调整用于视频生成,社群专视频介绍。

如果你在用Google的Nano banana生图,那本期视频一定要看完。我会给你一套提示词框架。它是完全结构化、模块化的。你使用它,生图的可控性还有效率绝对会极大提升!

Nano banana是Google的图像生成模型。推出之后,火遍全球。我很少用“炸裂”之类的形容词。但是,Google这根香蕉是真的“炸裂”。它的指令遵循性实在太好了,给人一种“言出法随”的成就感。

可惜的是,绝大多数人在下达指令的时候,还处于随缘的状态。有的地方描述很详细,有的地方却有遗漏了。这个就带来很大的不确定性。而在生产环境中,我们最忌讳的就是这种不确定性。

那么,我的这套提示词框架就是要解决这个问题。举个例子,要生成这样的图片,该怎么描述呢?这是我的提示词。它采用JSON格式,包含了九个部分。

第一,shot。它定义了整个镜头是什么样的。比如,这是一个微距特写镜头,采用居中构图。

第二,subject。它定义了画面中的主体。这个主体可以是人,也可以是物。比如,这是一款奢华的男士腕表。它的表壳是不锈钢抛光的。它的表盘是白色的。

如果主体是物体,那么可以使用materials、details等细项进行描述。如果主体是人物,可以使用age、appearance、pose等细项进行描述。

第三,environment。它定义了主体所处的环境是什么样的。比如,手表放在一块什么样的石板上。背景是什么样的。

第四,lighting。它定义了光线是什么样的。比如是自然光,还是影棚里的灯光。光线从什么角度照过来。是锐利的,还是柔和的。

第五,camera。它定义了拍摄的信息。比如,使用多少毫米的镜头,多大的光圈,从什么角度拍。

第六,color_grade。它定义了画面的色彩风格。比如,对比度要高,饱和度可以低一点点。

第七,style。它定义了画面的风格。比如,超写实CGI渲染。

第八,quality。它定义了画面的质量水平。比如,我们需要8K分辨率,有着完美的材质着色器。

第九,negatives。它定义了我们不希望出现在画面中的内容。比如,我们不喜欢有品牌的Logo出现,也不要出现手。这个非常关键。如果你不交代的话,很可能AI会自作主张加上去。

你看,这套提示词,虽然它也是用自然语言进行描述,但是它采用了JSON的结构,并且分成了九个部分去定义。有了这样的框架,AI就能清楚地知道你脑子里的图像究竟长什么样。

只要你定义得足够清晰,把它拿去多次生成,出来的结果都大差不差。这样的东西才能拿到生产环境中去使用。

另一方面,这套框架对你来说也是一个规范。当你构思的时候,就别想到哪是哪,而是规规矩矩地去填空,把每一部分都想清楚。

那么问题来了:框架是有了,但是里边的细节,我真的不知道该怎么表达,怎么办?

很简单:让AI帮你抄呗。

你先去找图。比如这张图片,除了主体之外,其它的东西都是你想要的。那么就把图片和提示词框架一起给到AI,让它帮你填空。然后,你只需要把其中的主体部分替换掉就行。

用这种方法,你可以按照框架里的前八个部分分别去找对标的图片,比如你想要的环境、你想要的光线、你想要的风格。然后分别让AI帮你生成对应的描述。最后你只需要把它们拼装起来,做一些调整就搞定了。

就这么简单。完全没必要搞得那么玄学。这个是图像生成。其实视频生成也差不多。在这套框架上做一些调整就可以了。回头我出社群专属视频介绍吧。

OK,以上就是本期内容。想了解AI,想成为超级个体,想找到志同道合的人,就来我们newtype社群。那咱们下期见!