「赛博收藏卡 / 数字交易卡 / Holo 玻璃拟态卡牌」这类视觉最近很容易被保存、转发:
最近很容易出圈的一类内容是「同一个符号,做 6 种材质风格」:
最近很容易被保存的一类图,是「电影感分镜/九宫格 contact sheet」:
用 Midjourney 生成图片的时候,你写一段提示词就行。用 Sora 生成视频,也是一段提示词。
忘了那些魔法咒语吧。Seedance 不吃"8k, best quality, masterpiece"那一套。
忘了那些魔法咒语吧。Seedance 不吃“8k, best quality, masterpiece”那一套。
用文字描述"改图里的哪个位置"这件事,有时候很麻烦。
用 Stable Diffusion 养成的习惯正在坑你。
很多系统一开始做 Prompt 缓存,出发点都很直接:希望少发一些重复内容,把调用成本压下来。
很多团队开始做 Prompt 缓存时,第一反应都是把整段输入缓存起来。这当然能做,但如果系统已经进入正式业务,直接缓存整段 prompt 往往不会是效果最稳的方案。
很多团队一说缓存,第一反应就是 prompt。可系统真跑起来之后,很多账单问题并不是出在用户那句话,而是出在前面那一大段背景。
很多团队一提到长上下文,第一反应都是模型能不能扛住、窗口够不够大、一次能塞多少内容。
一开始做 Prompt 缓存时,很多人的直觉都很像:哪一段最像“用户输入”,就优先缓存哪一段。
很多团队一提缓存,第一反应还是 Prompt 缓存。这个方向没问题,但如果系统已经进入真实业务,直接围着整段 prompt 打转,往往不够稳定。
过去大家聊大模型缓存,更多会把它当成一个优化技巧。能省一点 token,能少发一点内容,看起来就已经有价值了。
很多团队一开始做缓存,直觉都很像:既然大模型调用贵,那就把 prompt 缓起来,能省一点是一点。
Prompt 缓存怎么设计?很多团队第一反应都是把整段 prompt 缓起来,但真跑到业务里,命中率往往没有想象中高。
缓存这件事,听起来很像一个天然正确的动作。既然模型调用贵,那把 prompt 缓起来,不就应该能把钱省下来吗?
我一开始看大模型缓存,也很容易把注意力放在 prompt 本身。
企业一旦开始正式用大模型,缓存几乎迟早都会被提上来。因为只要请求量起来,重复发送的上下文和背景内容就会慢慢变成一笔很实在的成本。