用 Telegram 发中文描述 → OpenClaw agent 翻译成英文 prompt → 本地 ComfyUI 出图,全程免费。搭了三天,踩了七个坑,记录一下。
SDXL 在 M 系列 Mac 出全黑图 → --fp32-vae 解决
DeepSeek 在 agent 框架里完全暴走,自己写脚本不按 Skill 走 → 换 Claude
Token 14 次请求烧掉 $4 → contextTokens=32000 降到 $0.07/次
agent 说"我不会画画" → workspace-painter/SOUL.md 优先级高于 agentDir(这个坑最隐蔽)
最后做了模型热切换,Gemini/GPT/Claude 一行命令切换,$0.003~$0.07/次
GitHub:https://github.com/baobaodawang-creater/visual-muse
ClawHub:visual-muse@1.4.0(直接 clawhub install visual-muse)
详细踩坑文章(掘金):https://juejin.cn/post/7619242789633835034