AI 绘画核心逻辑:文字提示词→模型渲染图片,分为网页一键工具(普通人)、本地开源模型(创作者 / 开发者)两大路线。
一、零基础网页在线 AI 绘画(不用显卡、安装)
国内平台(中文友好、合规、适合国风 / 人像)
- 文心一格百度出品,国风、插画、写实、海报都强,中文理解最好,免费额度充足,商用版权清晰。
- 通义万相阿里,擅长人像写真、商品图、场景大片,支持图生图、扩图、局部重绘。
- 即梦 AI、醒图 AI 绘画手机 APP 端,适合自拍转漫画、古风头像、短视频配图,操作极简。
- Muse AI(字节)二次元、动漫、氛围感插画效果突出。
海外平台(艺术质感更强,适合概念设计)
- Midjourney(MJ)综合天花板,电影质感、厚涂、科幻、油画效果顶尖,依托 Discord,付费订阅。
- DALL·E 3OpenAI,文字匹配度极高,复杂描述也能精准还原,适合创意插画。
- Stable Diffusion WebUI 在线版第三方云端站点,免费,自由度高,可装各类模型。
基础操作通用步骤
- 明确需求:画风、主体、构图、光影、尺寸
- 写正向提示词(要什么)+ 反向提示词(不要瑕疵)
- 设置参数:尺寸、步数、采样器、CFG 引导强度
- 生成多版,挑选优质图放大、局部修改
万能提示词模板(直接复制)
正向(人像示例)日系少女,白色连衣裙,海边黄昏,柔光,胶片质感,8k,超高清,细节丰富,发丝清晰,浅景深,电影镜头反向(通用避坑)模糊,低分辨率,畸形手脚,多余手指,水印,文字,扭曲,色差,噪点,丑陋
二、本地部署 Stable Diffusion(免费无限制、高度自定义)
适合:批量出图、商用、专属模型、无网络限制
硬件最低要求
- 显卡:N 卡 RTX 3060 6G 显存起步;AMD 显卡可用但兼容性差
- 内存:16G 及以上,系统 Windows10/11
核心组件
- WebUI 界面:操作可视化,主流 AUTOMATIC1111
- 大底模型(Checkpoint)
- Realistic Vision:写实真人
- Counterfeit/V5:二次元动漫
- Deliberate:通用艺术插画
- LoRA 小模型:专项风格 / 人物 / 服饰,体积小,精准控画面
- ControlNet:控线稿、人体姿态、景深、构图,解决 AI 人体崩坏
本地完整流程
- 整合包一键安装(新手推荐秋叶整合包)
- 下载底模、LoRA、ControlNet 模型放入对应文件夹
- 启动 WebUI,输入提示词
- ControlNet 上传线稿 / 姿态图固定构图
- 生成、高清修复、批量导出
三、主流实用功能
- 文生图:文字直接生成全新画面
- 图生图:上传一张图,保留构图改画风、换背景
- 局部重绘 Inpaint:擦掉画面瑕疵、替换人物五官、修改背景
- 高清放大 Upscale:低分辨率小图无损变 8K 大图
- 扩图 Outpaint:延伸画面边界,补充背景
- ControlNet 骨骼控制:彻底避免人物肢体畸形
四、新手避坑要点
- 中文模型优先国内平台,MJ 外文描述更稳定
- 人像必加反向词,搭配 ControlNet 姿态线稿,防止五官、手脚崩坏
- 不要一次性拉满分辨率,先生成小图再放大,减少显存爆炸
- 商用务必查看平台版权:国内正规平台大多可商用,Midjourney 免费版限制商用
- 二次元多用 LoRA 提升画风辨识度,写实类侧重光影、相机参数描述
五、工具选择对照表
表格
| 工具 | 门槛 | 成本 | 优势 | 适合人群 |
|---|---|---|---|---|
| 文心一格 / 通义万相 | 零门槛 | 免费额度 + 付费 | 中文强、版权合规 | 新手、电商、海报、国风 |
| Midjourney | 低 | 按月付费 | 艺术质感顶级 | 设计师、概念原画、美术爱好者 |
| 本地 SD 整合包 | 中 | 一次性硬件成本 | 完全免费、自定义拉满 | 美术从业者、批量作图 |