DH
图片与数字人创作工作台

常见问题(FAQ)

說明文件

faqData:

  • question: 什么是图像一致性?怎么做到? answer: 图像一致性是指同一系列内容保持统一的人物特征、场景风格、色调和视觉语言。建议固定角色描述、色彩关键词、构图模板和输出比例。
  • question: 为什么 AI 不能按我输入的内容生成想要的图案? answer: 常见原因是提示词不够具体、关键信息缺失或语法结构混乱。建议采用“主体+场景+构图+光线+风格+限制条件”的提示词结构。
  • question: 新手从哪个流程开始最有效率? answer: 建议使用“图片定稿→音频生成/克隆→口型同步→数字人成片”的固定流程,并保留每一步可回滚版本。
  • question: 商用前必须检查什么? answer: 重点检查素材授权、肖像与声音权利、商标/著作权风险以及投放平台的 AI 内容规范。
  • question: 如何生成更高质量图片? answer: 提示词至少应覆盖景别、视角、构图、镜头、灯光五个维度,并采用逐轮单变量迭代。

TL;DR:本页整理 AI 图像生产中的高频问题与可执行解法,重点覆盖一致性、提示词、流程效率与商用合规。

AI 功能常见问题指南

什么是 FAQ 功能?

FAQ 是面向数字人、图像、音频与口型同步场景的标准问答库,用于统一团队操作口径、减少重复试错,并提升问题定位效率。

网站特色

一键传送,减少重复上传

dhlucky 支持模块间一键传送,图片或音频可直接进入后续流程,减少下载-上传的人为损耗。

提示词精选库,提升复用效率

FAQ 与提示词精选库联动,出现不稳定结果时可直接回到已验证模板进行微调。

快捷键关联模块,缩短迭代时间

从问题定位到参数调整可在多个模块间快速切换,降低操作中断成本。

实用技巧

  • 局部修改时,每轮只改一个重点,避免全图漂移。
  • 长视频建议分段制作,控制渲染风险。
  • 声音克隆优先使用 30 秒以上清晰样本。

常见问题

Q:为什么我在不同模块之间切换后结果不一致?
A:常见原因是素材版本和参数版本不同步。建议:

  • 全流程固定同一批素材;
  • 每轮只修改一个变量;
  • 记录版本号(如 image-v3 / audio-v2 / prompt-v5)。 若问题持续,请优先排查是否切换了模型版本或误用旧素材。

Q:新手先从哪个流程开始最有效率?
A:推荐固定 SOP:图片定稿 → 音频生成/克隆 → 口型同步 → 数字人成片。先锁视觉,再锁声音,最后做声画同步,返工率更低。

Q:为什么同样设置结果仍有差异?
A:生成模型具有随机性。建议固定 seed、模型版本、步数、CFG、比例和参考图权重,并采用单变量测试。

Q:商用前应先检查什么?
A:建议按清单核对:

  • 素材授权(图片/字体/音频/BGM);
  • 肖像权与声音权利;
  • 商标、著作权及近似侵权风险;
  • 平台对 AI 内容标注与来源说明要求。

Q:什么是图像一致性?怎么做到?
A:图像一致性要求同系列在人物、色彩、风格和镜头语言上保持稳定。建议建立“角色卡 + 提示词模板库”,从模板微调而非每次重写。

Q:为什么 AI 不能按我输入的内容生成我需要的图案?
A:常见是描述过泛或一次要求过多。建议结构化描述: 主体现状 + 场景位置 + 构图方式 + 光线类型 + 风格关键词 + 不变约束。

Q:市面上有哪些比较强大的生图模型?(截至2026年2月)
A:常见模型包括谷歌 Nano Banana Pro、字节 Seedream 5.0、阿里 Qwen-Image 2.0、OpenAI gpt-image 1.5、Midjourney V7。选型应按任务目标与流程整合度决定。

Q:要怎么生成理想图片?
A:建议采用“先收敛、再扩展”:

  1. 先用模板拿到可用底图;
  2. 再按单一重点逐轮微调;
  3. 每轮保存可回退版本。

Q:要生成质量更高的图片需要注意什么?
A:建议提示词至少覆盖五个维度:景别、视角、构图、镜头、灯光,并形成团队模板。

Q:图片生成的景别有哪些描述?
A:

景别 描述 适用场景
特写(Extreme Close-up) 聚焦脸部或物体细节 产品细节、情感表达
近景(Close-up) 人物胸部以上 人物特写、访谈
中景(Medium Shot) 人物膝盖以上 讲解、一般对话
全身(Full Body) 完整呈现人物 穿搭、姿态展示
远景(Wide Shot) 主体较小、背景明确 环境交代、氛围建立
超远景(Extreme Wide) 以环境为主 大场景、史诗感

Q:图片生成的构图有哪些描述?
A:

构图 描述 适用场景
三分法 主体放在九宫格交点 通用、稳定出图
黄金比例 视觉重心按 1:0.618 分配 品牌视觉、和谐构图
对称构图 上下或左右近似对称 建筑、正式形象
留白构图 大面积空白突出主体 极简风、承载文案
对角线构图 主体沿对角线布局 动感、引导视线
框架构图 前景包围主体 强化层次与空间感

Q:图片生成的视角有哪些描述?
A:

视角 描述 适用场景
平视(Eye Level) 相机与主体同高 客观、中性叙事
俯拍(High Angle) 相机高于主体向下拍 展现全貌、弱化主体
仰拍(Low Angle) 相机低于主体向上拍 强化气势、英雄感
鸟瞰(Aerial) 高空俯视 城市场景、地标展示
蚁视角(Ant's Eye) 贴近地面的低角度 张力、压迫感
POV(第一人称) 主观视角 沉浸式叙事

Q:图片生成的镜头有哪些描述?
A:

镜头 描述 适用场景
广角镜头(Wide Angle) 视野宽、透视强 风景、室内空间
标准镜头(Standard) 接近人眼视角 日常叙事、人物场景
长焦镜头(Telephoto) 压缩空间、背景虚化 人像、产品特写
微距镜头(Macro) 极近距离表现细节 珠宝、材质纹理
电影镜头(Cinematic) 浅景深与电影色调 品牌片、情绪画面
鱼眼镜头(Fish-eye) 极广角桶状变形 创意风格、趣味内容

Q:图片生成的灯光有哪些描述?
A:

灯光 描述 适用场景
自然光(Natural Light) 模拟日光/天光 日常、清新风格
体积光(Volumetric) 光束穿透空气或雾气 戏剧性、神秘感
逆光(Backlight) 主体背后打光 轮廓强化、浪漫氛围
伦勃朗光(Rembrandt) 面部三角光影 人像、艺术风格
柔光(Soft Light) 光线扩散、阴影柔和 美妆、肤质表现
顶光(Top Light) 上方照射 展示台、产品拍摄
侧光(Side Light) 侧面照射 轮廓与立体感强化

结论

通过“结构化问题 + 模板化流程 + 参数版本化管理”,FAQ 可以同时提升生产效率与内容可检索性。

相关延伸