现在处理图片的ai，可以接受自然语言指令么？

4356 15

[1 楼] lhy02 [泡菜] 4-9 20:58 比如一张白纸上只有黑色图片，拍照后，和软件说，把背景变成蓝色，但不能改变黑色部分，能不能做到？当然，所谓的黑色，其实是很多看着都一样的颜色。
[16 楼] 碧桂老鱼 [资深泡菜] 4-12 22:03 一键就能搞定的操作应该没问题，否则还不如自己弄了，就好比降噪，降多少合适还得眼睛收货，多次微调，这跟ai怎么说呢。发布自安卓客户端
[15 楼] 开山鼻祖 [禁言中] 4-12 19:40 ai不擅长修图，生（成）图ai擅长。所以ai替代不了美工师，除非弄个电影或视频不要真人。不过抖音也是真人变形美化，但也达不到lz要求。原因就是ai其实在图片上是基于素材图训练的，要对任何一张照片做修改，ai要推理，但这种推理很简单，不像图像处理软件那样精确，后者还有固定流程（一步步来，哪一步没做好还可以回退）和算法（比如去雾），因而更精确。开山鼻祖编辑于 2025-04-12 19:52
[14 楼] lhy02 [泡菜] 4-12 18:08 详细解释一下吧。类比一下各种电器的ai，实际上就是把你说的话翻译成已有功能(s)。我给的例子是处理图片软件几个操作的组合。其中选择颜色操作应该有不确定性（哪个区间范围）。如果处理图片软件有ai，就会接收自然语言后执行一系列已有功能，相当于你点了一堆菜单。这样的话就用不着知道这个处理图片软件有啥功能了。我想问的就是这个意思：现有处理图片软件能不能把自然语言翻译成已有功能(s)。
[13 楼] zhaoyx55 [泡菜] 4-11 19:46 短时间内做不了，首先考验ai对现实世界的理解，自动驾驶路上那点固定的车、标志标牌、线都识别不好，更别说整个世界那么多东西了。顶楼举的例子里颜色和语言文字怎么对应，颜色是最不好描述的，哪些颜色算黑哪些颜色算蓝不好界定 zhaoyx55 编辑于 2025-04-11 19:47
[12 楼] lhy02 [泡菜] 4-10 17:36 开山鼻祖发表于 2025-04-10 16:23 啥指令，提高画质，消除雾霾？见顶楼：比如一张白纸上只有黑色图片，拍照后，和软件说，把背景变成蓝色，但不能改变黑色部分，能不能做到？
[11 楼] 开山鼻祖 [禁言中] 4-10 16:23 啥指令，提高画质，消除雾霾？
[10 楼] lhy02 [泡菜] 4-10 14:16 arondes 发表于 2025-04-10 13:21 就是不能完全按照你要求的指令去做而且生成的照片质量较低这方面还是得看Adobe 一般的大模型厂商不了解我们拍照爱好者的需求比如你上传一个照片让他解读exif 你会发现很多都做不到因为他是把照片压缩了以后再传给服务器的输入就不是原片我问的目的就是看处理图片的软件的ai到哪个程度了。比如adobe的ai，我楼顶给的例子，会干的咋样 lhy02 编辑于 2025-04-10 14:17
[9 楼] arondes [陈年泡菜] 4-10 13:21 lhy02 发表于 2025-04-10 09:15 不完善是肯定的，但怎么个不完善法呢？最怕的是貌似完成任务实际上埋坑（比如楼顶的例子，背景确实成蓝的了，但原来黑色图片也有小幅更改）。就是不能完全按照你要求的指令去做而且生成的照片质量较低这方面还是得看Adobe 一般的大模型厂商不了解我们拍照爱好者的需求比如你上传一个照片让他解读exif 你会发现很多都做不到因为他是把照片压缩了以后再传给服务器的输入就不是原片
[8 楼] Bohnenkaffee [陈年泡菜] 4-10 11:07 想做的好应该会很费力，训练阶段吧？发布自 iOS客户端
[7 楼] lhy02 [泡菜] 4-10 10:39 duoduobear 发表于 2025-04-10 10:37 有的。谷家刚发布不久一个AI在线工具。上载图片后，就可以用自然语言要求它修图。比如“加一顶帽子”，“背景换成蓝天”，“左边的人去掉”，“ 帽子上加文字‘色影无忌’”等。现在网上有不少视频介绍这个。我还没有实际测试。这种知道，属于很宏观的处理。我给的例子是属于处理图片的范围。
[6 楼] duoduobear [Canon论坛版主] 4-10 10:37 lhy02 发表于 2025-04-09 20:58 比如一张白纸上只有黑色图片，拍照后，和软件说，把背景变成蓝色，但不能改变黑色部分，能不能做到？当然，所谓的黑色，其实是很多看着都一样的颜色。有的。谷家刚发布不久一个AI在线工具。上载图片后，就可以用自然语言要求它修图。比如“加一顶帽子”，“背景换成蓝天”，“左边的人去掉”，“ 帽子上加文字‘色影无忌’”等。现在网上有不少视频介绍这个。我还没有实际测试。
[5 楼] lhy02 [泡菜] 4-10 10:12 CIO 发表于 2025-04-10 09:37 实际上很不理想，等于不能。我用豆包和kimi试过做图和PPT，不能说它完全不懂你的意思，但结果总是偏差很大。也试过用deepseek生成关键词，再用那两个AI生成结果，仍然不能用，连凑合都谈不上。只能说适合写意或者纯粹填空。你可能会说我的提示... 你说的这三个属于通用性质的，玩图片只是捎带。没准有专门处理图片的，里面捎带ai的，能用ai做点精确的事。
[4 楼] CIO [泡菜] 4-10 09:37 实际上很不理想，等于不能。我用豆包和kimi试过做图和PPT，不能说它完全不懂你的意思，但结果总是偏差很大。也试过用deepseek生成关键词，再用那两个AI生成结果，仍然不能用，连凑合都谈不上。只能说适合写意或者纯粹填空。你可能会说我的提示不合理不精准，但要我费那么多精力时间还得不到理想结果，我干嘛不自己直接做，或者找人做呢。文生图适合文科，不适合理工科的严谨。发布自安卓客户端
[3 楼] lhy02 [泡菜] 4-10 09:15 arondes 发表于 2025-04-10 00:20 可以但不完善不完善是肯定的，但怎么个不完善法呢？最怕的是貌似完成任务实际上埋坑（比如楼顶的例子，背景确实成蓝的了，但原来黑色图片也有小幅更改）。
[2 楼] arondes [陈年泡菜] 4-10 00:20 可以但不完善