现在处理图片的ai,可以接受自然语言指令么?
4356 15
[1 楼] lhy02 [泡菜]
4-9 20:58
比如一张白纸上只有黑色图片,拍照后,和软件说,把背景变成蓝色,但不能改变黑色部分,能不能做到?
当然,所谓的黑色,其实是很多看着都一样的颜色。
[16 楼] 碧桂老鱼 [资深泡菜]
4-12 22:03
一键就能搞定的操作应该没问题,否则还不如自己弄了,就好比降噪,降多少合适还得眼睛收货,多次微调,这跟ai怎么说呢。
发布自 安卓客户端
[15 楼] 开山鼻祖 [老坛泡菜]
4-12 19:40
ai不擅长修图,生(成)图ai擅长。所以ai替代不了美工师,除非弄个电影或视频不要真人。不过抖音也是真人变形美化,但也达不到lz要求。

原因就是ai其实在图片上是基于素材图训练的,要对任何一张照片做修改,ai要推理,但这种推理很简单,不像图像处理软件那样精确,后者还有固定流程(一步步来,哪一步没做好还可以回退)和算法(比如去雾),因而更精确。

开山鼻祖 编辑于 2025-04-12 19:52
[14 楼] lhy02 [泡菜]
4-12 18:08
详细解释一下吧。
类比一下各种电器的ai,实际上就是把你说的话翻译成已有功能(s)。

我给的例子是处理图片软件几个操作的组合。其中选择颜色操作应该有不确定性(哪个区间范围)。
如果处理图片软件有ai,就会接收自然语言后执行一系列已有功能,相当于你点了一堆菜单。
这样的话就用不着知道这个处理图片软件有啥功能了。

我想问的就是这个意思:现有处理图片软件能不能把自然语言翻译成已有功能(s)。
[13 楼] zhaoyx55 [泡菜]
4-11 19:46
短时间内做不了,首先考验ai对现实世界的理解,自动驾驶路上那点固定的车、标志标牌、线都识别不好,更别说整个世界那么多东西了。顶楼举的例子里颜色和语言文字怎么对应,颜色是最不好描述的,哪些颜色算黑哪些颜色算蓝不好界定
zhaoyx55 编辑于 2025-04-11 19:47
[12 楼] lhy02 [泡菜]
4-10 17:36
开山鼻祖 发表于 2025-04-10 16:23
啥指令,提高画质,消除雾霾?
见顶楼:
比如一张白纸上只有黑色图片,拍照后,和软件说,把背景变成蓝色,但不能改变黑色部分,能不能做到?
[11 楼] 开山鼻祖 [老坛泡菜]
4-10 16:23
啥指令,提高画质,消除雾霾?
[10 楼] lhy02 [泡菜]
4-10 14:16
arondes 发表于 2025-04-10 13:21
就是不能完全按照你要求的指令去做
而且生成的照片质量较低
这方面还是得看Adobe
一般的大模型厂商不了解我们拍照爱好者的需求
比如你上传一个照片 让他解读exif 你会发现很多都做不到
因为他是把照片压缩了以后再传给服务器的 输入就不是原片
我问的目的就是看处理图片的软件的ai到哪个程度了。
比如adobe的ai,我楼顶给的例子,会干的咋样
lhy02 编辑于 2025-04-10 14:17
[9 楼] arondes [陈年泡菜]
4-10 13:21
lhy02 发表于 2025-04-10 09:15
不完善是肯定的,但怎么个不完善法呢?
最怕的是貌似完成任务实际上埋坑(比如楼顶的例子,背景确实成蓝的了,但原来黑色图片也有小幅更改)。

就是不能完全按照你要求的指令去做
而且生成的照片质量较低
这方面还是得看Adobe
一般的大模型厂商不了解我们拍照爱好者的需求
比如你上传一个照片 让他解读exif 你会发现很多都做不到
因为他是把照片压缩了以后再传给服务器的 输入就不是原片
[8 楼] Bohnenkaffee [陈年泡菜]
4-10 11:07
想做的好应该会很费力,训练阶段吧?
发布自 iOS客户端
[7 楼] lhy02 [泡菜]
4-10 10:39
duoduobear 发表于 2025-04-10 10:37
有的。谷家刚发布不久一个AI在线工具。上载图片后,就可以用自然语言要求它修图。比如“加一顶帽子”,“背景换成蓝天”,“左边的人去掉”,“
帽子上加文字‘色影无忌’”等。现在网上有不少视频介绍这个。我还没有实际测试。
这种知道,属于很宏观的处理。
我给的例子是属于处理图片的范围。
[6 楼] duoduobear [Canon论坛版主]
4-10 10:37
lhy02 发表于 2025-04-09 20:58
比如一张白纸上只有黑色图片,拍照后,和软件说,把背景变成蓝色,但不能改变黑色部分,能不能做到?
当然,所谓的黑色,其实是很多看着都一样的颜色。

有的。谷家刚发布不久一个AI在线工具。上载图片后,就可以用自然语言要求它修图。比如“加一顶帽子”,“背景换成蓝天”,“左边的人去掉”,“
帽子上加文字‘色影无忌’”等。现在网上有不少视频介绍这个。我还没有实际测试。

[5 楼] lhy02 [泡菜]
4-10 10:12
CIO 发表于 2025-04-10 09:37
实际上很不理想,等于不能。
我用豆包和kimi试过做图和PPT,不能说它完全不懂你的意思,但结果总是偏差很大。
也试过用deepseek生成关键词,再用那两个AI生成结果,仍然不能用,连凑合都谈不上。
只能说适合写意或者纯粹填空。
你可能会说我的提示...
你说的这三个属于通用性质的,玩图片只是捎带。
没准有专门处理图片的,里面捎带ai的,能用ai做点精确的事。
[4 楼] CIO [泡菜]
4-10 09:37
实际上很不理想,等于不能。

我用豆包和kimi试过做图和PPT,不能说它完全不懂你的意思,但结果总是偏差很大。
也试过用deepseek生成关键词,再用那两个AI生成结果,仍然不能用,连凑合都谈不上。
只能说适合写意或者纯粹填空。

你可能会说我的提示不合理不精准,但要我费那么多精力时间还得不到理想结果,我干嘛不自己直接做,或者找人做呢。

文生图适合文科,不适合理工科的严谨。
发布自 安卓客户端
[3 楼] lhy02 [泡菜]
4-10 09:15
arondes 发表于 2025-04-10 00:20
可以
但不完善
不完善是肯定的,但怎么个不完善法呢?
最怕的是貌似完成任务实际上埋坑(比如楼顶的例子,背景确实成蓝的了,但原来黑色图片也有小幅更改)。
[2 楼] arondes [陈年泡菜]
4-10 00:20
可以
但不完善