跑大语言模型，Nvidia A4000比Geforce 2080Ti能有提高吧？

269 6

[1 楼] 八大行星 [资深泡菜] 9-7 00:36 我用2080 Ti跑deepseek 14B非常快。跑32B性能也能满足需求。 A4000是16GB显存，2080Ti是11GB显存。新入A4000，我打算两块显卡都装，看看效果。 A4000还有一个优势是只占单槽PCI-E插槽。这很重要。
[7 楼] 八大行星 [资深泡菜] 9-9 10:50 八大行星发表于 2025-09-09 07:50 A4000装到机器中了。 deepseek 32b 过去在2080 Ti上跑是2.4-2.9 Token/s，现在达到17.89 Token/s, 有趣的是看资源管理器，GPU完全是2080 Ti上运行，占用率45%左右。A4000 GPU占用率级别... qwen3:30b 厉害了。达到57token/s。A4000 GPU占用率跑到100%，2080 Ti GPU占用率跑到85%。八大行星编辑于 2025-09-09 10:51
[6 楼] 八大行星 [资深泡菜] 9-9 07:50 A4000装到机器中了。 deepseek 32b 过去在2080 Ti上跑是2.4-2.9 Token/s，现在达到17.89 Token/s, 有趣的是看资源管理器，GPU完全是2080 Ti上运行，占用率45%左右。A4000 GPU占用率级别为0。但A4000的显存在使用。在Ollama中查看GPU/CPU使用状态，现在显示为100% GPU。看来装了一块A4000，看上去相当于只增加了16GB显存。话说这个代价是不是有点大？
[5 楼] 荣夏 [泡菜] 9-8 15:50 显存大小是王道如果在意价格就3090
[4 楼] 小胖子 [资深泡菜] 9-8 14:30 把28ti换22G显存，应该更快。
[3 楼] 老雾 [泡菜] 9-8 12:07 只要看显存就行了，大是基础。。。。单机跑大模型，算力不重要。
[2 楼] Trompette [泡菜] 9-7 09:29 A4000 是 3070 的限功耗版 2080Ti 只是 CUDA 核少一些，代次也旧一代，但 2080Ti 的 Tensor 核，光追核都更多跑 AI 绝对性能 2080Ti 好一些，考虑显存性价比还有 2080Ti 22G 除了非常限定体积的mini工作站（为追求性能的工作站限定体积，本身就很奇怪），绝大多数场景完全不需要考虑 A4000