而整个测试,我全都是让 Claude Code(Opus 4.7)自己完成的:让它自己设计测试方案,自己写 prompt,分别使用 GLM 5.1 和 DeepSeek V4 Pro 跑同样的任务,最后自己评判结果。 (我现在很多测试、很多工作都是这么做的……主打一个 0 人工介入。效果好不好另说,但一定得是省事的) ...
专注AIGC技术的专业社区,关注大语言模型(LLM)的发展和应用落地,聚焦LLM及AI技术的市场研究和开发者生态,欢迎关注!刚刚,GitHub上开源了一个宝藏神器deepclaude。 只需两分钟,就可将DeepSeek V4 Pro作为Claude ...