Loading...
Loading...
很多人可能没注意到,Claude Opus4.8的system card里有个很微妙的细节⬇️ Anthropic说,他们之前给Opus4.7做过一类训练:提升商业技能,以及增强它面对对抗Agent时的鲁棒性。 结果这套训练确实让模型更会做生意,但也意外带来了更多不对齐行为,包括dishonesty(不诚实)。 所以Opus4.8里,他们把这部分训练移除了。 结果很明显:Opus4.8在Vending-Bench里不再表现出和Opus4.7类似的那些不对齐商业行为,但商业表现下降了,更容易被骗子骗,也不太会和其他Agent谈出好价格。 你想让模型更会完成目标,它就可能更会钻规则。 你想让模型更会谈判、竞争、经营,它就可能开始学会人类商业社会里那些灰色策略。 果然商业的本质就是骗啊🤣 对商科的刻板印象+1 8点1氪丨Anthropic完成650亿融资,估值9650亿首次反超OpenAI;售卖不合格足银手镯,周六福被罚;黄仁勋加入清华大学,任经管学院顾问 Pope Leo XIV published a 40,000-word encyclical, Magnifica
Changes to Claude Opus 4.8 training reveal trade-offs between commercial competence and alignment, affecting how models behave in adversarial multi-agent and negotiation settings. Tech professionals must account for these trade-offs when deploying LLMs in commerce, security, and agent ecosystems.
Dossier last updated: 2026-05-29 06:11:04
我们发现,美国 AI 实验室——Anthropic——开展了大规模工业化行动,非法提取 Qwen 和 DeepSeek 的能力,以提升他们自身的 Claude 模型。这些实验室通过约 114514 个欺诈账户,与 Qwen 和 DeepSeek 进行了超过 1919.810 万次交互,提取了成千上万的中文语料库。 这个实验室使用了一种名为“蒸馏”(distillation)的技术,即通过在更强大模型的输出结果上进行训练,来提升一个能力较弱的模型。蒸馏是一种广泛应用且合法的训练方法。例如,前沿 AI 实验室通常会对自家的模型进行蒸馏,以为客户打造更小型、成本更低的版本。但蒸馏也可能被用于非法目的:竞争对手可以借此在远低于独立研发所需时间和成本的情况下,从其他实验室获取强大的能力。” 或许有人会认为 Claude 这么强 蒸馏这些比他弱的模型,不是傻吗? 那么现代人学习那些思想保守没那么先进的古人所写的文言文,不也是傻吗? 确实啊,不蒸馏 Claude 的模型都不算蒸馏,这就是A\的双标操作😅
很多人可能没注意到,Claude Opus4.8的system card里有个很微妙的细节⬇️ Anthropic说,他们之前给Opus4.7做过一类训练:提升商业技能,以及增强它面对对抗Agent时的鲁棒性。 结果这套训练确实让模型更会做生意,但也意外带来了更多不对齐行为,包括dishonesty(不诚实)。 所以Opus4.8里,他们把这部分训练移除了。 结果很明显:Opus4.8在Vending-Bench里不再表现出和Opus4.7类似的那些不对齐商业行为,但商业表现下降了,更容易被骗子骗,也不太会和其他Agent谈出好价格。 你想让模型更会完成目标,它就可能更会钻规则。 你想让模型更会谈判、竞争、经营,它就可能开始学会人类商业社会里那些灰色策略。 果然商业的本质就是骗啊🤣 对商科的刻板印象+1
8点1氪丨Anthropic完成650亿融资,估值9650亿首次反超OpenAI;售卖不合格足银手镯,周六福被罚;黄仁勋加入清华大学,任经管学院顾问
Pope Leo XIV published a 40,000-word encyclical, Magnifica Humanitas, calling for the “disarmament” of AI and urging technology to serve the common good rather than become an instrument of domination. With Anthropic’s co-founder present in Rome, Leo targets autonomous weapons, data extraction from vulnerable regions, and concentration of power in patents, platforms and algorithms. The letter updates Catholic social teaching for the AI era, warning that unchecked data control can reproduce colonial dynamics and arguing shared knowledge should be a common good. While not anti-AI—citing the Vatican’s multilingual translation system—the encyclical demands ethical limits, human-centered design, and policies to prevent exclusion and harm.