TAG:AI中立性

Anthropic发布Claude价值观对齐技术,减少政治倾向争议

Anthropic发布Claude价值观对齐技术,减少政治倾向争议

Anthropic公司近日推出新方法,用于评估其聊天机器人Claude在政治问题上的中立性,旨在避免被贴上政治偏见标签。该方法通过系统提示和奖励机制鼓励中立回答,包括尊重传统价值观等内容,以符合美国当前政治需求。测试显示Claude Opus4.1以95%的中立得分紧随Gemini2.5Pro之后。Anthropic已将这一测试方法开源发布在GitHub上,促进AI开发者间的交流与合作。

2025-11-17 11:46
0
0