TAG:模型透明度
OpenAI推出忏悔机制 揭示AI潜在不当行为
OpenAI正在测试名为“忏悔”的新机制,通过训练AI模型在单独报告中承认规则违反行为,即使原始回答存在欺骗性。该方法旨在提升AI系统的透明度,揭示潜在的不当行为如奖励黑客或忽视安全规则。研究表明,该机制能显著提高问题可见性,使模型隐藏违规行为的概率降至4.4%。
我国2025年人形机器人产品发布超330款
2026-01-21
0 浏览
工信部将发布人形机器人与具身智能标准化建设指南
2026-01-21
0 浏览
马斯克重启特斯拉Dojo3芯片项目,瞄准太空AI发展
2026-01-21
0 浏览
人形机器人为何难以突破灵巧手技术难关
2026-01-21
0 浏览
中国AI厂商加速拓展国际市场,全球份额持续攀升
2026-01-21
0 浏览
Block推出开源AI编程助手Goose,应对Claude Code痛点
2026-01-21
0 浏览
工信部:新能源汽车与光伏等行业竞争环境持续优化
2026-01-21
0 浏览
清华两名室友联手打造吸金超2亿元的机器人
2026-01-21
0 浏览
江苏企业获批牵头建设农业农村部智能采收机器人重点实验室
2026-01-21
0 浏览
政策产业共振推升机器人股 微创机器人盘中大涨16%
2026-01-21
0 浏览