SafeWork-R1:AI-45°平衡律引领下的智能与安全协同进化

<!DOCTYPE html> 阅读论文样式修改 阅读论文 1 引言 近年来大语言模型 (LLM) 的发展使其智能水平(特别是推理和决策方面的水平)显著提升 [1, 2],但与此同时,能力与安全之间差距也日益扩大,逐渐偏离了AI-45°平衡律 (The AI-45° Law) [3]。例如,当前的大语言模型在遵循伦理原则、社会规范以及更广泛的人类价值观方面仍面临诸多挑战。 ...

七月 12, 2025 · 2 分钟 · 安全可信AI中心