当前位置：纯净系统家园 > 微软资讯 > 微软报告：GPT-4机器学习模型易受“越狱”提示词影响，生成不良内容

微软报告：GPT-4机器学习模型易受“越狱”提示词影响，生成不良内容

更新时间：2023-10-18 10:49:29作者：yidaimei

10 月 18 日消息，微软旗下研究团队近日发表论文。详细研究了大型语言模型 (LLM) 的“可信度”和潜在毒性，特别关注 OpenAI 的 GPT-4 及其前代 GPT-3.5。

微软报告：GPT-4机器学习模型易受“越狱”提示词影响，生成不良内容

研究团队，GPT-4 虽然在标准基准测试中比 GPT-3.5 更加可靠，但容易受到“越狱”提示（绕过模型安全措施）影响。GPT-4 可能会根据这些“越狱”提示，生成有害内容。

微软报告：GPT-4机器学习模型易受“越狱”提示词影响，生成不良内容

论文中强调 GPT-4 更容易受到恶意“越狱”系统或用户提示影响，会准确地遵循（误导性）指令，生成不良内容，微软强调这个潜在漏洞不会影响当前面向客户的服务。

在此附上微软官方论文地址，感兴趣的用户可以深入阅读。

相关教程

copyright © 2012-2026 纯净系统家园 yidaimei.com 版权声明