微软：与 AI 增强版必应长时间聊天会导致“翻车”

北京时间 2 月 17 日早间消息，微软近期启动了人工智能增强版必应的公开测试，但许多用户发现，新版必应在某些情况下会出现“精神错乱的”言论，甚至侮辱用户、撒谎，并试图操纵用户的情绪。微软官方回应称正在根据反馈采取行动，以优化回答的语气和准确性。微软同时警告称，较长的聊天会话可能会导致问题。

回顾最初 7 天的公开测试，微软必应团队表示，他们没有“完全预计到”，人们会使用聊天界面来进行“社交娱乐”，或是将其作为一种“全面发现世界”的工具。该团队发现，如果聊天会话持续 15 个或更多的问题，新版必应的模型会感到困惑。这些较长的聊天也会让必应“变得翻来覆去，或者受到刺激，做出不一定有帮助，或是与设计语气一致的回应”。

微软暗示，尽管文本输入框旁边有一个“新话题”按钮，可以用于清除聊天的历史记录，重新开始，但接下来还可能增加“一个工具，帮助用户更方便地刷新”聊天会话的上下文。

更大的问题在于，在这些提问较多的聊天中，必应经常会以不正确的语气回应，或是像微软所说的，以“我们不想要的方式”做出回应。微软表示，对大多数必应用户来说，只有长时间对话才会遇到这方面问题。不过，微软也在探索更多的“微调控制”，以避免必应对用户说，用户是错的，以及表现得粗鲁或试图操纵用户。在一些测试中可以看到，在关于必应本身的对话中，只要几个问题，必应就会以负面或存在敌意的语气来回复。

微软仍在努力优化必应做出回复的语气，而必应团队也在考虑提供更多的控制选项，用于设定人工智能的创造性和精确度。这种控制选项可能有助于避免目前的问题，例如必应会声称正通过笔记本摄像头来刺探微软员工，或是出现基础性的数学错误。

微软目前正在超过 169 个国家对新版必应展开测试，有数百万人正排队注册。微软表示，对答案的反馈有 71% 是正面的，一些用户甚至与新版必应进行了长达两个小时的对话，以测试服务的极限情况。

新版必应目前每天都在得到优化，一些技术问题在微软的日常版本发布中得到修复，还有一些问题则在每周发布的大版本中得到修复。微软正在尝试优化搜索和回答，尤其是围绕体育赛事比分数据，以及必应最近出现的一些财务数据错误。必应团队表示：“对于那些需要更直接、事实性更强的答案的问题，例如财报数字，我们计划将发给模型的基础数据增加 4 倍。”

微软还在观察对新功能的反馈，这些功能包括预订机票、发送电子邮件，以及分享搜索和答案等。目前尚不清楚，这些新功能最终是否会被加入到产品中，但必应团队表示，正在研究在未来的版本中包含这些功能。

微软：与 AI 增强版必应长时间聊天会导致“翻车”

不再由 Siri 播报，未来苹果 iPhone 用户收到信息后可用女友的声音来播报

《极品飞车》定制版 RTX 4090 现身二手市场，全球只有 18 块

最新文章

「经验分享」单位规模如何填写

ai复制快捷键（复制与粘贴的几种办法）

探路者和骆驼哪个好(探路者冲锋衣什么档次)

太监怎么净身（揭秘太监净身全过程）

破折号的作用

圭吾怎么读(东野圭吾什么意思)

防晒口罩巾怎样做

学困生转化措施（以及转化学困生的三项策略）

半斤多少克(一斤等于多少两)

柠檬炸鸡的做法

标签

热评文章

卢伟冰：Ultra用户见证了小米冲击高端非常感谢他们

潮汐app怎么听到梦话记录

电信王卡怎么查看流量剩余电信王卡怎么查看流量剩余多少(电信怎么查流量剩余)

电信王卡流量怎么计算钱电信王卡流量怎么计算钱数(电信卡王卡流量怎么计算)

电信电话卡怎么查流量电信电话卡查流量怎么查询(电信卡怎么查流量)

微软：与 AI 增强版必应长时间聊天会导致“翻车”

不再由 Siri 播报，未来苹果 iPhone 用户收到信息后可用女友的声音来播报

《极品飞车》定制版 RTX 4090 现身二手市场，全球只有 18 块

最新文章

「经验分享」单位规模如何填写

标签

热评文章

卢伟冰：Ultra用户见证了小米冲击高端 非常感谢他们

潮汐app怎么听到梦话记录

电信王卡怎么查看流量剩余 电信王卡怎么查看流量剩余多少(电信怎么查流量剩余)

电信王卡流量怎么计算钱 电信王卡流量怎么计算钱数(电信卡王卡流量怎么计算)

电信电话卡怎么查流量 电信电话卡查流量怎么查询(电信卡怎么查流量)

关注我们的公众号

卢伟冰：Ultra用户见证了小米冲击高端非常感谢他们

电信王卡怎么查看流量剩余电信王卡怎么查看流量剩余多少(电信怎么查流量剩余)

电信王卡流量怎么计算钱电信王卡流量怎么计算钱数(电信卡王卡流量怎么计算)

电信电话卡怎么查流量电信电话卡查流量怎么查询(电信卡怎么查流量)