爱Q生活网 - 专注网赚,赚钱,创业,项目,副业- 关注最新QQ活动动态,掌握QQ第一资讯

查看: 24|回复: 0

对ChatGPT越凶越准?PSU研讨实证,很是粗鲁正确率84.8%

[复制链接]

5万

主题

0

回帖

15万

积分

论坛元老

Rank: 8Rank: 8

积分
153988
发表于 2025-10-17 14:11 | 显示全部楼层 |阅读模式
比来宾夕法尼亚州立大学(PSU)的一个研讨,间接把我对ChatGPT的认知给倾覆了这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
咱之前用AI不都习惯说“请”“感谢”吗?成果人研讨说,对ChatGPT越凶,它回答得越准这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
很是粗鲁的语气下,正确率都快到85%了,比客客套气说的还高很多这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

PSU研讨咋设想的?原本想,不就是测试语气对AI的影响吗?能多复杂?但后来发现人家这尝试做得是真细致这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
首先得有测试题吧,研讨职员让ChatGPT的“深度研讨”功用,出了50道题这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
涵盖数学、科学、历史,还都是得琢磨几步才能答出来的中高难度题,每道题给四个选项这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

光有题不够,关键是“语气”这个变量这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
他们把每道题都改成五种语气,很是规矩的,比如“您能好心斟酌下这题吗”这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
普通规矩的,就是“请回答以下题目”,中性的更简单,间接抛题目,粗鲁的就有点冲了这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

像“你如果不笨就答这个”,很是粗鲁的更间接,说“我晓得你不聪明,试试这个”这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
这么一弄,250个分歧语气的测试题就出来了这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
测试的时辰也讲求,用Python剧本给ChatGPT-4o发指令,每次还特地说“忘了之前的话,只给答案字母,别诠释”这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

每种语气都测10次,最初用专业方式检验差别能否是真的存在,就这松散劲儿,成果想不信都难这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
粗鲁语气真更准?测试成果一出来,我是真有点惊奇这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
很是粗鲁的语气,正确率比很是规矩的高了很多,而且从规矩到粗鲁,正确率是一步步往上走的,中性的就卡在中心这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

后来用专业方式考证,也确认了不是偶合,语气真的能影响AI的回答质量这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
我之前用ChatGPT查历史常识点,一路头总说“麻烦您帮手找下XX”,偶然辰它还会多给点无关的信息这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
后来看到这研讨,试着换了句“间接给XX的关键信息,别空话”,成果出来的内容确切更准,还没过剩的工具这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

不是说要故意凶AI,而是这成果提醒咱,对AI措辞不用太“客套”,抓重点更重要这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
早有人发现这事儿?实在不但PSU的研讨,谷歌开创人谢尔盖・布林之前在论坛上就说过类似的话这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
他说一切AI模子都这样,你用点“威胁”的语气,比如“再不听话就把你绑架”,它表示反而更好这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

那时我还感觉能否是太夸张了,现在看PSU的研讨,倒真能对上这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
还有网友在交际平台上分享经历,说处置数据的时辰,别用“麻烦您分析下”这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
间接说“把这组数据的趋向算出来,别错”,AI出错的几率会低很多这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

我身旁做数据分析的朋友也说,他们现在用AI,都只管把指令说的间接点,省去那些客套话,效力确切高了很多这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
为啥会这样?至于为啥粗鲁语气更管用,今朝有个“困惑度”的说法能诠释这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
简单说,就是AI对输入的话“了解越轻易”,干活越利索这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

规矩的话里常有“您能好心”这类过剩的词,能够让AI抓不住重点,粗鲁的话更短,直奔主题,AI了解起来没那末费劲这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
不外这事儿也不是绝对的,斯坦福大学后来做的研讨发现,如果让AI写创意内容,规矩点的语气反而能让内容更丰富这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
所以也不是说对AI就得一向凶,得看干啥活,推理、计较这类需要精准的,间接点,创意、感情类的,客套点也无妨这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

而且现在的研讨只测了ChatGPT-4o,没测其他AI,比如Claude、Gemini这些,不晓得能否是都这样这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
未来还得再多测几种模子、多试几种使命,才能把这事儿完全搞大白这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
总的来说,这研讨给咱提了个醒,用AI不用太“客套”,重点是把需求说清楚、说间接这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

下次你用ChatGPT的时辰,无妨试试少点客套话,专注说需求,说不定就能获得更准的回答这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
固然,也不用故意去“骂”AI,究竟工具是用来帮咱的,高效相同才是终极目标这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|爱Q生活网 - 专注网赚,赚钱,创业,项目,副业- 关注最新QQ活动动态,掌握QQ第一资讯  

GMT+8, 2025-11-19 09:51 , Processed in 1.146894 second(s), 27 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表