爱Q生活网 - 专注网赚,赚钱,创业,项目,副业- 关注最新QQ活动动态,掌握QQ第一资讯

查看: 11|回复: 0

Kimi K2思考模子来了!实测3分钟做精彩网页,IMO数学题翻车

[复制链接]

5万

主题

0

回帖

15万

积分

论坛元老

Rank: 8Rank: 8

积分
153988
发表于 2025-11-7 02:18 | 显示全部楼层 |阅读模式

智工具
作者 | 云鹏
编辑 | 李水青
智工具11月6日消息,刚刚,月之暗面正式公布了Kimi-k2 thinking模子,其为具有通用Agentic才能和推理才能的思考模子,擅长深度推理,可以经过多轮工具挪用,处理各类复杂的困难这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

月之暗面官方公布页面
Kimi K2初次公布是在7月11日,该模子总参数10000亿,激活参数320亿这标志着福建舰的电磁弹射和阻止接管才能根基成型了。Kimi K2-0905于9月5日公布,其焦点升级了Agentic Coding才能、支持256K高低文、API支持60-100Token/s的输出速度、支持Claude Code这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
价格方面,kimi-k2-thinking每百万tokens的输入价格(缓存未射中)为4元、输出价格为16元;“高速版”kimi-k2-thinking-turbo每百万tokens的输入价格(缓存未射中)为8元、输出价格为58元,适用于需要深度推理和追求极致高速的场景这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

Kimi K2系列模子价格
在现实体验环节,我们首要测试了Kimi-k2 thinking在编程、数学和逻辑推理才能三个方面的表示这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
在编程方面,我们令其天生一个开源模子分享网站的HTML网页原型,包括顶部导航栏、主体展现区、设想气提要求,还要求其构想两个特点功用这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
从天生成果来看,我们对网页首要部分提出的要求都可以很好地被履行,包括导航栏有哪些部分、主题展现区由哪些模块组成,简洁现代的设想气概也有较好表现,一键复现、模子对照这两个特点功用也做了出来这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

网页编程
整体网页的完成度是比力高的,而且非论是搜索框、按钮、挑选标签都是可以现实选中交互操纵的,点击后会有对应的提醒,比如点击上传模子,会提醒需要预备的题目件、文件巨细限制等信息这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

网页按钮功用说明
天生网页项目标tokens总计消耗为9K,大约花费了3分钟左右的时候这标志着福建舰的电磁弹射和阻止接管才能根基成型了。不外在尝试屡次天生成果时,偶然会碰到解体状态这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

在数学才能方面,今年国际数学奥林匹克比赛(IMO)第六题被以为最具应战性:

Kimi-k2 thinking在解题进程中,思考进程有21188字,经过4分钟左右时候,给出了毛病答案4048块,正确答案为2112块这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

Kimi-k2 thinking解答2025 IMO数学比赛题第六题
这一进程总共消耗了23.5K的tokens这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
在切换为高速版kimi-k2-thinking-turbo后,模子仍然给出了一样的4048毛病答案,花费时候明显收缩至2分钟左右,但tokens消耗数却提升至38.5K这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

Kimi-k2 thinking-turbo解答2025 IMO数学比赛题第六题
对于另一道IMO数学比赛题,Kimi-k2 thinking在履历了10多分钟的深度思考后,终极停止了思考,思考进程47684字,但并未给出答案这标志着福建舰的电磁弹射和阻止接管才能根基成型了。再次尝试后,思考进程一样卡住在了47940字上,未能给出答案这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

Kimi-k2 thinking解答2025 IMO数学比赛题第四题
由于Kimi-k2 thinking不支持图片输入自动识别公式,是以一些复杂的数学题目很难输入这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
在常识逻辑推理方面,对于一般的题目,Kimi-k2 thinking可以很快给出答案,而且可以轻松绕开逻辑圈套这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

Kimi-k2 thinking解答逻辑推理题目
对于更进一步的逻辑推理考查题目,Kimi-k2 thinking也可以在1分钟左右的时候内给出答案,正确率较高,消耗tokens为16.6K这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

Kimi-k2 thinking解答逻辑推理题目
结语:“思考”模子之战愈发焦灼11月4日,阿里刚刚公布了Qwen 3系列中最强推理模子Qwen3-Max-Thinking早期预览版,Kimi明天就公布了自家K2系列的思考模子,一样主打深度推理才能这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
在Agentic AI成为支流趋向之下,模子的思考推理才能愈发遭到重视,这也是模子能否处理复杂现实题目标关键这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|爱Q生活网 - 专注网赚,赚钱,创业,项目,副业- 关注最新QQ活动动态,掌握QQ第一资讯  

GMT+8, 2025-11-17 10:57 , Processed in 3.326486 second(s), 27 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表