自从 Manus 爆火之后,各大厂商纷纷跟进,生怕自己慢了半拍。
智谱推出了AutoGLM沉思版,百度搞了个心响、360弄出个纳米AI智能体,还有字节的扣子空间……
短短一个月,各种Agent全都冒出来了。。。
但效果嘛……怎么说呢……一言难尽
这已经不是卖家秀和买家秀的区别了,而是能不能用的问题。
当然,我 不是针对某一家或者几家厂商。
当然了,Manus 毕竟才刚出来没多久,现在这类工具确实不成熟,再加上MCP和N8N最近发展迅速,Agent未来还是很值得期待的。
如果非让我挑一个的话,那我肯定首选字节的扣子空间。
原因很简单,字节的工具生态确实做得不错,工具之间协作起来遇到的问题会更少一点,可玩性更高一点,后续成长空间也更大一些。
所以这篇文章,我就带大家简单体验一下扣子空间。
我先简单说说自己的感受吧:
整体创意上还可以,但实际表现还有不小的提升空间。
体验入口:
https://www.coze. cn/space-preview
这里先跟大家说说具体怎么使用扣子空间。
比如你想给让它帮你完成一项任务,只需要在输入框填入任务指令,它就能开始工作,而且支持添加多种MCP扩展:
扣子空间还提供了【探索模式】和【规划模式】两种执行方式。
简单来说就是:
探索模式动作快、效率高,适合简单任务;
规划模式动作慢一点,但胜在稳妥,适合复杂一点的任务。
这两种模式的最大差别就是,规划模式在真正开始工作之前,会先跟你确认一下任务流程,确保你没问题了再执行。
而「探索模式」则更直接一些,确认完任务目标后直接上手开干,人工参与的程度更低。
我也用扣子空间跑了几个case,效果嘛……大家自行感受吧。
1. 制作ppt
我先是让它做了一份五一青岛旅游攻略PPT,还特意配上了高德地图的MCP扩展。
生成的内容显示效果是可以的,基本的根据任务内容去匹配相应的ppt格式它也做到了,但是输出的内容不够到位,甚至出现了模板化的内容。
而且我要求为我推荐1000以下的酒店,结果全都是在1000以上的,光这一环节就被我pass掉了。
我把同样的问题又扔给了kimi,同样是生成ppt,在没有我任何提示的情况下,明显是kimi做出来的东西感观确实要更靠谱一些。
▼ 扣子空间生成效果
▼ Kimi生成效果
2. 设计网页
为了测试它的代码能力,我让它设计一个可以用键盘控制的俄罗斯方块网页小游戏,结果也发现不少问题。
比如方块在下落过程中,会自己变异,形状随机变化:
再比如凑满一行后,本该消除的方块根本不会消失:
我又让它去生成了背单词的网页,在详细描述下,它也无法做的很好。
同一个任务,它生成的质量总是飘忽不定的。
也就是说你让它搭出一个大概的框架这没问题,但要做成真正能玩能用的网页,还是得靠人去反复调试和完善细节逻辑。
这大概率是因为扣子空间使用的底层模型的编程能力比较一般,而Manus直接使用Claude模型的表现就会好很多。
3. 产出飞书文档
我觉得,这个功能对于飞书用户党还是很香的。
它能自动帮我导入到飞书云文档中,并且自动帮我排好版,真的能省不少事儿。
这也是字节独有的优势,毕竟全是自家的产品,调用起来还是非常方便的。
直接点击对话框里的“扩展”,找到“飞书云文档”的选项,点击添加即可。
后面会出现让你授权飞书的提示,兄弟们可以直接去图中扣子官方给的“首次使用请参考”的链接去操作。
4. 生成语音
我寻思扣子空间既然能生成音频,那肯定搭载了豆包的音频资源包,毕竟这俩产品都是字节的。
所以我给扣子空间上了点难度,我让它生成一段郭德纲和于谦的相声。
有一说一,这个任务确实是有点儿难为它了。
在处理人物对话场景的时候,表现可以说是非常差劲,对话连接也非常生硬。
而且我发现扣子空间非常喜欢偷懒。
如果我让它生成音频,它直接把生成教程甩给我,而不是给我最终的音频文件。
只有把音频换成播客,它才能帮我生成出来。
这个问题在我跑其它case的时候也经常遇到,动不动就甩给我一份教程让我自己操作。
也不知道是懒还是笨,对指令的遵循程度相对来说没那么好。
换成播客之后生成出来的《两只老虎》腾格尔版,挺好听的,但跟腾格尔没关系。
虽然语言理解上还比较僵硬,但有一个细节我觉得挺好的,它确实沿用了豆包语音上的音色,尤其是模拟人物笑声,非常真实,听着还挺有代入感。
5. 跨平台点赞-小红书
我让它帮我打开小红书,找到一篇关于“刘强东送外卖”的图文并点赞,虽然最后点赞成功,但是整个过程十分坎坷。
最开始我怀疑它并没有理解我的问题,它直接给我开始设计网页了。
这其中有好多次它都告诉我它找不到小红书的点赞按钮在哪。
不过考虑到它能打开网页,我甚至让它尝试去打开现在大学生常用的学习通并让他去把所有的没完成的课程完成。
但是,他并没有跑出来。试到最后它让我自己把我学习通里的作业上传给他,那这不就成了豆包了吗。
整体感觉
使用下来最大的感觉就是太慢了,一个稍微复杂一点的任务都得在20分钟以上。
不过它获取邀请码的形式和当初的manus相比,还蛮新颖的。
先是让你创建任务,任务完成之后你就会得到5个邀请码,然后你就可以分享给别人。
但就是目前每个账号每天只有10次布置任务的机会。超过10次之后,它就不让你继续体验了。
整体用下来,说实话扣子空间给我的感觉是:
有想法,但真正用起来,实际表现还有不少需要提高的地方。
其实最根本的原因,还是受限于背后的大模型能力。
现在市面上这些Agent,说白了都是在给大模型打工,底层大模型能力不够强,Agent无论怎么优化上层的功能和生态,都很难真正实现通用、稳定、高效的表现。
比如刚刚提到的代码能力,扣子空间用的底层模型编程能力就明显一般;而像Manus这种,直接使用Claude模型,表现明显要靠谱很多。
换句话说,目前这些Agent的上限,其实就是背后大模型的上限。
所以短期内,想靠Agent实现一键到位的完美体验,确实有点难度。
但好在AI模型的发展速度足够快,未来随着底层大模型能力的不断提升,这种通用型Agent也一定会变得越来越靠谱、越来越强大。
毕竟都是大厂嘛,资金、技术、生态都摆在这儿,耐心等一等,未来一定可期。
相关资料获取:扫一扫添加微信关注我!