声明:本文来自于微信公众号 刘言飞语(ID:liufeinotes),作者:刘飞,授权靠谱客转载发布。
我一直有个观点,即 AI 只是技术,并不存在特定的产品,只要用了 AI 就能成立的。AI 产品包括了是否洞察了用户需求、是否发挥了技术优势,也包括怎样与用户沟通(运营)。这些也都跟 AI 产品背后的团队气质有关。
从 ChatGPT 引起科技行业轩然大波已经过去一年了,国产 AI 产品我也试用过了很多,感受比较强烈的还是 Kimi Chat,这是个很不一样的产品,尤其背后的团队 Moonshot 也很不一样。
这个不一样从名字就开始了,「月之暗面」就是 Pink Floyd 的经典专辑,这个封面可能也是摇滚史上的经典。我自己是黑胶爱好者,也有这张专辑,放在书架上,很喜欢。
技术不是做数学题、不是写多少行代码那么简单;也不是有了好技术,就一定等于有好产品。正好这几天在用 Kimi Chat(下文简称 Kimi)的时候发现他们上线了加油的功能,就趁机以它为载体聊一聊这个话题。
1需要技术,也需要用户场景
Kimi 是国产 AI 产品里最受关注的之一,根据我看到的一个统计(similarweb),Kimi 的 Web 端访问量在 TOP2,一度超过了文心一言。
在 Apple Store 的免费榜里,也曾冲到过 AI Chat 类应用的 TOP3,另外两家是百度和字节的产品。Kimi 也是「小厂」中最受瞩目的一个。
估计很多没用过的朋友也不太能理解为什么 Kimi Chat 能有这样的热度,有的会认为就是投放的效果(当然跟投放有一定关系)。
大模型本身是技术,并不代表用户场景。跟所有用户产品一样,Kimi 也首先满足了特定的用户场景。
Kimi 能联网获取信息,是搜索引擎的替代品,而且是体验更好的替代品:在原始网页基础上做了初步的整合。
我在之前的文章里聊到过,搜索引擎看似用关键词搜索已经门槛很低了,要找到真正对应的内容,还是有难度的。
如果你去观察身边的老人,就会发现,他们压根不会用关键词去搜索。而是用完整的句子,也就是自然语言表达。
我们随意在国内最主流的搜索引擎输入一个词,从联想出来的常见输入语,就能看得出来。
而这些完整的句子,很多时候未必能搜索到最准确的内容,要仰赖分词技术。对于搜出来的结果,哪些跟搜索语相关,也需要有判断。这也是为什么之前虚假广告大行其道,因为很多人会自然地点击前几个结果页面。
还是不要小看互联网对于多数人的门槛。很多技术出身的朋友恨不得所有人都会写爬虫、自己操作脚本去获取信息,瞧不上看起来没有什么技术含量的 Kimi,认为不存在需求。这是忽视了人群和场景。
当然,现在的联网搜索功能,还没有那么理想。我自己的使用体验,60% 能得到顺畅的结果,不用再切换工具了,在当前的 UI 内就能得到足够的信息。40% 的情况可能还要去原始网页看看,或者在搜索引擎继续搜集材料。
2需要技术,也需要用户体验
用户体验,看起来是一个很虚头巴脑的说法。但正因为它抽象,很多人也就忽视了。体验实际上是囊括在很多小地方的,很多团队要做用户体验地图,一张图拉出来,一百个用户触点,每个触点都值得推敲、值得深究。
我体验到的 Kimi 的这种小的特点至少包括:
响应快,出字就是比多数别的产品快,等待时间正好在可接受的范围里。
界面简洁。这个有点见仁见智,从我的视角看,首页里塞的东西没有让我很反感;页面也没有一堆边栏。
使用方便。多数 AI Chat 产品需要登录才能使用;有的 AI Chat 产品无法查看信息来源网站;有的 AI Chat 不能读取网址;...
效果不错。从最终效果来看,Kimi 已经能在某些情况下替代 ChatGPT(GPT-3.5)了。不要相信别的国产大模型说早就超过4了。能在部分情况下接近3.5已经是极限,说明在一线水平。
对我而言,Kimi 能在我对某些问题无从下手的时候,提供非常好的引导作用。比如,我对日元贬值的问题感兴趣,就可以得到这样的回答:
再比如,我对不同的标普基金的涨跌情况不同,有比较大的疑问:
在搜集材料时,效率也的确比搜索引擎要高出很多,比如想了解 Zara 历史上是否有知名的语录:
在播客「半拿铁」的创作过程中,我跟潇磊对 Kimi 的使用率是不低的。潇磊主讲的节目,会用 Kimi 来做全文的摘要整合。
我在之前做的纯主观测评里,Kimi 在搜集信息和整理文稿方面,表现突出。
我在3个多月前就发了这么一个贴,说明我不是这两个月 Kimi 火了才要蹭热度的:
3年轻的技术:长文本
在用户需求和用户体验背后,Kimi 有自己更年轻的想法,这个想法就是长文本。
Kimi 是国内第一个提出和推进长文本概念的。在 Kimi 之后,通义千问、文心一言都纷纷加入了战局,推出了适应长文本的功能。
长文本是对应 RAG 的一种技术概念,RAG 是 Retrieval-Augmented Generation,直译为检索增强的生成技术。
简单理解,RAG 是得到了一个问题(用户的输入),可以去数据中进行检索,把相关的数据做整合,再进行输出。像是查字典的逻辑。当然 RAG 涉及的并不是单一技术,还包括如何切割数据、提取数据、检索数据等等。
RAG 在处理明确的问题时效果拔群,比如「今天天气怎么样」。在一些严肃的场景中,RAG 也能更好地搜寻到信息,比如法律、医学相关领域。
不过 RAG 有个天然的缺陷,即无论是输入,还是输出,文本过长的情况下,就很难有满意的效果。
长文本相对而言能解决输入和输出长度(token 数量)的问题,因为它是用完整的数据建模的,而不是有了输入再去检索。让长文本模型阅读一本长篇大作、书写一篇论文、帮助思考和推理,都是可以实现的。
我也终于排队排上了 Kimi 的200万字长度的长文本功能试用,把多年前的两本书《从点子到产品》和《产品思维》投喂给它,让它分辨异同,以及给出用户场景的案例。从结果的信息看,是相当准确的。
长文本和 RAG 是技术路线的分歧,而选择长文本,自然就是假定了一个用户需求的趋势:用户并不只是简单从搜索引擎搜搜东西而已,可能要用大量的文档里获取信息,也可能完成大篇幅的创作。
坦白说,目前的大模型的内容生成,对我这样的内容创作者来说,还没有达到标准。获取信息是可以的,但要能够直接采用,还有距离。文本的细节相对比较粗糙。
不过我搜集了一些投资人、学术界和工业界的观点,相对一致的是,都认为长文本未来的机会是足够大的。无非是在多大程度上替代 RAG。
我自己的感受是,如果有技术已足够成熟的长文本输入和输出的用户侧产品,那么就可以覆盖一个非常好的场景,即垂直知识库:
博物馆可以自建知识库;
每本书可以有自己的知识库,有多本书的作者也可以整合成一个知识库;
个人自己的日记库,哪里发生了什么,直接讲给对方听;
某地旅游的知识库,或者当地生活信息的知识库;
...
这类产品目前也存在,也有很多开源技术可以用,不过还是话说回来,能够用开源技术自建模型,和使用体验优异的用户产品,门槛高低会直接呈现在用户的规模和商业价值上。
这是 Kimi 选择长文本的逻辑,也是一种长期主义的做法。如果只看当下的使用效果,可能 RAG 就足够了,但要想布局以后,长文本会更有机会。
这是一个年轻的技术,也意味着这是一个有成长机会的技术。
4年轻的用户沟通方式
了解大模型的朋友就知道,数据是大模型的核心壁垒之一。而为什么 ChatGPT 的产品路线被大家认同,过去 Google 那种在公司实验室里养蛊的方式就不再受欢迎,就是因为有了用户的参与和真实的使用数据,产品迭代就成了有源之水、有本之木。
Kimi 很有意思的地方在于,它也有了特别的社区氛围。你可能会疑惑:没有在 Kimi 的官网看到社区啊,哪来的社区氛围?
我一直认为,社区出现不在于形式,而在于是否有实际的真实成员、以及成员之间的交互。就像某个短内容平台,每天用户上亿,但用户之间从不发私信,只是给网红点赞,就称不上社区。
Kimi 的社区更多发生在小红书、即刻这些内容平台。以我熟悉的即刻为例,就有很多用户自发分享使用方法(篇幅有限,截取部分):
还有 Kimi 的产品经理自己予以总结和引导(原帖有31条,截取部分):
这些是格外有价值的一些传播。
日常的投放只能做到让人留下印象,更多只是物料。这些自发出现的 Kimi 的用户,能够沉淀很多内容,不光带动更多人关注 Kimi,还能更好地使用 Kimi,乃至参与到其中。官方在即刻出现这些内容后,也动作很快,不少员工入驻,共同讨论。
不止是让 Kimi 有传播,不止是一种低成本的营销策略,也同时能帮助一个 AI 应用层的团队,去研究有哪些真实的场景和真实的问题。这是通往真正杀手级应用不可或缺的一条路径。
这种年轻的状态,背后是年轻的团队。
5年轻的团队没有包袱
产品的年轻感是个很玄的事情,这背后与团队的年轻有很大关系。可能是我自己接近中年, 产生了一些偏见,我始终觉得年龄也与能否在新技术要素出现的时候创新,有很大关系。
我这两年读各种历史故事比较多,发现历史上也不断重演这种故事。只有没有历史包袱的年轻人,才能在新技术要素到来时更没有负担。我认识的几个产品经理就加入了 Kimi,他们在职场上不太成熟,在产品架构上也经验有限,这在创业的时候反而变成了优势,前面说的,不管是选择更有挑战性的技术,还是选择更新颖的用户沟通方式,都是如此。
在 AI 领域也是类似,不同时代的专家,都会被新的专家颠覆。明斯基、麦卡锡这些创立了人工智能的老前辈,就被后来的杰夫·辛顿、杨立昆、本杰奥的技术路线给颠覆了。如今 OpenAI 带来的技术路线又很不同,Llama3又作为后来者引起很多轰动。都在验证,创新者还是要更年轻。
是挺残酷的一个认知,毕竟也把我自己划出了圈。总的来说,我个人更喜欢年轻的团队一些,很多经历过移动互联网,甚至有的经历过完整 PC 互联网时代的产品经理,他们主持的项目,我反而可能不太看好。
对于 Moonshot 和 Kimi,值得关注的还有它的创始人杨植麟。对于他的一些介绍,我早先了解的不算多,每次看到标题说「天才少年」「XXX 亲传弟子」就有点祛魅,不愿打开文章细读。后来多了解了一番,发现背景的确很好。我在这里把水分挤干,写几条供参考:
CMU(卡耐基梅隆大学)博士毕业,这是 AI 领域的几座大山之一;
是年轻学者中 NLP 相关领域被引用论文次数最多的之一;
曾经在 AI 最前沿的公司 Meta 和谷歌大脑任职;
苹果 AI 负责人 Ruslan Salakhutdinov 曾是其导师;
与杨立昆和本杰奥都共同发表过论文。
如果听过我在「半拿铁」的人工智能系列讲过的历史故事就知道,Meta(Facebook)的 AI 实验室、谷歌的谷歌大脑团队都属于 AI 发展历史上最有影响力的团队。而杨立昆和本杰奥不仅仅是图灵奖得主,他们还是新时代 AI 领域的宗师,都属于深度学习的重要创始人。
6商业化才能走得更远
我们都能感受到 AI 还尚未出现互联网时代的杀手级应用,形态如果是 Chat 好像也别别扭扭。相当于大家跑了几十米出去,看不到终点,终点是在百米,还是千米,还是半马,谁都不知道。
考虑到奔跑中的持久度的问题,最关键的就是能跑下去,也就是能生存下去,这就回到了开头提到的商业化。
对于 AI 产品,与很多过去的互联网产品很大的区别在于,边际成本还是略高的。前阵子用户涌入,就一度挤爆了 Kimi 的服务器和算力。而每多一些用户的使用,Kimi 就要承担更多的压力。
现在做产品,商业化是不得不面临的问题,一来真正能够靠补贴打开市场、建立网络效应的产品机会不多了,朱啸虎的投资风格不再适用了(硅谷那边叫闪电式扩张,LinkedIn 创始人里德•霍夫曼专门写了一本书),二来环境也变化了,资本市场的心态也发生变化了。能够走得更远的团队,更要在意当下是不是走得更稳。
Kimi 这次商业化应当是在意料之中的,而且使用的方法很有意思,是尽可能不打扰用户的方式,跟很多其它产品不同,不会在到处弹窗、或者用到一半要求付费(心理测试那一招,测试免费,拿报告花钱)。
算力不足时,在高峰期也想继续使用 Kimi ,就可以用「加油」功能,是这样的:
这是在场景上做了很多思考,找到的顺滑切入方法。尤其对于第一种情况,相信是最常见的情况,在算力不足时提供一个选项,就像在很多市场环境中的快速通道策略,比如迪士尼的快速通行证。目前的价格我看了下,大概是处于1.2-1.5/天 之间的提速价格,对我而言,在急用时也的确给了一个划算的出口。点击这个界面上的「换一个」,就能切换不同的价格选择。
这个情况想必很难覆盖多数用户的场景,也不会是商业化比较完全的形态。能看得出来 Kimi 团队的节制,当下的功能还是为了探索用户的付费意愿,以及付费的恰当节点。真要是为了赚钱的话,贵互联网行业有着千百种黑魔法能大幅提升转化率——只不过就是放弃做品牌了,赚波钱就走。这种商业化的做法,也透露着一种年轻感。
我相信对于有的用户来说,会有负面的情绪,这也很正常。只不过我作为一个产品人和内容创作者,还是很期待很多产品有更体面和更健康的商业模式。门口免费送包子的店有一天不免费了,我们也不该骂店主没有良心,不是嘛。
说到最后,结论会是 Kimi 特别优秀,或者 Kimi 必然能成功吗?也不是。哪怕说了这么多 Kimi 比较好,也只能说在 AI 产品市场里,Kimi 是起步比较快,甩开了一些对手,但终点还是很远。Kimi 透露出来的年轻感,落在了用户体验、技术选择、用户沟通乃至商业化上,是件很有意思的事情。这种年轻感,也许能带 Kimi 走得更远,也许是一种更长期主义的走法。我也拭目以待。
(举报)
发表评论取消回复