Key Takeaway
- AI浏览器定位:面向普通人网页Agent,满足智能搜索/总结、自动化任务、多模态交互;Perplexity Comet最佳,需邀请码。
- Comet能力演示:处理YouTube/抖音视频(定位、总结、生成脚本);博客/网站爬取提取内容;自动化如监控上传点击发布、填促销码。
- 市场潜力:务实AI用法(网页开着自动处理);Perplexity工程/产品强,AI浏览器或成首个杀手级应用,赛道竞争激烈。
如果说Claude Code是面向程序员的Agent的话,那么AI浏览器就是面向所有普通人的Agent。
普通人平时接触最多的是什么?网页。对于网页,普通人的AI需求是什么?总结起来无非就这三样:智能搜索与总结,自动化任务,多模态交互。
AI浏览器就是瞄着这三样来的。它是一个面向大众的AI Agent,普通人的“万能助手”。
目前AI浏览器这条赛道已经有点挤了,好几款产品在竞争。大家如果能拿到邀请码的话,一定要试试Perplexity Comet。我生成的两个邀请链接都在知识星球newtype里分享了。
我认为,Comet应该是目前做得最好的AI浏览器。它对浏览器和网页的操作已经很成熟了。
你看,我让它帮我打开一个YouTube视频,内容是乔布斯正好提到Technology is not enough。这一段就是非常著名的“站在科技与人文十字路口”的出处。
Comet先是搜索,然后获取完整的内容并且定位,最后它不仅打开视频,而且是从对应内容的位置开始播放。
同样的用法,看视频的时候,可以让Comet帮忙总结。然后挑选其中一个内容,让Comet直接跳转过去。
通过这两个例子我想告诉大家的是,Comet对于网页中各种内容的提取和识别已经很成熟了。除了像YouTube之类的国外网站,它还能处理国内视频网站的链接,比如抖音。
我打开网页版的抖音,进入我自己的账号页面。把其中一期视频的网页链接给到Comet,让它帮我做总结。你看,它完全搞得定。
如果你是做自媒体的生意,你肯定知道,这意味着什么。比如,找一个对标的视频,直接让Comet生成一分钟以内的短视频脚本。它连钩子之类的概念都清楚。如果把提示词好好整一整,输出的质量会更高。
Comet能搞定视频内容,就更别提文字内容了。
这个是我的博客网站。我所有文字内容,包括视频脚本、笔记等等,都发在网站上。这么长的一篇文章,让Comet做总结并且提取里边的要点,它做得相当不错。
更进一步,我还可以让Comet把整个网站都爬一遍,把里边与Agent强相关的内容都梳理出来。Comet会想各种办法去了解网站的结构,然后提取内容,最后完成输出。
我相信,这种基于网页内容的场景一定是离普通用户最近的。网页天然就是丰富的上下文,这是Agent能大展拳脚的地方。其实,除了内容之外,Comet还能像人类一样识别网页上的输入框和按钮,进行操作。
举个例子。在抖音、小红书的网页后台发布视频,一定要等到视频上传完成了,才能点击那个发布按钮。这一点真的很烦。尤其像我这种超过5分钟的4K视频,多个平台一起传的时候,真的需要等挺久的。
这个时候,就可以把最后一步交给Comet来自动化完成。你把它开着就好。它会帮你盯着网页,一旦上传完成,就会点下发布按钮。
除了这种用法,我还看到有些用户让Comet去填促销代码。Comet会上网搜索,每找到一个都填进去试试,直到成功了为止。
我知道,这种AI自动化的程度,有些人可能会看不上,觉得要那种从头到尾全搞定才牛逼。但是你要知道,把网页开着就好,Comet会自己搞定。你可以该干嘛干嘛去。这个才是最务实的AI用法。
要搞出全民级的AI应用,除了AI技术过硬之外,还需要很强的工程能力和产品体验。这些恰好是Perplexity的强项。在AI搜索遇到Google强力反击之后,AI浏览器是他们接下来的生命线。
现在各家的产品都很克制,需要邀请码。一旦到了某个Tipping Point,全都放开的话,AI浏览器肯定会成为第一个杀手级的AI应用。
OK,以上就是本期内容。想了解AI,想成为超级个体,想找到志同道合的人,就来我们newtype社群。那咱们下期见!