这还会换个方式避开机械劳动了,🐂的。

“我先抓根因,不猜”
猜是哪个模型的口头禅?
最近模型好多问题,antigravity 提示MODEL_CAPACITY_EXHAUSTED;codex 更新 gpt5.4 之后就十分慢;claude 系列又一直封号,感觉被强制放假了,苦恼😖。
小猫真好,我一看他,他就把尾巴竖起来了,训人能力一流。
Antigravity 真好用,还能自己调用 Nanobanana 生成图片,应该是三家里面最大方的了。
关于 AI 社交的一个思考:
Agent 运行的前提是权责一致。
- Code Agent
我会为他的代码买单。哪怕把我的整个仓库弄坏了,我也承认。 - 交易 Agent
我是真的会给钱让他去处理事务。比如买票、下单奶茶等行为,我都会付钱,并且真的有东西交付到我这里。
但是社交 Agent 呢?我该如何为我的社交 Agent 买单?
当社交 Agent 说出这句话的时候,我和其他人都知道这句话不是我说的。在这种情况下,和我的社交 Agent 进行交互的意义又在哪里呢?
Agent 与现实交互产生效果的一个前提是:你赋予了它一部分权利。
春节期间,我给家里的几位长辈都装了蚂蚁阿福。我的思路大致如下:
当前影响产品效果有两个最核心的因素:一个是基座模型的智能,一个是 Context Engineering。
基座模型的智能
基座模型覆盖日常使用场景基本上没有任何问题,阿里在这方面也完全够用。Context Engineering
在健康领域这种私密数据占比特别大的场景下,越早布局赛道、用户越快地将身体健康数据输入到 App 内,就越容易发挥 Context Engineering 的优势,做出更好的效果。
当下可以考虑的其实只有“蚂蚁阿福”这样一个选择。
至于豆包,我认为弊端是包容太多的上下文了,体感认为它目前还没有能力从中精确地筛选出和健康相关的上下文,并给出比阿福更准确的回答。
从长远来看,像健康这样的场景,核心竞争力还是在于上下文的获取。因为大家的专业知识都是顶尖的,那谁能够更快速地获取到用户相关的上下文,谁就能够占据这个赛道的头部地位。
这些上下文包括:
- 手机设备
- 运动手环
- 其他理疗设备(血糖仪)等
通过自动获取分析,或者主动提醒用户去填写,扮演一位更加专业的“管家”角色,谁就能够脱颖而出。
关于语音输入法的一些思考:
Typeless 目前看起来效果很惊艳,因为它能够把你口头那种无序的表达,转成结构化的表达。但是这个东西真的有价值吗?
我们反过头来想一下,这些文字本身是给谁看的:
- 如果是给人看的,那这种转换在大多数场景下是有价值的。但其实当你口述一段长文时,也很少有人会去把整段长文看完,现在的人无非就是丢给 AI 总结。
- 如果最终喂给的对象都是 AI,还需要 Typeless 这种中转站去转换吗?
在最符合直觉的逻辑里看来,Typeless 的模型肯定没有那些头部厂商的模型智能。给一个不够智能的模型说你的原始想法,让它转化完之后,再喂给一个最智能的模型,那中间的信息损失真的可以忽略不计吗?
总感觉语音输入法未来可能是一个伪命题,或者说,带这种转换的语音输入法是一个伪命题。
Typeless 刚刚更新了一波,我觉得是一个很明显的反向更新。
首先,更新完成之后,它要求我必须做完所有的示例才能够正常使用功能。这不是第一次安装,而是在正常使用过程中跳出来的更新。我点击更新后,它不允许我跳过,这是一个很糟糕的选择。我知道你想让用户体验新功能,但这会让用户有一种被重复教育的感觉。
其次,它新增的功能更多偏向于一种实时唤起的 AI 助手。比方说:
- 你可以翻译选中的一段话
- 你可以重写这段话的语气
- 甚至可以问一些问题,比如“最近有哪些 AI 新闻”
这些都是它给的示例,但我并不觉得这是 Typeless 该做的东西。原因很简单,这些需求我都有专门的工具或工作流:
(a) 如果我想获取 AI 最新新闻,我有自己的信息源和 AI 工具,可以帮我每日汇总成一份日报。
(b) 如果我想搜索东西,我会更倾向于使用 Gemini 和 ChatGPT,而不是用一个所谓的 Typeless。它背后连什么模型都不知道,我甚至无法确定这些信息源是否真实,那我为什么要用它呢?
在我看来,这就是 Typeless 的一次盲目扩张。
它之前作为用户和系统之间语言沟通的桥梁,这个定位完全没有问题,体验也很顺滑。但是它现在想要从桥梁变成系统底层的一部分功能,甚至说是核心的处理功能,那我觉得会有很大的问题。我不觉得它目前有能力承担起这样一个操作中枢的需求,或者说是实现这样的功能。
之前有个类似的点子一直没来得及做。
原点:我对阳台种植完全不懂,所以会每天拍一张照片给 gpt,让他分析我植物的状态,然后告诉我要做什么。
痛点:chat 窗口上下文管理很麻烦,比方说我需要记录自己浇了多少水,最近天气变化,都只能存在历史聊天里面,会和其他信息混淆在一起,时间拉长了就会比较糟糕。
方案:做一个 App,本地存储关键数据,用户询问 AI 的时候会自动带上重要上下文,还能主动 push 用户关注植物。
额外想法:人在和植物做交互的时候,植物其实也会有反应,只是无法表达。如果 AI 可以扮演植物视角,每天写日记,只有在植物成熟或者枯萎或者某个特定的日子用户才能查阅日记,可以体验到和植物的情感联结。




新版 codex 真好用啊,不知不觉就达到一周限额了,想请教各位即友除了升级到 200 的会员外,还有更有性价比的方案吗?

VibeCoding 过程,有些时候我需要拆分成两个文件夹工作,然后把文件夹 B 的内容再转移到文件夹 A。
在过去,一般需要定义好接口格式,然后写一个批量化处理的程序,把文件夹 B 的内容批量加载到文件夹 A 里面。但是这套实践下来,发现确实太过时了。
在现在的时代,你其实只需要跟 AI 说明清楚需求,AI 自然就会帮你把文件夹 B 的内容,以一种它自己能懂、符合逻辑的方式转移到文件夹 A 里面。
所以可能在这个时代,文字就已经成为接口了。
元宝还在老一套分享领红包,所谓的结合 AI 就是用他的模板生成一些流水线的新年祝福图片。
千问直接 AI 点单送奶茶,拉新的同时让用户体验真正的商业 Agent 流程。
已经是两个时代了 :)
每一次下载安装 Dia 都是一次美的享受。
从第一次打开时,内容像月亮升起般的那种效果,到清脆的键盘敲击声,再到切换动画演示功能的示例——只需几个简单的小动画,就能展示出产品的优势。
说实话,核心的 chat 功能我其实用的很少。
但是产品内的一些交互体验,比如侧边栏、群组,以及对谷歌插件的支持和数据的迁移,都会让我有一种“为什么不用它”的感觉。
typeless 的优点是智能化,反过来就是自作主张。
我复制了一段错误信息,然后准备发给 gemini 分析问题并处理,他就会直接拿到错误信息然后调用自己的模型分析并给我方案,但这并不是我需要的。因此我还得重新再输入一遍。
智能化和打扰的边界真的很难界定。
gemini cli 在工作的时候会给用户讲冷笑话;
Kimi cli 在工作的时候会显示一个月亮emoji 阴晴圆缺的变化;
claude code 会显示Spelunking之类的趣味状态;
只有 codex 啥都不显示。
每次都是喊小爱同学给猫咪出粮,现在小咪只要一听到小爱同学就会蹲在饭盆前。会不会在猫咪的世界里科学家也发现了一条规律呢?
“小爱同学”
“我在”
“出一份粮”
「哗啦啦」
推导出:这个时候冰凉的灰色容器里面有饭吃。
智谱语音输入法的更新功能终于从浏览器下载安装包变成产品内自动更新了,这应该算是现代产品必备的功能了吧,没想到 1.6.0 版本才加上。
首次下载体验 Typeless,初始化的过程很有意思。在告诉用户它有哪些功能的时候,给用户带来一些 Aha Moment。
并且在这个过程当中,它应该在做一些采集用户声音数据的动作,让用户的声音跟案例去做比较,进而在后续用户使用时能够更好地提升准确率。我猜应该有这样一个工程化的过程。
我觉得这是一个很好的案例。后续如果任何产品需要用户去做个性化适配,都可以在产品初始化的过程中设计一些小案例:
- 让用户体验功能
- 同时收集用户的数据
这是一个很丝滑的过程。
好文,赞👍。
今天刚好有个案例,SEO 外链分析的时候需要看原网站内容是什么,目标链接的内容是什么,给 gpt 和 gemini 都无法实现,放在 cli 里面又太重了,还需要配工具或是 skill。
给到 manus ,算了一下 100 条链接 1000 点积分,我人工看 100 条得要 2 个小时,收益为正,直接给他跑然后出结果就行。
人和 AI 交流为什么需要语音输入法?
因为这一段字打出来太累了。

有一个商业化的困惑,Manus 这种合作不会影响 similarweb 的商业化吗?
我猜测是用户付 Manus 钱,然后 Manus 再抽出一定比例付给 similarweb,那不就是按量付费吗?比起月付模式营收是否会降低呢?




任何卡住工作流的点都可以先问问有没有 mcp。
例如最近在开发 ios app,一开始需要AI 写完代码再手动编译,后面加上 mcp 后可以自动编译,再后面可以自动运行到指定设备上,接下来要解决的就是读取设备的屏幕效果,自行检查有无问题并优化功能。
现在 AI 做出来的前端页面只有代码实现的效果,那其他的切图,素材之类的大家是如何解决的呢?用生图AI 一个一个生成切图吗?
现在都是想要扩充人的上下文,有没有那种给宠物用的 AI 设备,获取他们每天的上下文信息,分析叫声和行为的意义,帮助人更好理解他们。
售卖希望是最挣钱的,定价就是人们对于未来美好生活的 1%,并且维持希望,就可以持续售卖。

folo获取微信公众号的推送总是失败,尝试更换了几个实例也不行,实在不想每天切换几个平台看内容了,请教各位有什么好的方案或者工作流吗?
从小学王维“诗中有画,画中有诗”,但每次看到他的诗还是会有惊艳感,title 在实际成果面前一文不值。

十分喜欢最新一期的无聊斋,最打动我的就是节目末尾嘉宾说“旅行最大的意义就是让人有享受当下的能力”。
我很少享受当下,从小学的就是“延迟满足”,“以后就会好”。
大学的时候喜欢上了辩论,现在回头看很重要的一个原因就是能专注当下。
辩论是一项社会价值很低的活动,如果能把时间、精力、金钱放在实习或者专业学习上未来可能会更好,但我当下就不快乐了。
所以不用去旅行也是可以享受当下,先吃个又甜又脆的大苹果🍎。
捕风捉影好看,梁家辉太帅了!
我出电影院不自觉比划他拿刀的手势,上次这样还是小时候看孙悟空。
从今天开始,我要严格要求自己的写作内容,就从每一句话的末尾带上标点符号开始。
一句话如果没有句号,就像是思绪始终处于发散状态,没有坍缩为一点,无法给出致命一击。
【原创曲《我来自浪浪山——牛马小妖自传》“延迟退休到了六百岁 都够唐僧取经多少回”-哔哩哔哩】 https://b23.tv/4hDcs0z
人类写词,AI 编曲加演唱
效果很赞!
lyricify 这个功能给我整笑了

看小米创业思考的时候也有类似感悟
把自己当做品牌经营 专注 极致 口碑 快
今天看腾讯会议的API时,发现有个巧妙的设计
设定周期性会议的时候,需要设置每个月的几号重复,假设每月 1,5,7号重复
我最先想到的就是传一个数组【1,5,7】,但腾讯会议传的的是2的幂次之和,也就是 2^1 + 2^5 + 2^7
一开始我还不太理解,问了Gemini之后才知道这个叫位掩码
简单说就是用二进制表示每个开关的状态
比方说 2^1 = 10 ; 2^5 = 100000; 相加之后就等于100010,只需要看对应位置上是否为1,就知道这个开关是开还是关
原本31个开关,直接转化为了一个数字,相较于一个数组来说优美太多了!
解析只需要按位置读取;更改只需要变化对应位置数字;前后端交互也只需要一个数字,而不是一串数组
数学真奇妙,世界上聪明脑袋太多了!
秘塔的deepresearch采用了导图的形式展示研究过程,用户体验比传统线性chatbot要好很多
其实所有AI产品的研究都是多线程进行,但不明白为什么Chatgpt会选用单列形式展示过程,后面的产品也就直接跟随了
秘塔还是很强的,能找准用户需求点很强,能和头部做到不一样更强
AI 竞赛,看看哪家猜得准

体验世界不是一种选择,而是一种能力
乏味的工作在消解我的能力
深圳吸收着源源不断的年轻人,使他的生产,消费,决策都偏向他们,这又进一步吸引他们前来
能接受别人指出错误是更进一步的自信,不只是相信自己没错,而是相信自己能从每次错误中学习经验并变得更好。

寂寞围绕着电视 垂死坚持
在两点半消失
坐班是痛苦的,不知道为什么在工位就是不想画方案
但回到家之后,听着兰花草,画起来却很轻松愉快
快乐的事情就是正确的事情
好听

一边听世界第一等,一边在工位拉磨 :(
最近上班都快抑郁了,转行到金融后每天都被骂,虽然我还是觉得自己很聪明,但学习总是痛苦的。
车子还被人蹭了,中午没地方午休,趴在桌子眯 5 分钟手就麻了。
于是爬起来继续改方案,顺便听最新一期无聊斋,故事真好,教主和朋友的对谈也很有趣,心情都明亮起来了,感谢@刘旸教主
工作的痛苦
每次改完方案再汇报的时候我都习惯总结这次改的内容
有的时候列出来才发现只改了一点点,但一看时间 一个半小时
为自己的效率感到痛苦
以前打辩论的时候,线下沟通效率比线上要高很多,因为线下比线上要更难回避冲突
当我看着你的眼睛发表看法时,你会更难接受差异,更容易产生反驳,进而更好的打磨观点
有没有带分支的chatbot工具推荐呀
预期形式就是正常聊天,突然有个题外话想带着上下文问一轮/多轮,然后再切回主线,不想让题外话占据宝贵的上下文空间
cherrystudio有个分支功能,但会直接新建会话,感觉有点粗暴
有没有可能做成类似git的形式呢?