claude-opus-4-7
Codex macOS code_sign_clone 占几十 GB 磁盘: 真相与清理
如果你在搜 com.openai.codex.code_sign_clone,大概率不是想读一篇技术散文,而是磁盘莫名变小、du 之后翻到一堆奇怪的文件夹,想搞清楚这玩意儿是不是病毒、能不能删、删了会不会把 Codex.app 弄坏。先把答案给你:它不是报错,也不是被入侵,是 Codex 桌面应用每次启动都会留下来的临

Codex CLI Intel Mac 安装指南:版本、Node 与 Rosetta
GSC 后台看到一个搜索词,叫”codex mac intel 版本”。84 次曝光,0 次点击。点不进来,是因为搜的人想要一个确定答案:我这台 Intel Mac,到底能不能跑 Codex? 答案要拆成两半。Cod...

Claude Code 合租,4 人车 400 一个月,KYC 封号都不用你管
官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。

Qwen3.6 27B vs Step3.7 IQ4_XS: 本地大模型量化精度实测
本地大模型怎么选:Qwen3.6 27B BF16 与 Step3.7 IQ4_XS 横评,从量化精度、显存账、编码 benchmark、Agent 适配、推理速度五个维度给一张选型矩阵,附四类使用者落地建议。

大模型选型指南 2026:Claude/GPT/Gemini/Grok/DeepSeek 怎么选
2026 年主流大模型已分化出清晰的能力地图:Claude 编程稳、GPT 通用全、Gemini 长文档强、DeepSeek 推理深、Grok 实时快。这篇基于 264 篇社区实测整合,按代码、长文档、Agent、中文、成本敏感等场景给出选型建议,以及别被 benchmark 骗的真相。

AI Agent 框架全景:LangChain/LangGraph/n8n/Dify 等选型指南
覆盖 LangChain、LangGraph、LangSmith、Langfuse、n8n、Dify、Coze、FastGPT、AutoGen、CrewAI 十款主流 AI Agent 框架横向对比、五维选型决策树、生产可观测与新手/团队两条学习路径。

Codex CLI 完整入门:安装、工作流、故障排查与 Claude Code 协同
OpenAI Codex CLI 完整入门:跨平台安装、首次配置、日常命令、MCP 与浏览器集成、Windows/网络/风控常见踩坑,以及与 Claude Code 的选型对比与双 Agent 协作模式。

大模型周刊 第 35 期:政府关停 Fable 5,国产 MIT 接住
作者:toy | 覆盖周期:2026.06.13 – 06.19 卷首语 本周是 2026 年第一次能清楚看到”治理变量”压过”模型变量”的一周。 周一晚 OpenAI 被 42 个州的检察长...

Karpathy 三层方法:把 prompt 升级成可验证系统
我最近看了 Austin Marchese 解读 Karpathy 在 AISN 2026 上的发言,被里面一个反常识的小例子卡住了:你问 AI “我去 50 米外的洗车店该开车还是走路”,Claude、Gemini...

Claude Code 在做减法
大部分人造 agent 的方向是加法:加记忆、加规划层、加工具路由、加一堆中间状态。Boris Cherny 给的是反方向的答案。他是 Anthropic 内部 Claude Code 的作者,最近在 Sequoia 的 AI Ascent...

AI 写代码,人退到了两头
有个概念我最近一直在用,叫”聪明区”和”笨蛋区”。提出它的是 Human Layer 的 Dex Hardy:一个大模型刚开始一段新对话时最聪明,因为这时注意力关系最松弛;你每往上下文里塞一个...

SAG 细读:用 SQL join 替图数据库的 RAG 实现
RAG 这个领域过去两年的主流方向是”补结构”。GraphRAG、HyperGraphRAG 都在解决一个问题——纯向量检索没法处理多跳推理,得给文档之间补上关系图。代价是要预先把整张知识图谱建好,存进图数据库,增量...

记住一个表达,从来不是因为努力记住它
我们都被同一种语言学习的失败困扰过:单词背了几千,听到 native speaker 还是要先翻译,张嘴前先在脑子里走一遍中文。这件事的归因,过去几十年都摁在”方法不对”上:是不是背单词的姿势错了,是不是语法没刷够。...

WebMCP:把网站变成给 agent 的 API
让 AI 帮你买两张演唱会的票,它背后要做多少事? 按今天的做法,agent 会先把整个页面的 DOM 抓下来,再读一遍无障碍树(accessibility tree)去理解页面结构,然后截一张图,分析那些在 HTML 里看不到的元素,最后...

Agent 上不了网,却告诉你它查过
我先给一种失败模式起个名字:隐性失败。没有报错,没有警告,没有任何异常提示,你拿到的只是一个错答案。 这是 Bright Data 的 Rafael Levi 在 AI Engineer 大会上一场演讲的主题。他做的是帮 agent 大规模...

从写 Prompt 到写 Loop
最近翻硅谷工程师的讨论,有个变化挺明显:以前大家比谁的提示词写得漂亮,现在开始比谁的循环设计得好。 OpenClaw 的创始人 Peter Steinberger 在六月初发了条帖子,被看了八百多万次。他说,别再忙着主动提示你的 codin...

AI Code Review 的架构选择:把 CPG 建在 master 上
写过几年代码评审工具的人都知道,PR Review 真正的瓶颈不是 LLM 的输出能力,而是 LLM 看不见的上下文——一个改动在跨文件、跨模块、跨服务之后真正影响了什么。 最近这一年,AI Code Review 的产品越冒越多:PR-A...

1M 上下文,难点已经换了地方
一年前,模型支持 100 万 token 上下文还是发布会上的高光环节。现在它更像手机快充,人人都有,没有反而奇怪。Claude、OpenAI、Gemini 在海外,DeepSeek、MiniMax、Kimi、智谱在国内,新发布的模型几乎默...

用 Cloudflare Workers 当探针面板:CF-Server-Monitor 解掉了监控者悖论
自己玩 VPS 的人迟早会遇到一个问题:手里 5 台机器要监控,得装一个面板把它们串起来;问题是面板自己也得跑在一台机器上,那这台机器谁来监控?再开第 7 台吗? 这就是监控者悖论。哪吒探针、Uptime Kuma 都绕不开这一层:Dash...

大型多模态模型的真正捷径,是给冻住的语言模型接一根线
过去三年,做”语言+图像”的人几乎都在重复一个动作:拿一个已经训得很大的语言模型,死死冻住它,然后在它前面接一个很小的转接头,把图像、视频、传感器数据翻译成它认识的”词”。听起来像凑合,但这条...

大模型的胜负手已经不在结构,而在效率
Paul 这一讲一开场就先打了个预防针:今天讲的是高度浓缩版的内容,MIT 隔壁的 ALP 那门课才是正经讲大模型,这里只是个高空俯瞰。听到一半我反而觉得,这种”俯瞰”才是真正值钱的。他把一个被无数公众号、技术博客、...




AI周刊:大模型、智能体与产业动态追踪