当前位置：首页 > news >正文

MiMo送820亿Tokens？！只有3天，时间紧，任务重！

news 2026/5/27 9:43:42

MiMo 送的 16 亿好不容易消耗了 25%~ 早上一看变成满血 820 亿了牛逼数字越来越离谱了我数零都数了好久能不能帮我换成钱啊这是不是受到了 DeepSeek 永久 2.5 折的刺激啊关键的问题是这个月只有 3 天了这个重置 N 倍配额是否有点……cc1fbe83-4fb9-4217-9c01-9078760db048-crop虽然这个 Tokens 纯度不太高但是量是真的大接下来就是终极一问如何在3天内消耗820亿了上一篇我讲了我询问不同 AI如何快速消耗 Tokens后来给了我就制作了一个武侠百科《江湖百晓生》MiMo 做的没法用。然后还做了一个文档网站。把 Claude 的 API 文档一口气全给拉到本地了。然后用 MiMo 翻译成中文文档这个事情还挺消耗 TokensMiMo 的结果还是能看的至少比全英文的好多了。今天就来讲讲这个使用场景吧然后记录一下我是如何使用 Opus4.7 结合 MiMo 来构建这个网站的。优质 Tokens 普通 Tokens 打组合拳不浪费一个 Tokens。1、Opus 负责高难度任务我们先让Opus完成最难的部分。分析网站抓取内容建立架构我们先来看一下 Claude 官方的网站这个网站数据量还是不小的而且基本上是全英文的状态。虽然它提供了中文选项。但是中文内容严重缩水残缺。抓数据其实是个老学科了但是现在也会有各种问题有些网站是根本抓不到数据的。所以我第一步是问了一下能不能抓到数据。Opus说可以看到然后开始上我的需求了我计划在当前项目目录下创建一个 claude/api 文件夹用来搭建一套 Claude API 文档的本地化资料库。我的目标是把官网上的 Claude API 文档按照网页原本的菜单结构下载到本地。这个网站有一个很方便的特点每个页面都可以通过在网页地址后面添加 .md 后缀直接获取对应的 Markdown 文件。因此我希望先基于官网的菜单列表和页面结构把这些 Markdown 文档下载下来并按照原网站的层级关系保存到本地。默认下载英文版本也就是 en 版本。在英文原版文档整理完成之后我还希望基于英文版再生成一套中文版本也就是 cn 版本。中文版的目录结构应该和英文版保持一致只是内容翻译成中文。这样可以方便后续对照、维护和学习。最终我希望基于这些本地 Markdown 文件制作一个类似官网的本地文档网页。这个网页可以把 Markdown 转换成 HTML并保留文档结构、导航菜单、标题、代码块、表格、链接等内容方便我在本地查阅和学习。Opus 收到需求之后进行了分析。Opus的分析思路1. 探索当前 MyDocs 项目结构看看你已有的 md→html 框架长什么样能不能复用 2. 验证 claude.com 文档站的 .md 接口和目录结构导航树的获取方式 3. 估算文档规模和翻译成本我并行启动两个 Explore agent再亲自抽取一两个 .md 端点验证。Opus的分析结果探索完毕。整体可行性分析如下你的想法评估✅ 方向正确但有几个需要决策的细节 # 好的部分采纳 .md 后缀技巧已验证可用所有页面都能拿到原始 markdown claude/api/ 占位目录你已经预留好了与现有 MyDocs 结构对齐先英后中分两阶段是对的先确保管线跑通再翻译 # 需要修正的部分不是纯 CommonMark是 MDX返回的 .md 文件包含 Card、Tip、Steps、Tabs、CodeGroup 等 JSX 组件标签。常规的 markdown-it / marked 不能直接渲染必须做转换映射mapping 到 styled div否则页面会显示乱码标签。 MyDocs 当前是纯手写 HTML没有 md→html 管线hermes-agent 那套是模板但 ~150-200 页文档不可能手写。需要建一个构建脚本fetch .md → 解析 MDX → 输出静态 HTML一次性生成全部页面。侧边栏导航需要单独抓sitemap.xml 有所有 URL但没有 Build with Claude Messages API 的分组顺序。需要从 /docs/en/intro 页面抓 sidebar HTML 或试 llms.txt。 # 规模数据英文文档约 150-200 页原始 markdown 5-15 MB 多语言官方有 11 种含中文但官方中文质量不确定自己翻译可能更可控 # 推荐的改进版方案把整个流程脚本化Python 单脚本~3 个阶段 fetch_docs.py → 抓 sitemap 所有 .md存到 claude/api/_src/en/ build_site.py → MDX 组件 → HTML 映射生成 claude/api/en/*.html 侧栏 translate.py → 调 Claude API 批量翻译 _src/en/*.md → _src/cn/*.md 复用 build_site.py 生成 claude/api/cn/*.html 这样英文站和中文站共用一套构建逻辑只是源 md 不同。在写最终方案到文件之前几个关键决策需要你拍板Opus的总结包含了好的部分需要改进的部分数据规模评估改进方案最后等我拍板然后就给我提了几个问题上图已经有完整的问题和我的选择了接下来就全部交给 Opus4.7 了。它制作了详细的计划文档然后开始执行。执行过程中它发现英文文档全量是 1541 页远超我初估的 150-200。先验证 MDX 渲染再决定要不要全量。看一眼源文件结构 ...这个数据量确实有点太大了我一口气吃不下而且我不确定这些文档是否有用。我让它分析了一下其中 1197 篇属于不同语言的 SDK 文档。我可能用不上就先不抓取了。最后的汇总信息如下# 汇总sitemap 1541 · 已抓 381 · 未抓 1197 # Part 1 — 已抓按 tab / group ├ Tab: Messages (72) — 10 个 group 完整展开 ├ Tab: Managed Agents (30) ├ Tab: Admin (25) └ Tab: Resources (263) ← 含 REST API endpoints 全部 # Part 2 — 未抓11979 SDK × 133 ├ Python SDK (133) ← details 折叠 ├ TypeScript SDK (133) ├ Java SDK (133) ├ Go SDK (133) ├ Ruby SDK (133) ├ C# SDK (133) ├ PHP SDK (133) ├ CLI (133) └ Terraform (133) # Part 3 — 后期补抓指引含代码模板总共抓取了 381 个页面这个过程非常丝滑没遇到任何问题也没遇到频率限制。Claude 官网是构建在 Mintlify 上面的我不清楚它的防抓策略如何。反正 Opus 轻松搞定了它帮我构建的目录结构如下claude/api/ ├── index.html 语言切换入口en / cn 卡片 │ ├── en/ ← 构建产物英文站 │ ├── index.html 英文落地页tab 卡片列表 │ ├── intro.html │ ├── get-started.html │ ├── build-with-claude/*.html │ ├── agents-and-tools/tool-use/*.html │ ├── managed-agents/*.html │ └── manage-claude/*.html │ ├── cn/ ← 构建产物中文站结构镜像 en │ ├── _src/ ← 源 markdown进 git不上线 │ ├── nav.json 抓取得到的导航树 │ ├── en/*.md 上游原始 MDX │ └── cn/*.md 中文版初期为英文占位 │ ├── _build/ ← 工具链 │ ├── package.json Node 依赖清单 │ ├── fetch.mjs 抓取脚本 │ ├── build.mjs MDX → HTML 构建器 │ ├── translate.mjs 中文骨架生成器 │ ├── components.mjs MDX 组件 React 实现 │ └── templates/ │ ├── page.html 文档页外壳 │ └── landing.html 落地页外壳 │ └── _assets/ ← 浏览器加载的样式与脚本 ├── docs.css └── docs.js同时帮我创建了四个脚本脚本输入输出何时跑fetch.mjsplatform.claude.comHTTP_src/en/*.md_src/nav.json想刷新上游内容时build.mjs [lang]_src/lang/*.mdnav.jsonlang/*.html landing改了源、模板或样式后translate.mjs_src/en/*.md_src/cn/*.mdfetch 后一次即可inventory.mjssitemap.xml nav.jsondocs/claude-docs-url-inventory.mdfetch 后想看完整 URL 列表还挺贴心准备了命令速查cd claude/api/_build # 抓取 node fetch.mjs # 默认: 11 页 allowlist (开发用) node fetch.mjs --tabmessages # 单 tab 全部 (~72 页) node fetch.mjs --tabmanaged-agents # ~30 页 node fetch.mjs --tabadmin # ~25 页 node fetch.mjs --tabresources # ~38 页 (不含 EXTRAS) node fetch.mjs --all # 4 个 tab sidebar 全部 (~155 页) node fetch.mjs --all --with-extras # ↑ 再 EXTRAS (sitemap 补抓) 381 页 # 调节速率默认 concurrency3 delay150ms node fetch.mjs --all --with-extras --concurrency2 --delay250 # 构建 node build.mjs en # 输出 en/*.html node build.mjs cn # 输出 cn/*.html # 中文骨架仅复制无 LLM node translate.mjs # 一条龙fetch build en scaffold cn build cn npm run all # 重新生成 URL 清单汇报工具不抓取 node inventory.mjs # 输出 docs/claude-docs-url-inventory.md通过脚本可以指定抓取内容可以快速根据MD文档构建网页然后也可以进行翻译也可以一条龙运行。因为它考虑到翻译的 Tokens消耗量比较大所以它暂时没有做留空了它不想浪费自己的 Tokens~~所以它的活到这里就结束了总共修改 20 万行内容目标网站分析报告执行报告和汇总报告全部做好了当然源代码也全部写好了尤其是把 MDX 到 HTML 的转换器也写好了。我只要一个命令就可以快速把所有MD文档转换成HTML网页可以快速构建一个纯静态的 Claude 文档中文镜像网站。有了这些资料只要是 Claude 相关的问题AI 就可以精准执行了2、MiMo 负责高消耗任务接下来就轮到 MiMo 上场了现在问题已经非常清晰了Opus4.7 已经把所有结构都做好了。而且把所有文档放在cn目录下面了。我只要让 MiMo 读取这些文档并翻译即可。它只做这一件事情后续执行一下 Opus 的脚本就能转换成网页了具体的操作就是打开 JCode然后把cn这个目录拖动到 Xiaomi 这个图标这样就可以直接打开 Claude Code 了模型和 API 相关数据已经自动配置完成了接下来的事情就非常简单了只要告诉他“帮我读取所有文件把其中的英文文档翻译成中文”然后就不用管了它会自己读取文件自己判断直接管理多个智能体并行翻译大概花费了几个小时几百个文档全部翻译完成。消耗了几个亿的配额16 亿中的 25% 消耗完了这个组合还不错现在 AI 能力非常强唯一缺少的就是新的或者准确的知识。所以构建一个专门给自己或者 AI 的知识库非常重要正好现在不差 Tokens把各种文档都捞一波然后做成中文版。英文的 MD 文档给 AI 看中文网页方便自己看完美我也有计划把我完整的文档库分享出来目前还只是有一个想法内容还没做好~~这种事情急不来只能慢慢来

查看全文

http://www.zskr.cn/news/1401206.html