news-base：从抓取到页面展示的简化时序图

归类：开发工具 / 内容聚合 / VitePress 发生时间：2026-03-30 状态：✅ 已落地

一、背景

news-base 不是单纯的“抓新闻脚本”，而是一条完整的数据到页面链路：

这意味着页面层并不直接依赖抓取实现，而是依赖稳定的数据产物。

抓取入口是 scripts/crawl_news.js。它会读取来源配置，并根据不同来源类型抓 RSS、Atom、HTML 或 GitHub Trending 页面，再把返回结果统一转换成站点内部的新闻模型。

真实源会受网络、页面结构变化或平台限制影响，所以脚本不会把“真实抓取失败”直接等同于“站点不可用”。如果某个分类结果不足，脚本会从内置的 fallbackCatalog 补齐内容，保证每个专区都有最小可展示条数。

抓取和补齐完成后，脚本会一次性生成多份静态产物：

这些 JSON 会被同步写到运行时目录和文档站点目录，保证本地构建与发布态消费同一份结构。

页面组件只做一件事：读取 JSON 并渲染。

因此，首页、今日页、分类页、reader 模式和 admin 模式都能共用同一套数据契约。

如果要快速向团队解释 news-base，可以直接用一句话概括：

news-base 先把多来源内容收敛成统一 JSON，再让页面组件只围绕 JSON 工作，所以抓取、归档、文档和展示可以稳定闭环。