Skip to content

通过 Codex 创建自动化新闻筛选总结流程

1681 字约 6 分钟

Codex新闻总结自动化写作流程

2026-05-20

这两天我给自己的 VuePress/Plume 知识库加了一套很轻量的新闻简报流程。它不是一个完整 CMS,也不是爬虫系统,更像是一个“技术写作流水线”:检索新闻、筛选来源、生成结构化摘要、保存原文链接、必要时保存截图,然后把结果落成 Markdown。

目前英文新闻先分成 AIFinance 两类,两个分类都用 Plume 的 post-list 样式展示。这样读者看到的是博客式列表,而我维护时看到的是清晰的文件夹结构。

我为什么这么设计

我想要的不是“每天复制几条新闻标题”,而是一个能长期维护的知识库工作流。新闻本身有时效性,但每天的市场主线、技术趋势、监管变化和公司动作,最后都可以反过来帮助我理解金融、AI 和数据分析。

所以这个系统要同时满足三个要求:

  1. 写作要快:每天可以快速生成一篇简报。
  2. 结构要稳:文章、分类、图片、链接都有固定位置。
  3. 结果要可验证:构建能通过,截图能打开,链接能追溯。

文件结构

英文内容虽然是默认语言,但我还是把它放在 docs/en 下面,方便维护:

docs/
  en/
    blog/
      2026-05-20-codex-news-briefing-workflow.md
    news/
      AI/
        2026-05-20-ai-daily-briefing.md
      Finance/
        2026-05-20-finance-daily-briefing.md

前台路径保持简洁:

/blog/
/news/
/news/article/finance-daily-briefing-2026-05-20/

这里有一个很重要的 Plume 细节:新闻分类是从文件夹生成的。文章放在 docs/en/news/AI/,它就是 AI 分类;文章放在 docs/en/news/Finance/,它就是 Finance 分类。所以目录不是单纯存文件,它本身就是发布系统的一部分。

Codex 在这个流程里的角色

这类任务很适合 Codex,因为它横跨三件事:

  1. 研究:检索当天新闻,判断哪些新闻值得放进简报。
  2. 写作:把新闻整理成固定结构,而不是散乱摘要。
  3. 工程维护:创建 Markdown、保存图片、修改链接、跑构建验证。

我不希望它只是总结搜索结果前五条。真正有价值的是让它像一个编辑加工程助手:先筛选,再归纳,再落地到项目文件中,最后确认站点能正常生成。

我现在使用的主提示词

下面是我以后可以复用的主提示词:

请为我的 VuePress/Plume 知识库创建今天的英文新闻简报。

分类:[AI / Finance / 其他分类]
日期:[YYYY-MM-DD]
目标文件夹:docs/en/news/[Category]/
图片文件夹:docs/.vuepress/public/pictures/news/[category-daily-YYYY-MM-DD]/

要求:
1. 检索今天该分类中最重要的新闻。
2. 优先选择官方来源、一手报道、Reuters/AP/Bloomberg 风格的市场报道,或可靠的专业媒体。
3. 选择 4-6 条新闻。不要只列标题,要总结当天共同主线。
4. 每条新闻包含:
   - 发生了什么
   - 为什么重要
   - 接下来关注什么
   - 原文链接
   - 只有当截图是真实文章页面时才保存并嵌入
5. 生成带 frontmatter 的 Markdown:
   - title 以 YYYY-MM-DD 开头
   - createTime
   - permalink
   - tags
   - categories
   - cover
6. 有效截图保存到本地,并用 /pictures/... 路径引用。
7. 运行 npm run docs:build,验证文章路径、分类页和图片资源。

我后来特意加了“只有当截图是真实文章页面时才保存”这一条。因为在生成 Finance 新闻时,有两个网页截图其实截到的是 Access Denied 和 Cloudflare 验证页。这种图片没有信息价值,应该删除,而不是假装它是原文截图。

新闻筛选提示词

新闻质量主要靠筛选。我的过滤提示词是:

写作前先过滤搜索结果。

保留会影响市场、政策、基础设施、公司基本面或长期行业方向的新闻。
删除重复转载,除非转载页面是唯一可访问来源。
避免社交媒体传言、低质量 SEO 改写、没有明确来源的文章。
优先选择有日期、明确机构、可衡量影响和原始报道的新闻。
把相关事件组织成同一条主线,不要写成互相割裂的摘要。

AI 新闻通常关注模型、实验室、人才流动、基础设施、产品发布、监管和法律结构。Finance 新闻则更看重跨资产链条,例如利率、央行、油价、汇率、财报、信用和政策。

截图处理规则

截图不是装饰,它是证据。现在我的规则是:

只有页面内容可读、文章主体可见时才保存截图。
如果截图是 Access Denied、机器人验证、Cookie 墙或空白页,就删除。
即使删除截图,也保留原文链接。

图片目录约定:

docs/.vuepress/public/pictures/news/finance-daily-2026-05-20/

Markdown 中引用:

/pictures/news/finance-daily-2026-05-20/ap-global-markets.png

这样做的好处是,VuePress 构建时会把 .vuepress/public 下的资源复制到最终站点,文章不依赖外链图片。

文章模板

每篇新闻简报保持同一个结构:

# [Category] Daily Briefing: [Month Day, Year]

开头主旨。

## Executive Summary

## 1. [新闻]

发生了什么。
为什么重要。
接下来关注什么。
原文链接。
可选截图。

## What This Means

## Source List

固定模板看起来有点机械,但它非常适合长期维护。结构稳定以后,我可以快速比较每天的新闻,也能更容易把这个流程自动化。

构建验证

最后一步一定是本地构建:

npm run docs:build

然后检查关键路径:

/news/
/news/categories/
/news/article/[slug]/
/blog/

对这个项目来说,构建结果就是最终合同。Markdown 写得再好,如果路径生成失败、图片路径失效、分类页不对,就还没有完成。

后续可以怎么自动化

下一步可以做成一个定时草稿任务:

  1. 每天早上运行一次。
  2. 按 AI、Finance 等分类检索新闻。
  3. 生成 Markdown 草稿。
  4. 只保存有效截图。
  5. 留给我人工复核后再发布。

我暂时不会完全自动发布。新闻筛选本质上还是编辑判断,不只是信息抽取。Codex 最适合帮我做重复性的工程和整理工作,而最后哪些内容值得发布,还是应该由人来把关。

2023-2025 Powered by Kai with ❤️