通过抓取数百个新闻来源,利用人工智能分析新闻,并提供简洁、个性化的每日简报,帮助用户从新闻噪音中筛选出有价值的信息。
meridian
通过抓取数百个新闻来源,利用人工智能分析新闻,并提供简洁、个性化的每日简报,帮助用户从新闻噪音中筛选出有价值的信息。
Github地址
https://github.com/iliane5/meridian
在线体验
https://news.iliane.xyz/briefs
项目特点
- • 提供背景和驱动因素:帮助用户理解事件的背景和原因。
核心功能
- • 广泛的新闻来源覆盖:整合了数百个多样化的新闻来源。
- • AI 分析:采用多阶段的大型语言模型(LLM)处理,包括文章分析和集群分析。
- • 智能聚类:通过嵌入向量、UMAP 和 HDBSCAN 算法对相关文章进行分组。
- • 个性化简报:生成每日简报,具有分析性语气和连续性跟踪。
- • 简洁的 Web 界面:使用 Nuxt 3 前端框架,提供清晰的用户体验。
工作原理
- 1. 抓取:使用 Cloudflare Workers 抓取 RSS 源,存储文章元数据。
- 2. 处理:提取文本内容,利用 Gemini 模型分析文章的相关性和结构。
- 3. 简报生成:对文章进行聚类,生成分析内容,合成最终的简报。
- 4. 前端展示:通过 Nuxt 和 Cloudflare 展示简报。
技术栈
- • 基础设施:Turborepo、Cloudflare(Workers、Workflows、Pages)
- • 后端:Hono、TypeScript、PostgreSQL、Drizzle
- • AI/ML:Gemini 模型、multilingual-e5-small 嵌入向量、UMAP、HDBSCAN
- • 前端:Nuxt 3、Vue 3、Tailwind
项目状态与未来计划
- • 已完成的核心功能:抓取、处理和分析功能已实现。
- • 当前优先任务:自动化简报生成(目前需要手动运行 Python 笔记本)。
本资源收集于网络,只做学习和交流使用,版权归原作者所有。请购买正版授权并合法使用。若侵犯到您的权益,请联系我们删除。原文链接