mirror of
https://gitee.com/houhuan/TrendRadar.git
synced 2025-12-21 18:07:15 +08:00
549 lines
18 KiB
Markdown
549 lines
18 KiB
Markdown
<div align="center">
|
||
|
||
# 🎯 TrendRadar
|
||
|
||
**多平台热点资讯监控分析系统**
|
||
|
||
<strong>🚀 一键部署,最快一分钟配置完毕!</strong>
|
||
|
||
[](https://github.com/sansan0/TrendRadar/stargazers)
|
||
[](https://github.com/sansan0/TrendRadar/network/members)
|
||
[](LICENSE)
|
||
[](https://www.python.org/)
|
||
[](https://github.com/sansan0/TrendRadar)
|
||
|
||
[](https://work.weixin.qq.com/)
|
||
[](https://telegram.org/)
|
||
[](#)
|
||
[](https://www.feishu.cn/)
|
||
[](https://github.com/sansan0/TrendRadar)
|
||
[](https://sansan0.github.io/TrendRadar)
|
||
|
||
</div>
|
||
|
||
> 本项目是我玩微信公众号的副产品。如果项目对你有帮助,请 **点击 Star ⭐** 支持我~~有条件的可选择去【硅基茶水间】公众号对应的项目文章下面[点赞] or [转发] or [推荐],我能在后台看到你们的支持,成为老粉就在今天哈哈~(≧∇≦)ノ
|
||
|
||
## ✨ 核心功能
|
||
|
||
- **全网热点聚合** - 一站式监控 11 个主流平台(今日头条、百度热搜、微博、抖音、知乎、B 站、财联社等),统一获取多源热点信息,提升信息获取效率
|
||
|
||
- **多维度热点分析** - 智能识别话题生命周期,追踪热点从爆发到消退的完整走势,为**媒体从业者**、**市场分析师**和**信息爱好者**提供舆情变化洞察
|
||
|
||
- 或者像我一样通过这个工具来**反向减少对各种 APP** 的使用依赖的
|
||
|
||
- **智能内容筛选** - 支持自定义频率词,过滤词和必须词的配置,精准定位关注话题,有效过滤无关信息噪音
|
||
|
||
- **多渠道实时推送** - 通过**飞书机器人** 推送重要资讯或者**GitHub Pages** 自带的设置页面,一键跳转新闻详情。目前支持**企业微信**(10 秒配置完毕,设置速度最快,小白都会),**飞书**(消息显示最友好),**钉钉**,**telegram**推送渠道
|
||
|
||
- **开箱即用部署** - 一键 Fork 即可部署,简化部署流程和技术门槛
|
||
|
||
**💡 提示:** GitHub Pages 自带的设置页面也方便, 配置一下,保存一个网页链接即可,比如我这里[TrendRadar 网页版](https://sansan0.github.io/TrendRadar/).要达到一分钟配置完毕的速度,请优先选择**企业微信通知**
|
||
|
||
## 更新日志
|
||
|
||
**📋 升级说明:** 已经**fork**的同学,如果想获得最新功能:只需要把本项目中 main.py 文件里的所有代码复制过来,替换掉你那边的旧代码就行了(可以直接在 GitHub 网页上编辑)。
|
||
按照一般编程的逻辑,其实应该把 main.py 中的代码分散到多个不同的文件中,这样代码结构会更清晰,我写起来也更顺手。但考虑到大家升级版本的便捷性,我特意把所有功能都放在了一个文件里——这样你们只需要复制替换这一个文件就能完成升级 😘
|
||
|
||
### 2025/06/21 - v1.2.1
|
||
|
||
已 fork 的同学除了 main.py 需要更新,还有 crawler.yml ,也需要你复制替换
|
||
https://github.com/sansan0/TrendRadar/blob/master/.github/workflows/crawler.yml
|
||
|
||
### 2025/06/19 - v1.2.0
|
||
|
||
> 感谢 claude research 整理的各平台 api ,让我快速完成各平台适配(虽然代码更多冗余了~
|
||
|
||
1. 支持 telegram ,企业微信,钉钉推送渠道, 支持多渠道配置和同时推送
|
||
|
||
### 2025/06/18 - v1.1.0
|
||
|
||
> **200 star⭐** 了, 继续给大伙儿助兴~近期,在我的"怂恿"下,挺多人在我公众号点赞分享推荐助力了我,我都在后台看见了具体账号的鼓励数据,很多都成了天使轮老粉(我玩公众号才一个多月,虽然注册是七八年前的事了哈哈,属于上车早,发车晚),但因为你们没有留言或私信我,所以我也无法一一回应并感谢支持,在此一并谢谢!
|
||
|
||
1. 重要的更新,加了权重,你现在看到的新闻都是最热点最有关注度的出现在最上面
|
||
2. 更新文档使用,因为近期更新了很多功能,而且之前的使用文档我偷懒写的简单(见下面的 ⚙️ frequency_words.txt 配置完整教程)
|
||
|
||
### 2025/06/16 - v1.0.0
|
||
|
||
1. 增加了一个项目新版本更新提示,默认打开,如要关掉,可以在 main.py 中把 "FEISHU_SHOW_VERSION_UPDATE": True 中的 True 改成 False 即可
|
||
|
||
### 2025/06/13+14
|
||
|
||
1. 去掉了兼容代码,之前 fork 的同学,直接复制代码会在当天显示异常(第二天会恢复正常)
|
||
2. feishu 和 html 底部增加一个新增新闻显示
|
||
|
||
<p align="center">
|
||
<img src="_image/2025-06-14.jpg" alt="更新" width="400"/>
|
||
</p>
|
||
|
||
### 2025/06/09
|
||
|
||
**100 star⭐** 了,写个小功能给大伙儿助助兴
|
||
frequency_words.txt 文件增加了一个【必须词】功能,使用 + 号
|
||
|
||
1. 必须词语法如下:
|
||
唐僧或者猪八戒必须在标题里同时出现,才会收录到推送新闻中
|
||
|
||
```
|
||
+唐僧
|
||
+猪八戒
|
||
```
|
||
|
||
2. 过滤词的优先级更高:
|
||
如果标题中过滤词匹配到唐僧念经,那么即使必须词里有唐僧,也不显示
|
||
|
||
```
|
||
+唐僧
|
||
!唐僧念经
|
||
```
|
||
|
||
### 2025/06/02
|
||
|
||
1. **网页**和**飞书消息**支持手机直接跳转详情新闻
|
||
2. 优化显示效果 + 1
|
||
|
||
### 2025/05/26
|
||
|
||
1. 飞书消息显示效果优化
|
||
|
||
<table>
|
||
<tr>
|
||
<td align="center">
|
||
优化前<br>
|
||
<img src="_image/before.jpg" alt="飞书消息界面 - 优化前" width="400"/>
|
||
</td>
|
||
<td align="center">
|
||
优化后<br>
|
||
<img src="_image/after.jpg" alt="飞书消息界面 - 优化后" width="400"/>
|
||
</td>
|
||
</tr>
|
||
</table>
|
||
|
||
## 🔍 支持的平台
|
||
|
||
目前已支持以下 11 个热门平台:
|
||
|
||
- 今日头条
|
||
- 百度热搜
|
||
- 华尔街见闻
|
||
- 澎湃新闻
|
||
- bilibili 热搜
|
||
- 财联社热门
|
||
- 凤凰网
|
||
- 贴吧
|
||
- 微博
|
||
- 抖音
|
||
- 知乎
|
||
|
||
## 🚀 使用方式
|
||
|
||
1. **Fork 本项目**到你的 GitHub 账户
|
||
|
||
- 点击本页面右上角的"Fork"按钮
|
||
|
||
2. **设置 GitHub Secrets(选择你需要的平台)**:
|
||
|
||
在你 Fork 后的仓库中,进入 `Settings` > `Secrets and variables` > `Actions`,然后根据需要配置以下任一或多个通知平台:
|
||
|
||
### 🟡 企业微信机器人(配置最简单最迅速)
|
||
|
||
- 名称:`WEWORK_WEBHOOK_URL`
|
||
- 值:你的企业微信机器人 Webhook 地址
|
||
|
||
### 🟢 飞书机器人(消息显示最友好)
|
||
|
||
- 名称:`FEISHU_WEBHOOK_URL`
|
||
- 值:你的飞书机器人 Webhook 地址
|
||
|
||
### 🔵 钉钉机器人
|
||
|
||
- 名称:`DINGTALK_WEBHOOK_URL`
|
||
- 值:你的钉钉机器人 Webhook 地址
|
||
|
||
### 🟣 Telegram Bot (配置最复杂)
|
||
|
||
- 名称:`TELEGRAM_BOT_TOKEN`
|
||
- 值:你的 Telegram Bot Token
|
||
- 名称:`TELEGRAM_CHAT_ID`
|
||
- 值:你的 Telegram Chat ID
|
||
|
||
**注意:** 可以同时配置多个平台,系统会向所有配置的平台发送通知。具体设置方法请参考下方对应的机器人设置教程。
|
||
|
||
3. **自定义关键词**:
|
||
|
||
- 修改`frequency_words.txt`文件,添加你需要监控的频率词,过滤词,必须词
|
||
|
||
4. **自动运行**:
|
||
|
||
- 项目已包含`.github/workflows/crawler.yml`配置文件,默认每 50 分钟自动运行一次
|
||
- 你也可以在 GitHub 仓库的 Actions 页面手动触发运行
|
||
|
||
5. **查看结果**:
|
||
- 运行结果将自动保存在仓库的`output`目录中
|
||
- 同时通过飞书机器人发送通知到你的群组
|
||
|
||
## 🤖 多平台机器人设置
|
||
|
||
### 🟡 企业微信机器人设置
|
||
|
||
#### 手机端设置:
|
||
|
||
1. 打开企业微信 App → 进入目标内部群聊
|
||
2. 点击右上角"…"按钮 → 选择"群机器人"
|
||
3. 点击"添加" → 点击"新建" → 设置机器人昵称
|
||
4. 复制 Webhook 地址
|
||
|
||
#### PC 端也是类似设置流程
|
||
|
||
**配置到 GitHub**:将获得的 Webhook URL 配置到 GitHub Secrets 中的 `WEWORK_WEBHOOK_URL`
|
||
|
||
### 🟢 飞书机器人设置
|
||
|
||
1. 电脑浏览器打开 https://botbuilder.feishu.cn/home/my-app
|
||
|
||
2. 点击"新建机器人应用"
|
||
|
||
3. 进入创建的应用后,点击"流程涉及" > "创建流程" > "选择触发器"
|
||
|
||
4. 往下滑动,点击"Webhook 触发"
|
||
|
||
5. 此时你会看到"Webhook 地址",把这个链接先复制到本地记事本暂存,继续接下来的操作
|
||
|
||
6. "参数"里面放上下面的内容,然后点击"完成"
|
||
|
||
```json
|
||
{
|
||
"message_type": "text",
|
||
"content": {
|
||
"total_titles": "{{内容}}",
|
||
"timestamp": "{{内容}}",
|
||
"report_type": "{{内容}}",
|
||
"text": "{{内容}}"
|
||
}
|
||
}
|
||
```
|
||
|
||
7. 点击"选择操作" > "发送飞书消息" ,勾选 "群消息", 然后点击下面的输入框,点击"我管理的群组"(如果没有群组,你可以在飞书 app 上创建群组)
|
||
|
||
8. 消息标题填写"TrendRadar 热点监控"
|
||
|
||
9. 最关键的部分来了,点击 + 按钮,选择"Webhook 触发",然后按照下面的图片摆放
|
||
|
||

|
||
|
||
10. 配置完成后,将第 5 步复制的 Webhook 地址配置到 GitHub Secrets 中的 `FEISHU_WEBHOOK_URL`
|
||
|
||
### 🔵 钉钉机器人设置
|
||
|
||
1. **创建机器人(仅 PC 端支持)**:
|
||
|
||
- 打开钉钉 PC 客户端,进入目标群聊
|
||
- 点击群设置图标(⚙️)→ 往下翻找到"机器人"点开
|
||
- 选择"添加机器人" → "自定义"
|
||
|
||
2. **配置机器人**:
|
||
|
||
- 设置机器人名称
|
||
- **安全设置**:
|
||
- **自定义关键词**:设置 "热点"
|
||
|
||
3. **完成设置**:
|
||
- 勾选服务条款协议 → 点击"完成"
|
||
- 复制获得的 Webhook URL
|
||
- 将 URL 配置到 GitHub Secrets 中的 `DINGTALK_WEBHOOK_URL`
|
||
|
||
**注意**:移动端只能接收消息,无法创建新机器人。
|
||
|
||
### 🟣 Telegram Bot 设置
|
||
|
||
1. **创建机器人**:
|
||
|
||
- 在 Telegram 中搜索 `@BotFather`(大小写注意,有蓝色徽章勾勾,有类似 37849827 monthly users ,这个才是官方的,有一些仿官方的账号注意辨别)
|
||
- 发送 `/newbot` 命令创建新机器人
|
||
- 设置机器人名称(必须以"bot"结尾,很容易遇到重复名字,所以你要绞劲脑汁想不同的名字)
|
||
- 获取 Bot Token(格式如:`123456789:AAHfiqksKZ8WmR2zSjiQ7_v4TMAKdiHm9T0`)
|
||
|
||
2. **获取 Chat ID**:
|
||
|
||
**方法一:通过官方 API 获取**
|
||
|
||
- 先向你的机器人发送一条消息
|
||
- 访问:`https://api.telegram.org/bot<你的Bot Token>/getUpdates`
|
||
- 在返回的 JSON 中找到 `"chat":{"id":数字}` 中的数字
|
||
|
||
**方法二:使用第三方工具**
|
||
|
||
- 搜索 `@userinfobot` 并发送 `/start`
|
||
- 获取你的用户 ID 作为 Chat ID
|
||
|
||
3. **配置到 GitHub**:
|
||
- `TELEGRAM_BOT_TOKEN`:填入第 1 步获得的 Bot Token
|
||
- `TELEGRAM_CHAT_ID`:填入第 2 步获得的 Chat ID
|
||
|
||
## ⚙️ frequency_words.txt 完整配置教程(三种语法)
|
||
|
||
在`frequency_words.txt`文件中配置监控的频率词,过滤词和必须词
|
||
|
||
### 1. **频率词** - 关键词匹配
|
||
|
||
```txt
|
||
华为
|
||
任正非
|
||
鸿蒙
|
||
```
|
||
|
||
**作用:** 新闻标题包含其中**任意一个词**就会被捕获
|
||
**举例:**
|
||
|
||
- ✅ "华为发布新手机" ← 包含"华为"
|
||
- ✅ "任正非接受采访" ← 包含"任正非"
|
||
- ✅ "鸿蒙系统更新" ← 包含"鸿蒙"
|
||
|
||
### 2. **必须词** `+词汇` - 限定主题
|
||
|
||
```txt
|
||
华为
|
||
任正非
|
||
+手机
|
||
```
|
||
|
||
**作用:** 除了包含频率词,**还必须包含**`+`开头的词
|
||
**举例:**
|
||
|
||
- ✅ "华为手机销量第一" ← 有"华为"+有"手机" ✓
|
||
- ❌ "华为汽车计划曝光" ← 有"华为"但没有"手机" ✗
|
||
- ❌ "小米手机新品发布" ← 有"手机"但没有"华为/任正非" ✗
|
||
|
||
### 3. **过滤词** `!词汇` - 排除干扰
|
||
|
||
```txt
|
||
哪吒
|
||
饺子
|
||
!汽车
|
||
!食品
|
||
```
|
||
|
||
**作用:** 标题包含`!`开头的词会被**直接排除**
|
||
**举例:**
|
||
|
||
- ✅ "导演饺子新电影" ← 有"饺子",没有"汽车/食品" ✓
|
||
- ❌ "哪吒汽车销量增长" ← 有"哪吒"但包含"汽车" ✗
|
||
- ❌ "饺子食品安全检查" ← 有"饺子"但包含"食品" ✗
|
||
|
||
## 📝 配置文件示例
|
||
|
||
### frequency_words.txt 完整示例:
|
||
|
||
```txt
|
||
华为
|
||
任正非
|
||
鸿蒙
|
||
+手机
|
||
|
||
哪吒
|
||
饺子
|
||
!汽车
|
||
!食品
|
||
|
||
AI
|
||
人工智能
|
||
+技术
|
||
!绘画
|
||
|
||
比亚迪
|
||
王传福
|
||
+新能源
|
||
!玩具
|
||
|
||
苹果
|
||
库克
|
||
iPhone
|
||
+科技
|
||
!水果
|
||
!手机壳
|
||
```
|
||
|
||
## 🔍 实际效果演示
|
||
|
||
### 词组 1:华为相关
|
||
|
||
**配置:** 华为、任正非、鸿蒙 + 必须有"手机"
|
||
|
||
```
|
||
✅ "华为手机市场份额领先"
|
||
✅ "任正非谈手机行业发展"
|
||
✅ "鸿蒙手机用户破亿"
|
||
❌ "华为云计算业务增长"(没有"手机")
|
||
❌ "小米手机新品发布"(没有华为相关词)
|
||
```
|
||
|
||
### 词组 2:哪吒相关
|
||
|
||
**配置:** 哪吒、饺子 - 排除"汽车"和"食品"
|
||
|
||
```
|
||
✅ "导演饺子执导新片"
|
||
✅ "哪吒动画获奖"
|
||
❌ "哪吒汽车交付量创新高"(包含过滤词"汽车")
|
||
❌ "速冻饺子食品安全"(包含过滤词"食品")
|
||
```
|
||
|
||
### 词组 3:AI 相关
|
||
|
||
**配置:** AI、人工智能 + 必须有"技术" - 排除"绘画"
|
||
|
||
```
|
||
✅ "AI技术助力医疗诊断"
|
||
✅ "人工智能技术新突破"
|
||
❌ "AI绘画工具走红"(包含过滤词"绘画")
|
||
❌ "AI概念股大涨"(没有"技术")
|
||
```
|
||
|
||
## 💡 配置技巧
|
||
|
||
### 🎯 如何设置词组
|
||
|
||
1. **找准核心词**:先列出最重要的关键词
|
||
2. **加必须词**:用`+`限定话题范围,避免误匹配
|
||
3. **设过滤词**:用`!`排除干扰内容
|
||
|
||
### ✅ 好的配置示例
|
||
|
||
```txt
|
||
特斯拉
|
||
马斯克
|
||
+汽车
|
||
!玩具
|
||
!模型
|
||
```
|
||
|
||
→ 只要特斯拉/马斯克的汽车新闻,排除玩具车、模型车
|
||
|
||
### ❌ 不建议的配置示例
|
||
|
||
```txt
|
||
苹果
|
||
```
|
||
|
||
→ 会匹配到"苹果手机"、"苹果价格"(吃的苹果)、"苹果园"等无关内容
|
||
|
||
## 🔧 使用步骤
|
||
|
||
1. **创建配置文件**:新建 `frequency_words.txt` 文件
|
||
2. **填写词组**:每个词组用空行分隔
|
||
3. **测试效果**:手动运行 GitHub Actions 查看推送效果
|
||
4. **调整优化**:根据结果增减词汇或调整过滤
|
||
|
||
## 📊 权重排序说明
|
||
|
||
配置好的新闻会自动按重要性排序:
|
||
|
||
- **排名越高越靠前**(在各平台的排行榜位置)
|
||
- **出现越多越靠前**(在多个平台都有)
|
||
- **稳定性越好越靠前**(经常出现在前几名)
|
||
|
||
这样最重要的新闻总是显示在最前面!
|
||
|
||
## 📊 输出示例
|
||
|
||
### 通知示例:
|
||
|
||
```
|
||
📊 热点词汇统计
|
||
|
||
🔥 人工智能 AI : 12 条
|
||
|
||
1. [百度热搜] 科技巨头发布新AI模型 [1] - 12时30分 (4次)
|
||
|
||
2. [今日头条] AI技术最新突破 [2] - [13时15分 ~ 14时30分] (2次)
|
||
|
||
```
|
||
|
||
### 消息格式说明
|
||
|
||
| 格式元素 | 示例 | 含义 | 说明 |
|
||
| ------------- | --------------------------- | ------------ | --------------------------------------- |
|
||
| **关键词** | **人工智能 AI** | 频率词组 | 表示本组匹配的关键词 |
|
||
| : N 条 | : 12 条 | 匹配数量 | 该关键词组匹配的标题总数 |
|
||
| [平台名] | [百度热搜] | 来源平台 | 标题所属的平台名称 |
|
||
| [**数字**] | [**1**] | 高排名标记 | 排名 ≤ 阈值(默认 5)的热搜,红色加粗显示 |
|
||
| [数字] | [7] | 普通排名标记 | 排名>阈值的热搜,普通显示 |
|
||
| - 时间 | - 12 时 30 分 | 首次发现时间 | 标题首次被发现的时间 |
|
||
| [时间 ~ 时间] | [12 时 30 分 ~ 14 时 00 分] | 时间范围 | 标题出现的时间范围(首次~最后) |
|
||
| (N 次) | (4 次) | 出现次数 | 标题在监控期间出现的总次数 |
|
||
|
||
## 🔧 高级用法
|
||
|
||
### 自定义监控平台
|
||
|
||
如果想支持更多平台或者不想看某些平台,可以访问 newsnow 的源代码:https://github.com/ourongxing/newsnow/tree/main/server/sources ,根据里面的文件名自己来修改 main.py 中的下面代码:
|
||
|
||
```python
|
||
ids = [
|
||
("toutiao", "今日头条"),
|
||
("baidu", "百度热搜"),
|
||
("wallstreetcn-hot", "华尔街见闻"),
|
||
("thepaper", "澎湃新闻"),
|
||
("bilibili-hot-search", "bilibili 热搜"),
|
||
("cls-hot", "财联社热门"),
|
||
("ifeng", "凤凰网"),
|
||
"tieba",
|
||
"weibo",
|
||
"douyin",
|
||
"zhihu",
|
||
]
|
||
```
|
||
|
||
## ❓ 常见问题
|
||
|
||
1. **GitHub Actions 不执行怎么办?**
|
||
|
||
- 检查`.github/workflows/crawler.yml`文件是否存在
|
||
- 在 Actions 页面手动触发一次 workflow
|
||
- 确认你有足够的 GitHub Actions 免费分钟数
|
||
|
||
2. **没有收到飞书通知怎么办?**
|
||
|
||
- 检查`FEISHU_WEBHOOK_URL`是否正确设置(环境变量或 CONFIG 中)
|
||
- 检查飞书机器人是否仍在群内且启用
|
||
- 查看程序输出中是否有发送失败的错误信息
|
||
- 确认飞书流程配置中的参数结构正确
|
||
|
||
3. **想要停止爬虫行为但保留仓库怎么办?**
|
||
|
||
- 将`CONTINUE_WITHOUT_FEISHU`设置为`False`并删除`FEISHU_WEBHOOK_URL`secret
|
||
- 或修改 GitHub Actions workflow 文件禁用自动执行
|
||
|
||
## 📧 学习交流
|
||
|
||
扫码关注微信公众号,里面有文章是讲我写的这些项目的,咳如果对你有了点帮助,献上【点赞,转发,推荐】三连,就算支持了俺这个作者的开发了,顺便也可以反馈使用问题:
|
||
|
||
<div align="center">
|
||
|
||

|
||
|
||
</div>
|
||
|
||

|
||
|
||
## Star History
|
||
|
||
[](https://www.star-history.com/#sansan0/TrendRadar&Date)
|
||
|
||
## 🙏 致谢
|
||
|
||
本项目使用了 [newsnow](https://github.com/ourongxing/newsnow) 提供的 API 服务,感谢其提供的数据支持。
|
||
|
||
## 📄 许可证
|
||
|
||
GPL-3.0 License
|
||
|
||
---
|
||
|
||
<div align="center">
|
||
|
||
**⭐ 如果这个工具对你有帮助,请给项目点个 Star 支持开发!**
|
||
|
||
[🔝 回到顶部](#TrendRadar-多平台热点资讯监控分析系统)
|
||
|
||
</div>
|