本脚本用于分析即刻平台的数据,主要功能包括:
- 时间序列分析
- 话题内容分析
- 互动分析
- 活动热力图生成 通过多种可视化图表展示分析结果。
使用的JSON字段:
-
sc-bdvvtL:用于生成每日活动热力图
-
生成过去一年的活动热力图
-
支持自定义颜色主题
-
可调整方块大小和间距
-
自动添加月份和星期标签
-
支持添加自定义标题
使用的JSON字段:
-
sc-bdvvtL:帖子发布时间(可能包含相对时间如"X分钟前")
-
break-words:帖子正文内容
-
flex (2):帖子主题标签
-
pl-2_5:帖子点赞数
-
pl-2_5 (2):帖子评论数
-
text-primary href:帖子中的链接
-
从JSON文件加载数据
-
将数据转换为Pandas DataFrame格式
-
处理时间数据,将相对时间转换为绝对时间
使用的JSON字段:
-
sc-bdvvtL:用于时间序列分析的时间戳
-
pl-2_5:用于分析点赞趋势
-
每日发帖频率分析
-
发帖时间按小时分布
-
点赞量随时间变化趋势(如果有点赞数据)
使用的JSON字段:
-
break-words:用于词云生成、TF-IDF分析和情感分析
-
flex (2):用于主题频率分析
-
text-primary href:用于链接分析
-
生成帖子内容词云图
-
主题频率分布分析
-
使用TF-IDF提取关键词
-
情感分析(正面/负面/中性)
-
链接和域名分析
使用的JSON字段:
-
pl-2_5:点赞数
-
pl-2_5 (2):评论数
-
点赞数分布
-
评论数分布
-
点赞和评论数的关系
使用的JSON字段:
-
flex (2):主题标签
-
pl-2_5:点赞数
-
不同话题的平均点赞量
- Pandas
- Matplotlib/Seaborn
- WordCloud
- TextBlob
- Scikit-learn
- 确保已安装所需依赖库
- 将即刻平台数据保存为JSON格式
- 修改file_path变量指向数据文件
- 运行脚本查看分析结果
- 确保已安装Matplotlib和Seaborn
- 将数据保存为JSON格式
- 运行heatmap.py脚本:
python heatmap.py
- 生成的热力图将保存为activity_heatmap.png
热力图支持以下配置(在heatmap.py中修改):
- 图表尺寸
- 颜色主题
- 文字样式
- 布局参数
- 图例样式
- 部分分析功能需要特定字段(如点赞、评论数据)
- 确保系统已安装中文字体(如SimHei)以正确显示中文