Skip to content

weiwill88/jike-heatmap

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 

Repository files navigation

即刻平台数据分析脚本说明

概述

本脚本用于分析即刻平台的数据,主要功能包括:

  • 时间序列分析
  • 话题内容分析
  • 互动分析
  • 活动热力图生成 通过多种可视化图表展示分析结果。

主要功能模块及数据字段

0. 活动热力图

使用的JSON字段:

  • sc-bdvvtL:用于生成每日活动热力图

  • 生成过去一年的活动热力图

  • 支持自定义颜色主题

  • 可调整方块大小和间距

  • 自动添加月份和星期标签

  • 支持添加自定义标题

1. 数据加载与预处理

使用的JSON字段:

  • sc-bdvvtL:帖子发布时间(可能包含相对时间如"X分钟前")

  • break-words:帖子正文内容

  • flex (2):帖子主题标签

  • pl-2_5:帖子点赞数

  • pl-2_5 (2):帖子评论数

  • text-primary href:帖子中的链接

  • 从JSON文件加载数据

  • 将数据转换为Pandas DataFrame格式

  • 处理时间数据,将相对时间转换为绝对时间

2. 时间序列分析

使用的JSON字段:

  • sc-bdvvtL:用于时间序列分析的时间戳

  • pl-2_5:用于分析点赞趋势

  • 每日发帖频率分析

  • 发帖时间按小时分布

  • 点赞量随时间变化趋势(如果有点赞数据)

3. 话题和内容分析

使用的JSON字段:

  • break-words:用于词云生成、TF-IDF分析和情感分析

  • flex (2):用于主题频率分析

  • text-primary href:用于链接分析

  • 生成帖子内容词云图

  • 主题频率分布分析

  • 使用TF-IDF提取关键词

  • 情感分析(正面/负面/中性)

  • 链接和域名分析

4. 互动分析(如果有点赞和评论数据)

使用的JSON字段:

  • pl-2_5:点赞数

  • pl-2_5 (2):评论数

  • 点赞数分布

  • 评论数分布

  • 点赞和评论数的关系

5. 结合特定属性分析

使用的JSON字段:

  • flex (2):主题标签

  • pl-2_5:点赞数

  • 不同话题的平均点赞量

依赖库

  • Pandas
  • Matplotlib/Seaborn
  • WordCloud
  • TextBlob
  • Scikit-learn

使用方法

基本分析

  1. 确保已安装所需依赖库
  2. 将即刻平台数据保存为JSON格式
  3. 修改file_path变量指向数据文件
  4. 运行脚本查看分析结果

热力图生成

  1. 确保已安装Matplotlib和Seaborn
  2. 将数据保存为JSON格式
  3. 运行heatmap.py脚本:
python heatmap.py
  1. 生成的热力图将保存为activity_heatmap.png

配置说明

热力图支持以下配置(在heatmap.py中修改):

  • 图表尺寸
  • 颜色主题
  • 文字样式
  • 布局参数
  • 图例样式

注意事项

  • 部分分析功能需要特定字段(如点赞、评论数据)
  • 确保系统已安装中文字体(如SimHei)以正确显示中文

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages