烟草研究主题相似度分析
2025/07/14·StepFun can make mistakes, check important info.
主题名字是这样:0 烟草叶片与产量 tobacco leaf yield production 聚焦种植端核心问题(产量、叶片)
1 电子烟液与气溶胶 aerosol ends eliquid 专注电子烟技术(烟液、气溶胶)
2 雪茄与烟草产品 tobacco cigar cigars products 覆盖高端烟草品类(雪茄)
3 尼古丁口腔产品 nicotine products pouches oral 指向新型尼古丁产品(口腔袋)
4 电子烟与吸烟者行为 ecigarette cigarettes smokers 关联电子烟产品与用户行为
5 烟草使用与卷烟烟雾 tobacco use cigarette smoke 聚焦消费端健康影响(烟雾、使用)
思考过程
我们想要自定义主题名称,并且使用Viridis颜色方案的热力图,同时显示相似度数值。
根据您提供的主题名称,我们可以将其作为custom_labels传入。
另外,我们还可以调整热力图的布局和样式,使其更美观。
步骤:
- 定义自定义标签(custom_labels)为提供的主题名称列表。
- 使用之前定义的visualize_custom_heatmap函数,传入custom_labels。
- 在函数内部,我们将使用这些自定义标签作为坐标轴的刻度标签。
注意:由于我们提供的主题名称是中文,需要确保系统支持中文字符的显示(在Plotly中通常没有问题)。
假设我们之前定义的可视化函数已经可用,现在我们来生成热力图。
根据您提供的主题名称和描述,我将创建一个高度定制化的主题相似度热力图,使用Viridis颜色方案,并在每个色块上显示相似度数值。以下是完整的实现代码:
主要特点和优化:
-
主题信息完整呈现:
- 主标签:中文主题名称(如"烟草叶片与产量")
- 副标签:主题描述(如"聚焦种植端核心问题(产量、叶片)")
- 编号:主题编号(如#0)
- 缩写:简洁的轴标签(如"种植产量")
-
Viridis颜色方案定制:
- 从深蓝色(低相似度)到亮黄色(高相似度)
- 10级渐变,提供更丰富的色彩层次
-
中文支持优化:
- 使用"SimHei"(黑体)作为中文字体
- 确保所有中文文本正确显示
-
信息层次清晰:
- 对角线单元格:显示完整主题名称和编号
- 轴标签:使用简洁缩写
- 轴外侧:显示详细主题描述
- 单元格内:显示相似度数值
-
交互功能增强:
-
专业设计元素:
- 对角线单元格添加白色边框
- 主题名称使用半透明背景增强可读性
- 主题编号放在右上角
- 整体采用浅色背景,突出数据
使用建议:
-
主题扩展:
如果您的模型包含更多主题,只需更新custom_labels
、topic_descriptions
和topic_abbreviations
字典即可:
-
显示控制:
- 通过
show_text=False
可隐藏单元格内的数值
- 调整
width
和height
参数改变图表尺寸
- 修改
title
参数自定义图表标题
-
输出优化:
这个热力图不仅美观专业,而且完美呈现了您的主题结构和相互关系,特别适合用于学术报告或研究论文中的可视化展示。