login
烟草研究主题相似度分析
2025/07/14·StepFun can make mistakes, check important info.
主题名字是这样:0 烟草叶片与产量 tobacco leaf yield production 聚焦种植端核心问题(产量、叶片) 1 电子烟液与气溶胶 aerosol ends eliquid 专注电子烟技术(烟液、气溶胶) 2 雪茄与烟草产品 tobacco cigar cigars products 覆盖高端烟草品类(雪茄) 3 尼古丁口腔产品 nicotine products pouches oral 指向新型尼古丁产品(口腔袋) 4 电子烟与吸烟者行为 ecigarette cigarettes smokers 关联电子烟产品与用户行为 5 烟草使用与卷烟烟雾 tobacco use cigarette smoke 聚焦消费端健康影响(烟雾、使用)
Reason
思考过程

我们想要自定义主题名称,并且使用Viridis颜色方案的热力图,同时显示相似度数值。
根据您提供的主题名称,我们可以将其作为custom_labels传入。
另外,我们还可以调整热力图的布局和样式,使其更美观。

步骤:

  1. 定义自定义标签(custom_labels)为提供的主题名称列表。
  2. 使用之前定义的visualize_custom_heatmap函数,传入custom_labels。
  3. 在函数内部,我们将使用这些自定义标签作为坐标轴的刻度标签。

注意:由于我们提供的主题名称是中文,需要确保系统支持中文字符的显示(在Plotly中通常没有问题)。

假设我们之前定义的可视化函数已经可用,现在我们来生成热力图。

根据您提供的主题名称和描述,我将创建一个高度定制化的主题相似度热力图,使用Viridis颜色方案,并在每个色块上显示相似度数值。以下是完整的实现代码:

python

主要特点和优化:

  1. 主题信息完整呈现

    • 主标签:中文主题名称(如"烟草叶片与产量")
    • 副标签:主题描述(如"聚焦种植端核心问题(产量、叶片)")
    • 编号:主题编号(如#0)
    • 缩写:简洁的轴标签(如"种植产量")
  2. Viridis颜色方案定制

    python
    • 从深蓝色(低相似度)到亮黄色(高相似度)
    • 10级渐变,提供更丰富的色彩层次
  3. 中文支持优化

    python
    • 使用"SimHei"(黑体)作为中文字体
    • 确保所有中文文本正确显示
  4. 信息层次清晰

    • 对角线单元格:显示完整主题名称和编号
    • 轴标签:使用简洁缩写
    • 轴外侧:显示详细主题描述
    • 单元格内:显示相似度数值
  5. 交互功能增强

    python
    • 悬停时显示完整信息
    • 清晰区分当前主题和相关主题
  6. 专业设计元素

    • 对角线单元格添加白色边框
    • 主题名称使用半透明背景增强可读性
    • 主题编号放在右上角
    • 整体采用浅色背景,突出数据

使用建议:

  1. 主题扩展
    如果您的模型包含更多主题,只需更新custom_labelstopic_descriptionstopic_abbreviations字典即可:

    python
  2. 显示控制

    • 通过show_text=False可隐藏单元格内的数值
    • 调整widthheight参数改变图表尺寸
    • 修改title参数自定义图表标题
  3. 输出优化

    python

这个热力图不仅美观专业,而且完美呈现了您的主题结构和相互关系,特别适合用于学术报告或研究论文中的可视化展示。