相似文章推荐设计

  1. 提取每篇文章的simhash 值
  2. 新建一个表similar_suggestions,simhash是主键,相关的simhash为次键,相似值
  3. 定时任务遍历,每一个simhash,尝试找出20篇相似的simhash,如果不足,跑完全量数据
  4. 新发布文章的时候,触发这个计算过程,为每一篇文章,计算它的相似度,写入到similar_suggestions
  5. 需要推荐的时候,先取文章的simhash, 然后提取相似度比较接近的hash list, 取他们的文章成为列表,给出去

分类: 默认 标签: 发布于: 2021-08-31 17:09:13, 更新于: 2021-08-31 17:09:13