CS246 Finding Similar Items: Locality Sensitive Hashing
最近在上大数据分析的课程,老师使用的是斯坦福大学的教材和 PPT ,感觉挺有趣的,记录一下其中的一些算法。 背景 很多问题可以被归化为寻找相似集合的问题: 论文差重 寻找购买相似商品的人群 寻找有相似特征的图片 不妨将这次的目的设置为:给定大量的文档,发现其中有抄袭嫌疑的 ...
最近在上大数据分析的课程,老师使用的是斯坦福大学的教材和 PPT ,感觉挺有趣的,记录一下其中的一些算法。 背景 很多问题可以被归化为寻找相似集合的问题: 论文差重 寻找购买相似商品的人群 寻找有相似特征的图片 不妨将这次的目的设置为:给定大量的文档,发现其中有抄袭嫌疑的 ...