数据挖掘之相似性度量 - viewcode的专栏 - 博客频道 - CSDN.NET
文本相似度计算-JaccardSimilarity和哈希签名函数 - 笑笑的程序...
基于hash方法的相似计算 - - 博客频道 - CSDN.NET
Hash算法 - wangjy - 博客园
关于文本相似度计算-JaccardSimilarity和哈希签名函数_百度文库
[转]文本相似性算法:simhash/minhash/余弦算法 - heiyeluren的...
文本相似度计算-JaccardSimilarity和哈希签名函数 – 笑笑的程序...
网站文章如何能自动判定是抄袭?一种算法和实践架构剖析
基于MinHash的集合相似度计算原理_新东方_Jason龙_新浪博客