终于下定决心启动LSH系列博文

LSH,是Locality Sensitive Hashing的缩写,也翻译为局部敏感哈希,是一种通过设计满足特殊性质即局部敏感的哈希函数,提高相似查询效率的方法。

   虽然从正式提出距今不过十余年,由于其局部敏感的特殊性质,以及在高维数据上相当于k-d树等方法的优越性,LSH被广泛地运用于各种检索(包括并不仅限于文本、音频、图片、视频、基因等)领域。

     从本科毕业设计时与LSH第一次打交道后,我陆陆续续在不同情况下与LSH打交道,期间其带来的各种事情几乎令我发疯……不过值得庆幸的是与此同时对它的认识越来越深,为了更加深刻地理解LSH,我决定写一系列的博客来介绍自己对LSH的认识和看法。

     下面是我初步拟定的一个计划:

  • 入门篇:LSH基本思想(入门性质介绍,为什么会产生LSH即其解决的是哪类问题,LSH发展历程,LSH思想的直观描述)
  • 资料篇:LSH参考文献(小结自己接触LSH时参考的各种资料,以及并附自己对这些文献的一点说明,放在最前面是为了防止我的介绍产生误导)
    • 原理篇:LSH的基本原理(LSH基本思想和原理,以及相对其它方法的优越性,可能涉及部分证明)
    • 实现篇:LSH函数(族)设计(LSH的关键部分,针对不同的场景或距离度量方法设计相应的哈希函数)
    • 应用篇:LSH库和Case Study(列出一些开源或可免费使用的库(以及使用方法),说明一些LSH的应用场景,不是小结,因为LSH应用方面的论文实在太多,而且还在源源不断地出现,以后还有可能成为一种基础算法)
    • 番外篇:我与LSH纠缠不清的孽缘(对我而言肯定不是一段愉快的经历,但是肯定是最容易写的一篇,介绍我与LSH的一次次接触的感受,也简洁说明我为什么“一定要”写这个LSH系列)

        这些内容来自于本人一篇未完成的综述和相关学习笔记。由于自从有写综述到吐血的经历后,我就对写小结产生了深深的恐惧,所以这个系列的博文可能要持续很长的周期。以上6个主题并不一定按列出顺序出现也可能不是正好6篇,不过肯定的是这个系列一定会写完。

         非常欢迎对LSH感兴趣的朋友就该系列博文进行讨论和指正其中的各种错误。

    注2:由于各种缘由,在未得到本人确认的情况下,LSH系列博文不接受转载

    无觅相关文章插件,快速提升流量

    1. php
      2011年6月17日 07:15 | #1

      相当期待

      [回复]

    2. 2011年12月30日 11:11 | #2

      期待。。。。。。。。

      [回复]

    3. 2012年2月20日 11:57 | #3

      后生对此也很感兴趣,最近一个项目在研究LSH。欢迎交流。先刷完大哥您的博客再说。。。

      [回复]

    发表评论

    XHTML: 您可以使用这些标签: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>