浙江大学创新软件研发中心

InnovativE SoftwAre TechnoloGy DeveLopment CentEr, EAGLE-Lab

 

喜报:EAGLE-Lab硕士生吴辰夏同学论文被顶级国际期刊录用

近期,EAGLE-Lab硕士生吴辰夏的学术论文《Semi-supervised Nonlinear Hashing Using Bootstrap Sequential Projection Learning》被数据挖掘领域国际最权威期刊IEEE Transactions on Knowledge and Data Engineering (TKDE) 录用。
哈希(Hashing)算法是解决数据挖掘领域大规模数据处理的重要方法,旨在将高维数据映射到低维二元空间并保持原始空间的距离或语义关系。与传统的降维方法不同的是,二元特征能获得更好的检索性能和效率。利用对二元特征异或和位加和的快速计算可以进行快速的线性检索,或着通过对二元特征建立Hamming Ball常数时间返回较少数的最近邻,都可以大幅度的提高检索速度。
本文提出了一种新的基于半监督学习的哈希算法。首先我们假设哈希函数为非线性函数,相对于已有方法假设的线性函数,我们使用的基于Anchors的非线性函数能够更好的捕获数据底层信息;其次我们提出了基于非线性哈希函数的目标函数,来最大化经验准确性和每一位获得的信息;最后,我们提出了一种基于Bootstrap的顺序学习(Sequential Learning)的优化方法,能从整体出发更好的修正前面已训练的位错误。我们通过实验验证了提出的基于Bootstrap顺序学习哈希算法的有效性。
高质量期刊论文的连续录用说明实验室在计算机多个领域奠定了一定的研究基础,更进一步具备了在高水平国际期刊上发表论文的能力。