浙江大学创新软件研发中心

InnovativE SoftwAre TechnoloGy DeveLopment CentEr, EAGLE-Lab

 

喜报:EAGLE-LAB张利军同学论文被顶级国际期刊录用

近期,EAGLE-LAB博士生张利军的学术论文《Locally Discriminative Co-Clustering》被数据挖掘领域国际期刊IEEE Transactions on Knowledge and Data Engineering (TKDE) 录用。
聚类(Clustering)是数据挖掘领域的经典问题,旨在将数据分组成为多个类(Cluster),使得同一类内对象之间具有较高的相似度,不同类之间的对象差别较大。传统的聚类算法是单侧的,即分别对样本或特征进行聚类。
联合聚类(Co-clustering)是近年来流行的一种新型聚类算法。与传统的算法不同,联合聚类通过利用样本和特征之间的对偶性,同时对样本和特征进行聚类。现有的联合聚类算法大多考虑如何建模样本与特征之间的关系,忽略了样本之间、特征之间的内在关系。在本文中,我们提出了一种新的联合聚类算法——局部判别联合聚类(Locally Discriminative Co-Clustering,LDCC),能够同时考虑样本与特征之间、样本之间、特征之间这三种关系。首先,我们建立一个样本和特征之间的二分图(Bipartite Graph)来表达样本与特征之间的关系。然后,我们通过应用局部线性回归来发现样本空间和特征空间的内在判别结构。具体而言,我们在每一个局部样本空间(或特征空间)应用线性回归来建模数据和聚类结果之间的关系。为了反映样本(或特征)之间的关系,我们要求聚类的结果能够最小化局部线性回归的误差。最后,我们在文本和基因数据上验证了LDCC的联合聚类效果。
高质量期刊论文的连续录用说明实验室在计算机多个领域奠定了一定的研究基础,更进一步具备了在高水平国际期刊上发表论文的能力。