在我们写论文时,深度聚类可以作为数据预处理步骤,帮助我们组织和理解数据集。在论文的实验阶段,深度聚类的结果也可以用作定量和定性分析的一部分。例如,通过展示聚类结果的可视化,我们可以直观地展示自己的方法是如何改善了数据的分离度或发现了有意义的群组。

对苦论文久已的我们来说,掌握并进一步探索深度聚类方法显得尤为重要。

所以这次我又爆肝汇总了71篇深度聚类相关的顶会论文,包括最新的研究成果,还贴上了pytorch&TensorFlow复现代码,希望能为同学们的论文主题方法、创新研究提供支持和帮助。

论文和复现代码需要的同学看文末

1.Deep Incomplete Multi-view Clustering with Cross-view Partial Sample and Prototype Alignment(CVPR 2023)

深度不完整多视角聚类与跨视角部分样本和原型对齐

「简述:」多视角聚类通常需要不同视角的数据都是完整的。但在现实中,由于各种原因,我们经常只能获取到部分数据,这就给聚类带来了难题。现有的解决方法有缺陷:它们试图让不同视角的相同数据看起来完全一样,这可能忽视了视角间的差异;而且,当缺少某些视角的数据时,得到的结果可能会有偏差。为了解决这个问题,本文提出了一种新的方法——跨视角部分样本和原型对齐网络(CPSPAN),它能更好地处理不完整数据的问题。实验显示,这个方法比现有的方法效果更好。

2.On the Effects of Self-supervision and Contrastive Alignment in Deep Multi-view Clustering(CVPR 2023)

关于自监督和对比对齐在深度多视角聚类中的效果研究

「简述:」自监督学习是深度多视角聚类的重要部分,但不同方法的发展差异可能拖慢了进度。本文提出了一个统一的深度多视角聚类框架Deep-MVC,它包含了许多最新方法。通过这个框架,作者发现对比学习在对齐表示时的缺陷,并证明这会影响簇的分离性,尤其在视角多的情况下更糟。基于这些发现,作者开发了新的自监督方法。实验结果显示,对比对齐会降低多视角数据集的性能,所有方法都能从自监督中受益,而该新方法在多个数据集上表现更好。

3.DivClust: Controlling Diversity in Deep Clustering(CVPR 2023)

控制深度聚类中的多样性

「简述:」聚类是机器学习的重要研究主题,深度学习在这方面取得了很大的成功。但是,现有的深度聚类方法没有考虑到如何有效地为一个数据集生成多个不同的分区。这对于共识聚类很重要,因为它能提供比单一聚类更好的结果。为了解决这个问题,作者提出了DivClust,这是一种可以添加到现有深度聚类框架中的损失函数,用来生成具有所需多样性的多个聚类结果。通过实验表明,该方法在不同的数据和框架上都能有效地控制多样性,并且计算成本很低。

4.Fine-grained Fashion Representation Learning by Online Deep Clustering(ECCV 2022)

在线深度聚类实现细粒度时尚表示学习

「简述:」论文提出了一种基于深度学习的在线聚类方法,用于同时学习实例和聚类级别的所有属性的细粒度时尚表示,并在线估计属性特定的聚类中心。通过比较细粒度表示和聚类中心的相似性,进一步将属性特定的嵌入空间分割成类别特定的嵌入空间,以进行细粒度时尚检索。为了更好地控制学习过程,作者设计了一个三阶段学习计划,逐步结合来自原始和增强数据的不同监督,包括真实和伪标签。

5.Embedding contrastive unsupervised features to cluster in- and out-of-distribution noise in corrupted image datasets(ECCV 2022)

嵌入对比无监督特征以聚类分布内和分布外的噪声

「简述:」创建图像数据集时,用搜索引擎抓取网络图片是个诱人的选择,但会有很多错误的样本。这些错误样本包括内分布的(属于错误类别但仍与数据集中其他类别相似的)和外分布的(与数据集中所有类别都不相关的)图像。作者提出了一个两阶段算法来处理这个问题:首先用无监督对比特征学习在特征空间中表示图像,然后通过谱嵌入和对异常值敏感的聚类方法来检测并分离出干净的、OOD的簇和ID噪声。最后,训练一个鲁棒的神经网络来修正ID噪声并利用OOD样本改进特征。

6.On Mitigating Hard Clusters for Face Clustering(ECCV 2022)

缓解人脸聚类的硬聚类问题

「简述:」硬聚类是由于人脸图像的异质性(如大小和稀疏性的变化)导致的难以识别的小型或稀疏聚类。为了解决这个问题,作者引入了两个新的模块:基于邻居扩散密度的 Neighborhood Diffusion-based Density (NDDe) 和基于转移概率的距离 Transition-Probability-based Distance (TPDi)。这两个模块使得他们能够以概率方式推断样本的聚类成员资格,从而避免了使用统一阈值导致的误分类问题。

7.Deep Safe Incomplete Multi-view Clustering: Theorem and Algorithm(ICML 2022)

深度安全不完整多视图聚类

「简述:」多视图聚类面临数据不完整的问题,这可能导致性能下降。我们提出了一种新的方法来解决这个问题。该方法通过动态填充缺失数据,并从学到的语义邻居中选择样本进行训练,从而减少了聚类性能下降的风险。实验表明,该方法在多个数据集上取得了优越的性能。

8.Locally Normalized Soft Contrastive Clustering for Compact Clusters(IJCAI 2022)

用于紧凑聚类的局部归一化软对比聚类

「简述:」现有的深度聚类方法在处理大数据集和噪声时,很难清晰地区分不同的聚类。为了解决这个问题,作者提出了一种新的深度聚类算法,称为局部归一化的软对比聚类(LNSCC)。它利用样本之间的局部相似性和全局不连接性,以对比方式分离不同的聚类。实验结果表明,该方法在图像和非图像数据上都取得了很好的聚类效果,超过了其他许多先进的方法。

9.DeepDPM: Deep Clustering With an Unknown Number of Clusters(CVPR 2022)

具有未知聚类数量的深度聚类

「简述:」论文提出了一种新的深度聚类方法,DeepDPM,它可以在学习过程中自动推断聚类数量。通过使用拆分/合并框架和动态架构,DeepDPM在性能上超过了现有的非参数聚类方法。该方法不需要预设聚类数量,因此可以适应不同的数据集。作者还在ImageNet上展示了DeepDPM的性能,这是现有深度非参数聚类方法所无法做到的。

10.A DEEP VARIATIONAL APPROACH TO CLUSTERING SURVIVAL DATA(ICLR 2022)

用于聚类生存数据的深度变分方法

「简述:」论文研究了如何对生存数据进行聚类,这是一个挑战性的任务。作者提出了一个新的半监督概率方法,使用深度生成模型来揭示变量和生存时间的分布。作者在各种数据集上进行了实验,结果显示该方法在识别不同群体和预测生存时间方面表现良好。

其他Paper&code

SPICE: Semantic Pseudo-labeling for Image Clustering

Generalised Mutual Information for Discriminative Clustering

Self-supervised Heterogeneous Graph Pre-training Based on Structural Clustering

Learning Representation for Clustering via Prototype Scattering and Positive Sampling

Dual Contrastive Prediction for Incomplete Multi-view Representation Learning

GOCA: Guided Online Cluster Assignment for Self-supervised Video Representation Learning

Contrastive Multi-view Hyperbolic Hierarchical Clustering

EMGC$^2$F: Effcient Multi-view Graph Clustering with Comprehensive Fusion

Efficient Orthogonal Multi-view Subspace Clustering

Clustering with Fair-Center Representation: Parameterized Approximation Algorithms and Heuristics

Efficient Deep Embedded Subspace Clustering

SLIC: Self-Supervised Learning With Iterative Clustering for Human Action Videos

MPC: Multi-View Probabilistic Clustering

Deep Safe Multi-View Clustering: Reducing the Risk of Clustering Performance Degradation Caused by View Increase

Discriminative Similarity for Data Clustering

Deep Clustering of Text Representations for Supervision-Free Probing of Syntax

Deep Graph Clustering via Dual Correlation Reduction

Top-Down Deep Clustering with Multi-generator GANs

Neural generative model for clustering by separating particularity and commonality

Information Maximization Clustering via Multi-View Self-Labelling

Sign prediction in sparse social networks using clustering and collaborative filtering

You Never Cluster Alone

Multi-Facet Clustering Variational Autoencoders

Multi-view Contrastive Graph Clustering

Graph Contrastive Clustering

One-pass Multi-view Clustering for Large-scale Data

Multi-VAE: Learning Disentangled View-common and View-peculiar Visual Representations for Multi-view Clustering

Learn to Cluster Faces via Pairwise Classification

Multimodal Clustering Networks for Self-supervised Learning from Unlabeled Videos

Clustering by Maximizing Mutual Information Across Views

End-to-End Robust Joint Unsupervised Image Alignment and Clustering

Learning Hierarchical Graph Neural Networks for Image Clustering

Deep Descriptive Clustering

Details (Don't) Matter: Isolating Cluster Information in Deep Embedded Spaces

Graph Debiased Contrastive Learning with Joint Representation Clustering

Unsupervised Feature Learning by Cross-Level Instance-Group Discrimination

Nearest Neighbor Matching for Deep Clustering

Jigsaw Clustering for Unsupervised Visual Representation Learning

COMPLETER: Incomplete Multi-view Clustering via Contrastive Prediction

Reconsidering Representation Alignment for Multi-view Clustering

Double Low-rank Representation with Projection Distance Penalty for Clustering

Improving Unsupervised Image Clustering With Robust Learning

Learning a Self-Expressive Network for Subspace Clustering

Clusformer: A Transformer Based Clustering Approach to Unsupervised Large-Scale Face and Visual Landmark Recognition

Cluster-wise Hierarchical Generative Model for Deep Amortized Clustering

Refining Pseudo Labels with Clustering Consensus over Generations for Unsupervised Object Re-identification

Clustering-friendly Representation Learning via Instance Discrimination and Feature Decorrelation

MiCE: Mixture of Contrastive Experts for Unsupervised Image Clustering

Contrastive Clustering

Interpretable Clustering on Dynamic Graphs with Recurrent Graph Neural Networks

LRSC: Learning Representations for Subspace Clustering

Deep Fusion Clustering Network

Variational Deep Embedding Clustering by Augmented Mutual Information Maximization

Supporting Clustering with Contrastive Learning

Pseudo-Supervised Deep Subspace Clustering

A hybrid approach for text document clustering using Jaya optimization algorithm

Deep video action clustering via spatio-temporal feature learning

A new clustering method for the diagnosis of CoVID19 using medical images

A Decoder-Free Variational Deep Embedding for Unsupervised Clustering

Image clustering using an augmented generative adversarial network and information maximization

Learning the Precise Feature for Cluster Assignment

关注下方《学姐带你玩AI》🚀🚀🚀

回复“深度聚类”获取论文+代码

码字不易,欢迎大家点赞评论收藏

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐