SimSearch

Self-Supervised Image Representation Learning & Retrieval

SimSearch is a deep learning project focused on self-supervised learning for image representation and similarity-based retrieval. The goal is to learn meaningful feature embeddings without explicit labels, enabling clustering and efficient search across visual data.

Project Overview

Traditional supervised learning relies heavily on labeled datasets. In contrast, SimSearch leverages self-supervised learning to extract patterns and structure directly from raw images.

The model learns to:

Understand visual similarity
Separate different object categories
Form meaningful clusters in embedding space

Dataset

The dataset consists of 5 subcategories:

👜 Bags
🚗 Cars
🐶 Dogs
📱 Phones
👟 Shoes

Even without labels during training, the model gradually learns to distinguish between these categories.

Methodology

Self-supervised learning approach (contrastive / representation learning)
Feature embedding generation
Dimensionality reduction for visualization
Clustering in latent space

Results & Visualization

After training, the model learns to separate datapoints and form clusters based on semantic similarity.

2D Embedding Visualization

3D Embedding Visualization

3D Interactive Embedding Visualization

Tech Stack

PyTorch
NumPy, Pandas, Matplotlib
Scikit-learn

Many Thanks

Abhinandan

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
losses		losses
models		models
utils		utils
README.md		README.md
data_type.ipynb		data_type.ipynb
generate_img_embeddings.ipynb		generate_img_embeddings.ipynb
simsearch_0_test.ipynb		simsearch_0_test.ipynb
simsearch_0_train.ipynb		simsearch_0_train.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SimSearch

Self-Supervised Image Representation Learning & Retrieval

Project Overview

Dataset

Methodology