TextSimAnalyser: Multi-Stage Text Similarity Analysis Toolkit

Intelligent Hybrid Approach for Efficient Text Comparison
Combining Traditional Algorithms with Deep Learning for Optimal Performance

Key Features

Hybrid Computation Architecture
Jaccard → Cosine → BERT staged analysis (saves GPU time vs pure-BERT approach)
Multi-Language Support
Chinese/English/Korean (paraphrase-multilingual-MiniLM-L12-v2 model)
Production-Ready
Docker/Kubernetes support • REST API • Batch processing • LRU caching
Advanced Visualization
Interactive heatmaps • PDF/Excel reports • Threshold analysis charts

Application Scenarios

Domain	Use Case	Benefit
Academic	Paper plagiarism detection	Accuracy in duplicate text
Customer Service	FAQ matching optimization	Faster response
Legal	Contract clause comparison	Reduction in manual review
E-commerce	Product description similarity	Improved recommendation relevancy

Usage Case

Basic Analysis

python from textsimanalyser import TextAnalyzer

analyzer = TextAnalyzer(mode="fast") # fast/standard/deep result = analyzer.compare( "Machine learning algorithms", "Deep neural networks" ) print(f"Composite Score: {result['composite_score']:.2%}")

Batch Processing

python batch_results = analyzer.batch_analyze( texts=["Text 1", "Text 2", "Text 3"], output_format="excel", # json/csv/html visualization=True )

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
BERT_improvement		BERT_improvement
Open API		Open API
README.md		README.md
Use Case		Use Case
Visuals		Visuals
calculate_hierarchical_similarity		calculate_hierarchical_similarity

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TextSimAnalyser: Multi-Stage Text Similarity Analysis Toolkit

Key Features

Application Scenarios

Usage Case

Basic Analysis

Batch Processing

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

TextSimAnalyser: Multi-Stage Text Similarity Analysis Toolkit

Key Features

Application Scenarios

Usage Case

Basic Analysis

Batch Processing

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Packages