Skip to content

plendroik/foykLLM

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Hacivat & Karagöz: Uçtan Uca LLMOps Projesi Bu proje, Modern Büyük Dil Modeli (LLM) tekniklerini kullanarak Geleneksel Türk Gölge Oyunu karakterleri Hacivat ve Karagöz'ü canlandıran bir yapay zeka asistanıdır.

Proje, Supervised Fine-Tuning (SFT) ile modele karakterlerin üslubunu öğretmeyi ve RAG (Retrieval-Augmented Generation) ile modele spesifik senaryo bilgisini kazandırmayı amaçlar. Tüm süreç ZenML ile profesyonel bir MLOps boru hattı (pipeline) üzerinde yönetilmiştir.

🚀 Proje Özellikleri Supervised Fine-Tuning (SFT): Qwen2-1.5B modeli, QLoRA tekniği kullanılarak Hacivat ve Karagöz diyalogları üzerinde eğitildi. Model, "Eski İstanbul Türkçesi" ve karakterlerin mizahi üslubunu (yanlış anlamalar, atışmalar) öğrendi.

RAG (Retrieval-Augmented Generation): .jsonl formatındaki senaryo verileri vektörlere (embeddings) dönüştürülerek FAISS üzerinde indekslendi. Model, sorulan soruya en uygun bağlamı bu veritabanından çeker.

MLOps Pipeline (ZenML): Veri işleme, eğitim ve indeksleme süreçleri ZenML pipeline'ları ile modüler, izlenebilir ve tekrar edilebilir hale getirildi.

Önbellekleme (Caching): ZenML sayesinde işlenen veriler ve oluşturulan indeksler saklanır; tekrar tekrar hesaplama yapılmaz.

Lokal Çıkarım (Inference): Tüm sistem Ollama üzerinden yerel kaynaklarla (Local GPU) çalışır.

🛠️ Kullanılan Teknolojiler Orkestrasyon: ZenML

Model: Qwen2-1.5B-Instruct (Ollama üzerinden)

Fine-Tuning: Hugging Face transformers, peft (LoRA), bitsandbytes (4-bit Quantization)

Vektör Veritabanı: FAISS, sentence-transformers

Donanım: NVIDIA GPU (CUDA)

📂 Proje Yapısı Bash

llm/ ├── train_sft.py # Modeli eğiten kod (Fine-Tuning Pipeline) ├── zenml_pipeline.py # RAG veritabanını oluşturan kod (Ingestion Pipeline) └── chat_app.py # Kullanıcı arayüzü (Inference / Chatbot)

📊 Örnek Çıktılar Kullanıcı: Yar bana bir eğlence medet!

HACİVAT: Aman efendim, hoş geldiniz sefalar getirdiniz! Gönül neşe ister, kahve bahane...

KARAGÖZ: Hoş bulduk kel kafalı kara üzüm! Ne bağırıp duruyorsun sabah sabah?

Kullanıcı: Hacivat, bana biraz malumat verir misin?

HACİVAT: Efendim, ilim ilim bilmektir, ilim kendin bilmektir. Sana ne hakkında malumat lazım?

KARAGÖZ: Ne? Mahallede turşu mu satacaksın?

🔮 Gelecek Planları Daha büyük bir model (Qwen2.5-7B veya Llama-3-8B) ile dil yeteneğini artırmak.

About

Hacivat ve Karagöz LLM-Twin

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages