Implementacija Bayesovog klasifikatora za segmente signala govora korištenjem VEPRAD baze.
Projekt uključuje ekstrakciju MFCC značajki, klasifikaciju fonema pomoću Gaussian Naive Bayes modela te evaluaciju uspješnosti kroz classification report i confusion matrix.
Zbog veličine, podaci nisu uključeni direktno u repozitorij.
Dataset (VEPRAD, sample sm_04
) dostupan je na sljedećem linku:
Preuzmite podatke s Google Drive-a
bayes-speech-classifier/
├─ src/
│ └─ VEPRAD__PROJEKT.py # glavni Python skript
├─ requirements.txt # Python zavisnosti
├─ README.md
Nakon preuzimanja, raspakirajte sadržaj u direktorij data/
unutar repozitorija tako da struktura izgleda ovako:
data/
├─ sm_04_wav/ # .wav datoteke
└─ sm_04_lab/ # .lab datoteke
Pokrenite glavni skript iz root direktorija repozitorija:
python src/bayes_classifier.py