Проект представляет собой исследовательский анализ данных (EDA) на основе открытого датасета с платформы HeadHunter. Цель — выявить ключевые особенности резюме, распределения зарплат, возрастных групп, профессиональных категорий и опыта работы.
- Источник: HeadHunter (SkillFactory)
- Формат:
.csvс разделителем; - Основные поля:
- Пол, возраст, дата рождения
- Ожидаемая зарплата
- Образование, опыт работы
- Специализация
- Загрузка и предобработка данных
- Очистка и стандартизация колонок
- Визуализация распределений:
- Зарплат
- Возрастов
- Полов
- Образования и опыта
- Выявление зависимостей между признаками
pandas— работа с таблицамиmatplotlib/seaborn— визуализацияplotly— интерактивные графикиnumpy— базовая обработка массивов
- Jupyter Notebook:
Баландина_МА_проект.ipynb - Подходит для включения в портфолио начинающего аналитика данных
МАРГАРИТА БАЛАНДИНА
Junior Data Scientist
🎓 Магистратура МФТИ — «Науки о данных»
📌 Интересы: аналитика, медицина, SQL, машинное обучение
📬 Telegram: @SuperMBA