Exploratory_data_analysis_and_visualization

This project explores datasets through data cleaning, preprocessing, and visualization. The main tasks include:

Titanic Dataset Analysis

Data Loading & Preprocessing
- Removed unnecessary columns.
- Extracted deck information from the Cabin column.
- Label-encoded categorical variables.
- Imputed missing values with mean (numerical) or mode (categorical).
- Saved the cleaned dataset to CSV and JSON formats.
Exploratory Data Analysis (EDA)
- Analyzed feature distributions.
- Calculated medians and modes for survivors and non-survivors.
- Created “average passenger” profiles and compared them to real passengers.
- Visualized variable relationships using scatter plots and pairplots.

Selected and improved 3 “junk charts”, making them more informative and visually clear.
Saved the enhanced visualizations for reporting and presentation.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
Chart.png		Chart.png
Data_science_junk.ipynb		Data_science_junk.ipynb
Explonatory_data_analysis_and_visualization.ipynb		Explonatory_data_analysis_and_visualization.ipynb
Improved_chart_1.png		Improved_chart_1.png
Improved_chart_2.png		Improved_chart_2.png
Improved_chart_3.png		Improved_chart_3.png
Junk_chart_1.png		Junk_chart_1.png
Junk_chart_2.png		Junk_chart_2.png
Junk_chart_3.png		Junk_chart_3.png
README.md		README.md
all_plots.pdf		all_plots.pdf
dataset_for_datascience_assignment.csv		dataset_for_datascience_assignment.csv
titanic_processed.csv		titanic_processed.csv
titanic_processed.json		titanic_processed.json
wordcloud_negative.png		wordcloud_negative.png
wordcloud_positive.png		wordcloud_positive.png