General Dev Tools

A curated collection of development tools, libraries, services, and learning resources I use, like, or want to explore.

Quick Index by Team

DBA → Databases, Data Storage, Catalogs & Lineage, Secrets Management
Integrations → Ingestion (ETL/ELT), APIs, Webscraping, Automation
Analytics / Reporting → Visualization, Notebooks, Statistics & Data Manipulation, Geospatial & Enrichment, Machine Learning

Ongoing Reading — Medium Lists

Curated reading lists I maintain on Medium:

Podcasts

Regular rotation — a mix of AI, security, and Python:

Podcast	Cadence	Length	Focus
The AI Daily Brief	Daily	~15 min	AI news
NVIDIA AI Podcast	Weekly	~30 min	AI applications
Cybersecurity Headlines	Daily	~5 min	Security news
Python Bytes	Weekly	~30 min	Python ecosystem
Darknet Diaries	Monthly	1–2 hr	Hacking / attack stories

1. Data Platform

Databases

Modern
- FaunaDB
- SingleStore
- Apache Druid — competitor to SingleStore
- RethinkDB — live DB
- Firebase
- DynamoDB

Data Storage

Decentralized cloud storage
- Storj — interesting for future encrypted messaging use cases
Data reading/writing (GCP, Azure, AWS)
- Smart Open

Ingestion (ETL/ELT)

Flatfile — data onboarding platform
Fivetran — cloud data integration
Matillion — cloud data integration
Apache Gobblin — open-source distributed data integration
Singer — open-source standard for data movement scripts
Meltano — open-source ELT for DataOps
Airbyte — open-source data integration
Stitch — simple, extensible cloud ETL (Talend)
Hevo — no-code data pipeline
Apache Hop — open-source data integration
Meroxa — real-time data ingestion
Portable — cloud-hosted ELT
Others: Talend, StreamSets, Alooma (Google), Xplenty, Striim, Panoply, Stambia, HVR

Transformations

dbt — transformations
Apache Beam

Data Lineage

Pachyderm

Data Management

Dataframe.ai
WHALE — search-like data tool

Catalogs & Lineage

Data Stack Reference

2. Analytics & Reporting

Visualization

Superset
Streamlit
- Streamlit with Sweetviz

Notebooks

Statistics & Data Manipulation

Summary statistics
- Sidetable — pandas sidecar
Test selection
- Statistical Tests Mind Map
Dates
- Ultimate Python dateparser with holidays & paydays
- verstack dateparser docs
Time series
- Darts
General
- Pingouin — stats
- Repeated Measures (Rizopoulos)
- Handbook of Parametric and Nonparametric Statistical Procedures, 5th Edition
Data checks / schema / types
- Pandera
- Pydantic
- mypy

Geospatial & Enrichment

Libraries & toolkits
- Kepler.gl — geocoding / visualization
- MovingPandas
- GeoPandas
- geopy
- geog
- python-geospatial — collection
- 22 Python libraries for geospatial data analysis
- Clustering geospatial data — example
- Using SingleStore as a geospatial DB
Geographic enrichment by ZIP code
- ZIP / ZCTA / judicial crosswalk for ACS
- ZIP-to-FIPS crosswalk (HUD) — select ZIP-COUNT
- Census Reporter
- Census API — demographics, economics, families, housing, social, health insurance, poverty/SNAP
Historical data
- Visual Crossing — historical weather
- Covid Act Now API — historical COVID by state / FIP
Health & disparities
- Neighborhood Atlas (UW)
  - My GitHub mirror for county health data
- County Health Rankings
Food environments
- USDA Food Environment Atlas
Food retail stores
- NY retail food stores example
Regulated agencies
- TTB — wine, alcohol, fuel, guns, etc.
- DC liquor licenses

3. Integrations & APIs

APIs

API directories
- Public API search
- listt.xyz
- m3o.com
- Nylas — communication-focused
Payments
- Stripe Connect
- Stripe Payment Links
Security
- TypingDNA — typing biometric
Scheduling
- OnSched
- Timekit
- Vyte
Speech / NLP
- AssemblyAI
Food
- Chomp
News
- NewsAPI
Signatures
- Concord

Webscraping

Stealth web scraping in Python

Automation

Airflow
See also: Open-source Airflow alternatives

Deployment Helpers

ngrok — quick localhost tunneling

Diagrams

AWS diagram creator

4. Machine Learning

Core Frameworks

TensorFlow (Google)
PyTorch (Meta)

Cheat Sheets

Stanford CS229 cheatsheet

Labeling

Explainable

Forecasting

Neuralforecast (Nixtla)

Features

Feathr (LinkedIn)

NLP

spaCy
NER annotation example
Language translation
- FairSeq / NLLB (Meta)
Science journals

Computer Vision

DALL·E 2 (PyTorch) — text-to-image
Awesome Text-to-Image (free)
AugLy (Meta) — image augmentation
FaceSynthetics (Microsoft) — synthetic faces
face_recognition
Norfair — real-time tracking
DeepSORT walkthrough
Digital cloning

Recommendation

Microsoft Recommenders — best practices
Surprise
Collaborative
- Walkthrough
- implicit

Session-Based Recommendations

Competitions
- RecSys Challenges — 2022
Notebooks
Libraries

Pre-Made ML / AI

Hugging Face
BlobCity Cloud
Homemade ML
Model Zoo
Pretrained model collections: Audio, NLP, CV

AutoML

Awesome Lists & Notebooks

Awesome production ML
awesome-jupyter
best-of-jupyter
DL Colab notebooks — fakes / audio / video / pose
Starter notebooks
- awesome-notebooks — GoogleSheets, Airtable, Sendgrid, Slack, etc.
- Homemade ML
- LazyProgrammer ML examples
- Susan Li — ML with Python
- TensorFlow examples
- PyTorch examples
- AWS SageMaker examples

Datasets for Testing

Data repositories for almost every project type

5. Infrastructure & DevOps

IaC

Pulumi
- Pulumi — a true IaC paradigm
Terraform tooling
- Infracost
- Brainboard — auto-generate Terraform
- Checkov — config error scanning
Ansible
- ansible-for-devops
- ansible-examples

CaaS (Cloud-as-a-Service)

My own (based on Pulumi + AWS)
OpenStack
CloudStack (Apache)
OpenNebula

Kubernetes

Helm
Knative
Kubeflow
Crossplane

AWS Specific / Labs

Monitoring

Uptime Kuma

Testing

Chaos engineering
- Gremlin

Free Cloud Resources

Oracle — Always Free
Vercel — has always-free tier
Heroku

6. Security

Cloud Checks

Scout Suite

Identity Management

StrongDM

Secrets Management

Doppler
Vault

Multi-Cloud Account Switching

Leapp — GitHub

Pen Testing

Metasploit (Rapid7)
Metasploitable3 — vulnerable VM
Onion Browser
Python-based
- awesome-pentest-tools-in-colab
- python-pentest-tools
Non-Python

7. Application Development

SaaS Starter Kits

Next.js

Enterprise: nextlessjs.com
Free (same author): Next-js-Boilerplate

Codebase Generators

Divjoy — pick backend / frontend / deployment

Paid

Reactapp — $19 lifetime
SaaS Rock — $149 lifetime
Serverless.page — $199 lifetime
Bedrock — $396 per project
Nextless — $699 per project
Rocketapp
Gravity — docs
ShipSaaS

Free

My evaluation notes (Free options)

Nextacular
- Billing: Stripe
- Documentation: limited / WIP — docs
- Deployment: Vercel (auto SSL)
- Databases: relational only (SQL / PostgreSQL / Aurora)
- Pros: multi-domain; relational DB; teams + workspaces; Stripe; Tailwind; email handling
SaaS Starter Kit
- Billing: Stripe
- Documentation: good / mostly fleshed out — docs
- Deployment: on your own
- Databases: relational (Postgres) + non-relational (MongoDB)
- Pros: ML example built in; onboarding; Docker; Stripe; AWS APIs

Low Code / No Code

Backend
- Supabase
- Parse
- Appwrite
- Nhost
- Hasura
- PocketBase
Frontend
- AppGyver

Frontend Multi-Deployment

Frontend Styles

Fonts / styles
- Why you should use a developer font
UX examples
- Really Good UX

Authorization

Authorizer

Documentation Tools

Docusaurus
Docz
API documentation
- readme.com
- ReDoc / Redocly — GitHub

Search Tools

Misc Utilities

UUIDs
- NanoID — URL-friendly unique identifiers
Linux cheatsheets
- xmind cheatsheet

Open Source Alternatives

Airflow
- NocoDB
- Top low/no-code databases
Calendly
- Cal.com

8. Training & General Ed

Resources

Blogs
- Chubby Developer
- Medium
Podcasts

Architecture & System Design

ByteByteGo — system design archive
Software architecture patterns (5 min read)
SSH tunneling explained
Stanford ML systems (CS329S)

ML Learning

SQL Training

SQL Fiddle — playground for queries
SQL Bolt — interactive tutorial for beginners
Select Star SQL — interactive tutorial
SQL Murder Mystery — intermediate/advanced
SQL Indexing for Devs
SQL Zoo
SQL Tutorial for Data Analysis
Other
- Databases & SQL for DS (IBM, Coursera)
- Learn SQL Basics for DS (Coursera)
- SQL Cookbook — O'Reilly
- SQL 57 Practice Problems — Sylvia Vasilik
- SQL for Data Analytics — Packt

Python Training

Official / standard
- Official Python tutorial
- Pandas Tutor
- milaan9 — Jupyter learning notebooks — 02_python_datatypes, 04_python_dictionaries
Stanford
Harvard
- Python intro PDF
UCSF
- Data Science programming
- Python novice inflammation
ECU
- Python intro PDF
Duke
- Python tutorial PDF
Emertxe
- Slideshare presentations
- Python data types
Bootcamps & books
- Powerful Python bootcamp
- 2022 Complete Python Bootcamp (Udemy)
- Complete Python Developer (Udemy)
- Python Crash Course (2nd ed.) — Eric Matthews
- Python Cookbook — O'Reilly
- Elements of Programming Interviews in Python — Adnan & Amit

Statistics Training

Intro to Statistics (Udacity)
Intro to Inferential Statistics (Udacity)
Statistics & Probability (Khan Academy)
Statistics in Plain English — Timothy C. Urdan
Head First Statistics — Dawn Griffiths
ISLR (Introduction to Statistical Learning)
ESLR (Elements of Statistical Learning)
Ashington — Medium blog

Name		Name	Last commit message	Last commit date
Latest commit History 53 Commits
.gitignore		.gitignore
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

General Dev Tools

Quick Index by Team

Ongoing Reading — Medium Lists

Podcasts

1. Data Platform

Databases

Data Storage

Ingestion (ETL/ELT)

Transformations

Data Lineage

Data Management

Catalogs & Lineage

Data Stack Reference

2. Analytics & Reporting

Visualization

Notebooks

Statistics & Data Manipulation

Geospatial & Enrichment

3. Integrations & APIs

APIs

Webscraping

Automation

Deployment Helpers

Diagrams

4. Machine Learning

Core Frameworks

Cheat Sheets

Labeling

Bias

Drift / Monitoring

Scary Use Cases

Explainable

Forecasting

Features

NLP

Computer Vision

Recommendation

Session-Based Recommendations

Pre-Made ML / AI

AutoML

Awesome Lists & Notebooks

Datasets for Testing

5. Infrastructure & DevOps

IaC

CaaS (Cloud-as-a-Service)

Kubernetes

AWS Specific / Labs

Monitoring

Testing

Free Cloud Resources

6. Security

Cloud Checks

Identity Management

Secrets Management

Multi-Cloud Account Switching

Pen Testing

7. Application Development

SaaS Starter Kits

Low Code / No Code

Frontend Multi-Deployment

Frontend Styles

Authorization

Documentation Tools

Search Tools

Misc Utilities

Open Source Alternatives

8. Training & General Ed

Resources

Architecture & System Design

ML Learning

SQL Training

Python Training

Statistics Training

About

Resources

Uh oh!

Packages