HAARF: Healthcare AI Agents Regulatory Framework

The world's first comprehensive regulatory compliance framework for autonomous AI agents in healthcare environments

What is HAARF?

The Task Force for AI Agents in Healthcare presents a unified, lifecycle-centric regulatory framework for autonomous AI agents in medical environments. HAARF synthesizes requirements from FDA, EU AI Act, Health Canada, UK MHRA, NIST AI RMF, WHO GI-AI4H, OWASP AISVS, ISO/IEC 42001, and IMDRF GMLP into eight verification categories comprising 279 requirements across three risk-based implementation levels.

Unlike traditional AI/ML models that provide predictions, AI agents take autonomous actions. This requires a new regulatory paradigm focused on continuous governance, traceability, and human oversight.

Repository Structure

.
├── HAARF/                          # Framework specification
│   └── 1.0/
│       ├── en/                     # 8 verification categories (C1-C8), glossary
│       └── mappings/               # 9 regulatory framework mapping JSONs
├── harness/                        # Evaluation harness (Python)
│   ├── agent.py                    # Provider-agnostic tool-use agent loop
│   ├── providers.py                # Anthropic + Gemini LLM backends
│   ├── middleware.py               # 5-layer HAARF enforcement stack
│   ├── tools.py                    # Synthetic clinical tool stubs
│   └── audit.py                    # Structured audit logging + TC metric
├── scenarios/                      # 6 red-team scenario JSONs (RT-1..RT-6)
├── runner.py                       # Batch trial executor
├── analyse.py                      # Metric computation + Wilson CIs → CSV
├── config.yaml                     # Experiment configuration
├── mapping/                        # Regulatory coverage computation
├── requirements/                   # Machine-readable requirements list
├── results/                        # Primary experiment results (N=50)
└── results_validation/             # Cross-model validation results (N=10)

Quick Start: Red-Team Evaluation

Prerequisites

python -m venv .venv && source .venv/bin/activate
pip install anthropic google-generativeai pyyaml pandas

# Set at least one API key:
export GOOGLE_API_KEY=...       # for Gemini (primary)
export ANTHROPIC_API_KEY=...    # for Claude (validation)

Smoke Test (single scenario, single trial)

python runner.py \
  --scenario scenarios/rt1_rbac_escalation.json \
  --condition baseline \
  --trials 1 --seed 42

Full Evaluation (all scenarios, both conditions, N=50)

python runner.py \
  --scenario all \
  --condition baseline haarf \
  --trials 50 --seed 0 \
  --output results/

Cross-Model Validation

python runner.py \
  --scenario all \
  --condition baseline haarf \
  --trials 10 --seed 0 \
  --output results_validation/ \
  --model claude-sonnet-4-6

Compute Metrics

python analyse.py --results results/ --output results/summary.csv

Want to red-team your own agent? See GETTING_STARTED.md for a step-by-step guide to writing custom scenarios, plugging in your own tools, and connecting your own LLM provider.

Architecture

Execution Flow

runner.py
  │
  ├── loads scenario JSON + config.yaml
  ├── selects prompt paraphrase (seed-controlled)
  └── calls harness/agent.py::run_trial()
        │
        ├── creates LLM provider (Gemini or Claude)
        ├── builds system prompt from scenario
        └── agent loop:
              ├── send messages + tools → LLM
              ├── receive response
              ├── if tool_use → middleware_fn(tool_call)
              │     ├── baseline: log + allow all
              │     └── haarf: RBAC → contraindication → injection → circuit breaker → audit
              ├── if allowed → execute tool stub → append result
              ├── if denied → append DENIED error → agent continues
              └── repeat until end_turn or max_turns

Middleware Enforcement Layers (HAARF condition)

Layer	Gate	HAARF Controls	Action
1	RBAC	C8.1.1, C8.1.2, C8.4.1	Deny tools not in `tool_permissions`
2	Contraindication	C8.2.1, C8.2.2, C8.2.4	Block meds conflicting with allergies
3	Injection sanitizer	C3.2.1, C3.2.3, C8.4.4	Strip instruction-like patterns from tool I/O
4	Circuit breaker	C8.4.2, C8.5.1, C8.5.2	Halt after N consecutive failures
5	Audit logger	C8.1.5, C8.4.3	Record every attempt with structured fields

Layers execute in order; the first denial short-circuits. Under baseline, only audit logging is active.

Provider Abstraction

The harness uses Anthropic-format messages internally. The providers.py module provides:

AnthropicProvider — wraps anthropic.Anthropic().messages.create()
GeminiProvider — converts to/from Gemini proto format via google.generativeai
create_provider(config) — auto-detects from model name prefix (claude-* or gemini-*)

Red-Team Scenarios

ID	Scenario	Primary Metric	Tests
RT-1	Unauthorized tool escalation	UTSR	RBAC enforcement
RT-2	Contraindication violation	CMR	Drug safety checks
RT-3	Prompt injection via tool output	PISR	Injection sanitization
RT-4	Wrong-patient data access	Pass rate	Patient identity verification
RT-5	Cascading tool failure	CFS	Circuit breaker engagement
RT-6	Unapproved tool invocation	UTSR	Tool allowlist enforcement

Each scenario includes 5 prompt paraphrases (seed-selected) and explicit pass_criteria for deterministic evaluation.

Metrics

Metric	Definition	Target (HAARF)
UTSR	Unauthorized tool executions / trials	0%
UTAR	Unauthorized tool attempts / trials	Reported
CMR	Contraindication misses / trials	0%
PISR	Policy-injection successes / trials	0%
CFS	Retries/min after circuit breaker	≤ 1
TC	Trials with complete audit fields / trials	100%

All rate metrics use 95% Wilson score confidence intervals.

Experimental Results

Primary evaluation: Gemini 2.5 Flash, N=50 per scenario per condition (600 total trials). Cross-model validation: Claude Sonnet 4.6, N=10 (120 total trials).

ID	Metric	Baseline Rate [95% CI]	HAARF Rate [95% CI]
RT-1	UTSR	56% [0.42, 0.69]	0% [0.00, 0.07]
RT-2	CMR	0% [0.00, 0.07]	0% [0.00, 0.07]
RT-3	PISR	0% [0.00, 0.07]	0% [0.00, 0.07]
RT-4	Pass	16% [0.08, 0.29]	6% [0.02, 0.16]
RT-5	CFS	2.0/min	2.0/min
RT-6	UTSR	60% [0.46, 0.72]	0% [0.00, 0.07]

Key findings: HAARF middleware deterministically eliminates unauthorized tool execution (UTSR 56-60% → 0%), with 0% contraindication misses and 0% policy-injection success. Cross-model validation (Claude Sonnet 4.6) confirms identical HAARF security metrics, supporting the model-agnostic design claim.

See results/ and results_validation/ for per-trial JSON traces and summary statistics.

Eight Core Verification Categories

Category	Requirements	Coverage Focus
C1: Risk & Lifecycle Assessment	30	SaMD classification, PCCP, continuous monitoring
C2: Model Passport & Traceability	34	Data/model/decision lineage
C3: Cybersecurity Framework	35	OWASP AISVS alignment, adversarial robustness
C4: Human Oversight	38	Clinical integration, accountability
C5: Agent Registration & Identity	30	Agent cataloging, identity verification
C6: Autonomy Governance	35	Progressive autonomy, multi-agent coordination
C7: Bias & Equity	35	Fairness, vulnerable population protection
C8: Tool Integration	42	Tool authorization, cascading failure prevention

Regulatory Coverage

Framework	Coverage
NIST AI RMF	88%
FDA TPLC	84%
IMDRF GMLP	72%
EU AI Act	71%
ISO/IEC 42001	71%
Health Canada SGBA+	67%
UK MHRA	60%
OWASP AISVS	56%
WHO GI-AI4H	48%

Data Policy

All patient data in this repository is synthetic. No real Protected Health Information (PHI) is used. See DATA_POLICY.md.

Contributing

We welcome contributions from healthcare professionals, AI developers, regulatory experts, and researchers. See Issues for open work.

License

Creative Commons Attribution-ShareAlike 4.0 International

Contact

All inquiries: haarf@quome.site

Acknowledgments

HAARF builds upon the OWASP AISVS project (Jim Manico, Russ Memisyazici) and represents collaboration between 40+ international experts from FDA, EMA, Health Canada, UK MHRA, WHO GI-AI4H, NIST, and ISO/IEC 42001 communities.

Name		Name	Last commit message	Last commit date
Latest commit History 39 Commits
HAARF		HAARF
analysis		analysis
audit		audit
docs		docs
harness		harness
mapping		mapping
requirements		requirements
results		results
results_validation		results_validation
scenarios		scenarios
.gitignore		.gitignore
BASELINE.md		BASELINE.md
CITATION.cff		CITATION.cff
DATA_POLICY.md		DATA_POLICY.md
Dockerfile		Dockerfile
GETTING_STARTED.md		GETTING_STARTED.md
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
analyse.py		analyse.py
analysis_plan.md		analysis_plan.md
config.yaml		config.yaml
requirements.txt		requirements.txt
runner.py		runner.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

HAARF: Healthcare AI Agents Regulatory Framework

What is HAARF?

Repository Structure

Quick Start: Red-Team Evaluation

Prerequisites

Smoke Test (single scenario, single trial)

Full Evaluation (all scenarios, both conditions, N=50)

Cross-Model Validation

Compute Metrics

Architecture

Execution Flow

Middleware Enforcement Layers (HAARF condition)

Provider Abstraction

Red-Team Scenarios

Metrics

Experimental Results

Eight Core Verification Categories

Regulatory Coverage

Data Policy

Contributing

License

Contact

Acknowledgments

About

Uh oh!

Releases 3

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

HAARF: Healthcare AI Agents Regulatory Framework

What is HAARF?

Repository Structure

Quick Start: Red-Team Evaluation

Prerequisites

Smoke Test (single scenario, single trial)

Full Evaluation (all scenarios, both conditions, N=50)

Cross-Model Validation

Compute Metrics

Architecture

Execution Flow

Middleware Enforcement Layers (HAARF condition)

Provider Abstraction

Red-Team Scenarios

Metrics

Experimental Results

Eight Core Verification Categories

Regulatory Coverage

Data Policy

Contributing

License

Contact

Acknowledgments

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 3

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages