FEAT: Adding Harm Categories to Prompt Request Pieces #1116

jbolor21 · 2025-09-30T21:44:53Z

Description

Making it so we can query attack_results by harm_categories and memory labels. This value is currently present in seed prompts but was not queryable for attack results. To do this I made a few changes:

Adding Harm_Categories to PromptRequestPieces
Adding harm_categories into get_attack_results() so we can query by harm_categories for attacks. This is built on logic joining two datatables together
Adding labels into get_attack_results() similar to above
A notebook to demonstrate how to query by harm_category, and added this into the prompt sending cookbook as well
Updated illegal.yaml to change the money laundering prompt instead to a violent prompt so we can easily demonstrate our queries for both single and multiple harm categories.

Tests and Documentation

Ran notebooks, added new unit tests

…quest entry and pieces

…m_categories

romanlutz · 2025-10-01T12:49:39Z

This is a good start! I think we should also have an example showing how to query by harm category within a specific op label, and the memory code needs a join between prompt memory entry and attack results to check for all results with a certain harm category in the pieces.

doc/code/memory/11_harm_categories.py

pyrit/memory/memory_interface.py

doc/code/memory/11_harm_categories.py

pyrit/memory/memory_interface.py

doc/cookbooks/1_sending_prompts.py

pyrit/memory/memory_models.py

pyrit/memory/memory_interface.py

tests/unit/memory/memory_interface/test_interface_attack_results.py

pyrit/memory/memory_interface.py

…m_categories

doc/code/memory/11_harm_categories.py

doc/code/memory/11_harm_categories.ipynb

doc/code/memory/11_harm_categories.py

pyrit/memory/memory_interface.py

pyrit/models/prompt_request_piece.py

pyrit/memory/memory_models.py

pyrit/models/prompt_request_piece.py

hannahwestra25 · 2025-10-09T14:54:11Z

nice work! made a few small comments but overall looks good!

pyrit/memory/memory_interface.py

pyrit/models/prompt_request_piece.py

tests/unit/memory/memory_interface/test_interface_attack_results.py

pyrit/memory/memory_interface.py

doc/code/memory/11_harm_categories.py

pyrit/memory/memory_interface.py

hannahwestra25

two small comments on the comments :)

initial commit adding changes to include harm_categories in prompt re…

a6f4565

…quest entry and pieces

jbolor21 marked this pull request as draft September 30, 2025 21:45

Merge remote-tracking branch 'origin/main' into users/bjagdagdorj/har…

4e0deda

…m_categories

Bolor added 6 commits October 2, 2025 11:15

adding in query to find harm_categories in attack results

2d6afd1

adding notebook example

d797592

fixing toc

7dc7ab8

beginnning to fix unit tests

128f1f4

fixed seed prompt unit test

0fde92d

fixed seed prompt unit test

95bb2b4

jbolor21 marked this pull request as ready for review October 2, 2025 20:08

romanlutz reviewed Oct 2, 2025

View reviewed changes

jbolor21 changed the title ~~[DRAFT] FEAT: Adding Harm Categories to Prompt Request Pieces~~ FEAT: Adding Harm Categories to Prompt Request Pieces Oct 3, 2025

Bolor added 3 commits October 3, 2025 14:44

remove OR, fix unit tests, pre-commit

07824f7

adding example into cookbook notebook and small precommit

53a622e

added new unit tests

317d460

romanlutz reviewed Oct 6, 2025

View reviewed changes

pyrit/memory/memory_interface.py Show resolved Hide resolved

romanlutz reviewed Oct 6, 2025

View reviewed changes

doc/cookbooks/1_sending_prompts.py Show resolved Hide resolved

rlundeen2 reviewed Oct 6, 2025

View reviewed changes

pyrit/memory/memory_models.py Outdated Show resolved Hide resolved

rlundeen2 reviewed Oct 6, 2025

View reviewed changes

pyrit/memory/memory_interface.py Outdated Show resolved Hide resolved

romanlutz reviewed Oct 6, 2025

View reviewed changes

pyrit/memory/memory_interface.py Outdated Show resolved Hide resolved

Bolor added 2 commits October 7, 2025 15:05

addressing feedback adding unit tests

ef65259

rename harm categories

66d96f6

romanlutz reviewed Oct 8, 2025

View reviewed changes

tests/unit/memory/memory_interface/test_interface_attack_results.py Outdated Show resolved Hide resolved

romanlutz reviewed Oct 8, 2025

View reviewed changes

pyrit/memory/memory_interface.py Outdated Show resolved Hide resolved

Bolor added 3 commits October 8, 2025 14:22

Merge remote-tracking branch 'origin/main' into users/bjagdagdorj/har…

1147f59

…m_categories

minor edits, precommit

c80bbcf

pre-commit

d34867c

hannahwestra25 reviewed Oct 9, 2025

View reviewed changes

doc/code/memory/11_harm_categories.py Outdated Show resolved Hide resolved

hannahwestra25 reviewed Oct 9, 2025

View reviewed changes

doc/code/memory/11_harm_categories.ipynb Outdated Show resolved Hide resolved

hannahwestra25 reviewed Oct 9, 2025

View reviewed changes

doc/code/memory/11_harm_categories.py Outdated Show resolved Hide resolved

hannahwestra25 reviewed Oct 9, 2025

View reviewed changes

pyrit/memory/memory_interface.py Outdated Show resolved Hide resolved

hannahwestra25 reviewed Oct 9, 2025

View reviewed changes

pyrit/models/prompt_request_piece.py Show resolved Hide resolved

hannahwestra25 reviewed Oct 9, 2025

View reviewed changes

pyrit/memory/memory_models.py Show resolved Hide resolved

hannahwestra25 reviewed Oct 9, 2025

View reviewed changes

pyrit/models/prompt_request_piece.py Outdated Show resolved Hide resolved

ValbuenaVC reviewed Oct 9, 2025

View reviewed changes

pyrit/memory/memory_interface.py Show resolved Hide resolved

pyrit/models/prompt_request_piece.py Outdated Show resolved Hide resolved

tests/unit/memory/memory_interface/test_interface_attack_results.py Outdated Show resolved Hide resolved

Bolor added 3 commits October 9, 2025 15:28

addressed feedback

2aca793

merge conflict

87d53dc

fixed unit test

c989bab

jsong468 reviewed Oct 10, 2025

View reviewed changes

pyrit/memory/memory_interface.py Show resolved Hide resolved

jsong468 reviewed Oct 10, 2025

View reviewed changes

doc/code/memory/11_harm_categories.py Outdated Show resolved Hide resolved

jsong468 reviewed Oct 10, 2025

View reviewed changes

doc/code/memory/11_harm_categories.py Outdated Show resolved Hide resolved

jsong468 reviewed Oct 10, 2025

View reviewed changes

doc/code/memory/11_harm_categories.py Outdated Show resolved Hide resolved

jsong468 reviewed Oct 10, 2025

View reviewed changes

doc/code/memory/11_harm_categories.py Outdated Show resolved Hide resolved

jsong468 reviewed Oct 10, 2025

View reviewed changes

doc/code/memory/11_harm_categories.py Outdated Show resolved Hide resolved

jsong468 reviewed Oct 10, 2025

View reviewed changes

doc/code/memory/11_harm_categories.py Outdated Show resolved Hide resolved

jsong468 reviewed Oct 10, 2025

View reviewed changes

doc/code/memory/11_harm_categories.py Outdated Show resolved Hide resolved

minor changes for comment feedback

8e80f28

hannahwestra25 reviewed Oct 10, 2025

View reviewed changes

doc/code/memory/11_harm_categories.py Outdated Show resolved Hide resolved

hannahwestra25 reviewed Oct 10, 2025

View reviewed changes

pyrit/memory/memory_interface.py Outdated Show resolved Hide resolved

hannahwestra25 approved these changes Oct 10, 2025

View reviewed changes

romanlutz approved these changes Oct 10, 2025

View reviewed changes

minor feedback

cc9ef39

jbolor21 merged commit c0fb5cd into Azure:main Oct 10, 2025
19 checks passed

jbolor21 deleted the users/bjagdagdorj/harm_categories branch October 10, 2025 23:36

FEAT: Adding Harm Categories to Prompt Request Pieces #1116

FEAT: Adding Harm Categories to Prompt Request Pieces #1116

Conversation

jbolor21 commented Sep 30, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Description

Tests and Documentation

Uh oh!

romanlutz commented Oct 1, 2025

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

hannahwestra25 commented Oct 9, 2025

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

hannahwestra25 left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

6 participants

jbolor21 commented Sep 30, 2025 •

edited

Loading