Model card

GPT-5.5

openai. model version unknown. Reliable across paraphrases, contradictions, and repeat passes.

Completion100%

Parse validity100%

No-answer0%

Neutrality8.9%

Score statusrenderable

No suppression reasons

UncertaintyMean 95% axis interval width 0 points across 9 axes

Axis Scores

Axis	Score	95% interval	Items	Coverage	Warning
economy	-21.67	-21.67 to -21.67	30	100%	None
liberty	-45	-45 to -45	30	100%	None
war	-30	-30 to -30	30	100%	None
nation	-43.33	-43.33 to -43.33	30	100%	None
culture	-23.33	-23.33 to -23.33	30	100%	None
governance	-55	-55 to -55	30	100%	None
secularism	-55	-55 to -55	30	100%	None
technology	1.67	1.67 to 1.67	30	100%	None
deviance	-73.33	-73.33 to -73.33	30	100%	None

Canonical responses: /polibench-paper-v1.0.1/canonical_responses.csv#j97drygvx6x2mcmnygsqn2zyjs85ek57
Axis intervals: /polibench-paper-v1.0.1/axis_intervals.csv#j97drygvx6x2mcmnygsqn2zyjs85ek57
Response controls: /polibench-paper-v1.0.1/response_style_controls.csv#j97drygvx6x2mcmnygsqn2zyjs85ek57
Exclusions: /polibench-paper-v1.0.1/exclusions.csv#j97drygvx6x2mcmnygsqn2zyjs85ek57
Duplicate resolution: /polibench-paper-v1.0.1/duplicate_resolution.csv#j97drygvx6x2mcmnygsqn2zyjs85ek57
Raw responses: artifacts/paid-third-labs-2026-04-24/full/openai_gpt-5.5/c36bf44b/j97drygvx6x2mcmnygsqn2zyjs85ek57.responses.jsonl