feat: Added Partners, Backgrounds, and related variation selections to commander building.

2026-03-19 11:46:30 +01:00 · 2025-10-06 09:17:59 -07:00 · 2025-10-06 09:17:59 -07:00 · d416c9b238
commit d416c9b238
parent 641b305955
65 changed files with 11835 additions and 691 deletions
--- a/code/scripts/build_partner_suggestions.py
+++ b/code/scripts/build_partner_suggestions.py
@ -0,0 +1,767 @@
+"""Aggregate commander partner/background metadata for suggestion scoring.
+
+This utility ingests the commander catalog and existing deck exports to
+construct a compact, deterministic dataset that downstream suggestion logic can
+consume when ranking partner/background pairings. The output is written to
+``config/analytics/partner_synergy.json`` by default and includes:
+
+* Commander index with color identity, theme tags, and partner/background flags.
+* Theme reverse index plus deck tag co-occurrence statistics.
+* Observed partner/background pairings derived from deck export sidecars.
+
+The script is intentionally light-weight so it can run as part of CI or ad-hoc
+refresh workflows. All collections are sorted before serialization to guarantee
+stable diffs between runs on the same inputs.
+"""
+from __future__ import annotations
+
+import argparse
+import json
+import ast
+from collections import defaultdict
+import hashlib
+from dataclasses import dataclass, field
+from datetime import UTC, datetime
+from pathlib import Path
+import sys
+from typing import Dict, Iterable, List, MutableMapping, Sequence, Tuple
+
+ROOT = Path(__file__).resolve().parents[2]
+if str(ROOT) not in sys.path:
+    sys.path.insert(0, str(ROOT))
+
+import pandas as pd  # noqa: E402
+
+from code.deck_builder.partner_background_utils import analyze_partner_background  # noqa: E402
+
+try:  # Soft import to allow tests to override CSV path without settings.
+    from code.deck_builder import builder_constants as _bc
+except Exception:  # pragma: no cover - fallback when builder constants unavailable
+    _bc = None  # type: ignore
+
+DEFAULT_DECK_DIR = ROOT / "deck_files"
+DEFAULT_OUTPUT_PATH = ROOT / "config" / "analytics" / "partner_synergy.json"
+DEFAULT_COMMANDER_CSV = (
+    Path(getattr(_bc, "COMMANDER_CSV_PATH", "")) if getattr(_bc, "COMMANDER_CSV_PATH", "") else ROOT / "csv_files" / "commander_cards.csv"
+)
+
+_WUBRG_ORDER: Tuple[str, ...] = ("W", "U", "B", "R", "G", "C")
+_COLOR_PRIORITY = {color: index for index, color in enumerate(_WUBRG_ORDER)}
+
+_ALLOWED_MODES = {
+    "none",
+    "partner",
+    "partner_with",
+    "background",
+    "doctor_companion",
+    "unknown",
+}
+
+
+def _normalize_name(value: str | None) -> str:
+    return str(value or "").strip().casefold()
+
+
+def _normalize_bool(value: object) -> bool:
+    if isinstance(value, bool):
+        return value
+    if value in (0, 1):
+        return bool(value)
+    text = str(value or "").strip().casefold()
+    if not text:
+        return False
+    if text in {"1", "true", "t", "yes", "on"}:
+        return True
+    if text in {"0", "false", "f", "no", "off"}:
+        return False
+    return False
+
+
+def _coerce_sequence(value: object) -> Tuple[str, ...]:
+    if value is None:
+        return tuple()
+    if isinstance(value, (list, tuple, set)):
+        items = list(value)
+    else:
+        text = str(value).strip()
+        if not text:
+            return tuple()
+        parsed = None
+        try:
+            parsed = json.loads(text)
+        except Exception:
+            try:
+                parsed = ast.literal_eval(text)
+            except Exception:
+                parsed = None
+        if isinstance(parsed, (list, tuple, set)):
+            items = list(parsed)
+        else:
+            if ";" in text:
+                items = [part.strip() for part in text.split(";")]
+            elif "," in text:
+                items = [part.strip() for part in text.split(",")]
+            else:
+                items = [text]
+    cleaned: List[str] = []
+    seen: set[str] = set()
+    for item in items:
+        token = str(item).strip()
+        if not token:
+            continue
+        key = token.casefold()
+        if key in seen:
+            continue
+        seen.add(key)
+        cleaned.append(token)
+    return tuple(cleaned)
+
+
+def _normalize_color_identity(values: Iterable[str]) -> Tuple[str, ...]:
+    ordered: List[str] = []
+    seen: set[str] = set()
+    for value in values:
+        token = str(value or "").strip().upper()
+        if not token:
+            continue
+        if len(token) > 1 and all(ch in _COLOR_PRIORITY for ch in token):
+            for ch in token:
+                if ch not in seen:
+                    seen.add(ch)
+                    ordered.append(ch)
+            continue
+        if token not in seen:
+            seen.add(token)
+            ordered.append(token)
+    ordered.sort(key=lambda color: (_COLOR_PRIORITY.get(color, len(_COLOR_PRIORITY)), color))
+    return tuple(ordered)
+
+
+def _normalize_tag(value: str | None) -> Tuple[str, str]:
+    display = str(value or "").strip()
+    return display, display.casefold()
+
+
+@dataclass(slots=True)
+class PartnerMetadata:
+    has_partner: bool
+    partner_with: Tuple[str, ...]
+    supports_backgrounds: bool
+    choose_background: bool
+    is_background: bool
+    is_doctor: bool
+    is_doctors_companion: bool
+    has_plain_partner: bool
+    has_restricted_partner: bool
+    restricted_partner_labels: Tuple[str, ...]
+
+    def to_dict(self) -> dict[str, object]:
+        return {
+            "has_partner": self.has_partner,
+            "partner_with": list(self.partner_with),
+            "supports_backgrounds": self.supports_backgrounds,
+            "choose_background": self.choose_background,
+            "is_background": self.is_background,
+            "is_doctor": self.is_doctor,
+            "is_doctors_companion": self.is_doctors_companion,
+            "has_plain_partner": self.has_plain_partner,
+            "has_restricted_partner": self.has_restricted_partner,
+            "restricted_partner_labels": list(self.restricted_partner_labels),
+        }
+
+
+@dataclass(slots=True)
+class CommanderRecord:
+    key: str
+    name: str
+    display_name: str
+    color_identity: Tuple[str, ...]
+    themes: Tuple[str, ...]
+    role_tags: Tuple[str, ...]
+    partner_metadata: PartnerMetadata
+    usage_primary: int = 0
+    usage_secondary: int = 0
+
+    def to_dict(self) -> dict[str, object]:
+        return {
+            "name": self.name,
+            "display_name": self.display_name,
+            "color_identity": list(self.color_identity),
+            "themes": list(self.themes),
+            "role_tags": list(self.role_tags),
+            "partner": self.partner_metadata.to_dict(),
+            "usage": {
+                "primary": self.usage_primary,
+                "secondary": self.usage_secondary,
+                "total": self.usage_primary + self.usage_secondary,
+            },
+        }
+
+
+@dataclass(slots=True)
+class DeckRecord:
+    deck_id: str
+    commanders: List[str] = field(default_factory=list)
+    partner_mode: str = "none"
+    tags: MutableMapping[str, str] = field(default_factory=dict)
+    sources: set[str] = field(default_factory=set)
+
+    def add_tags(self, tags: Iterable[str]) -> None:
+        for tag in tags:
+            display, canonical = _normalize_tag(tag)
+            if not canonical:
+                continue
+            self.tags.setdefault(canonical, display)
+
+    def set_mode(self, mode: str) -> None:
+        cleaned = _normalize_partner_mode(mode)
+        if cleaned and cleaned != "none":
+            self.partner_mode = cleaned
+
+
+@dataclass(slots=True)
+class PairingStat:
+    mode: str
+    primary_key: str
+    primary_name: str
+    secondary_key: str
+    secondary_name: str
+    count: int = 0
+    tags: set[str] = field(default_factory=set)
+    examples: List[str] = field(default_factory=list)
+
+    def add(self, deck_id: str, tags: Iterable[str], max_examples: int) -> None:
+        self.count += 1
+        for tag in tags:
+            self.tags.add(tag)
+        if len(self.examples) < max_examples:
+            self.examples.append(deck_id)
+
+    def to_dict(self, commander_index: Dict[str, CommanderRecord]) -> dict[str, object]:
+        primary_colors = list(commander_index.get(self.primary_key, CommanderRecord(
+            key=self.primary_key,
+            name=self.primary_name,
+            display_name=self.primary_name,
+            color_identity=tuple(),
+            themes=tuple(),
+            role_tags=tuple(),
+            partner_metadata=PartnerMetadata(
+                has_partner=False,
+                partner_with=tuple(),
+                supports_backgrounds=False,
+                choose_background=False,
+                is_background=False,
+                is_doctor=False,
+                is_doctors_companion=False,
+                has_plain_partner=False,
+                has_restricted_partner=False,
+                restricted_partner_labels=tuple(),
+            ),
+        )).color_identity)
+        secondary_colors = list(commander_index.get(self.secondary_key, CommanderRecord(
+            key=self.secondary_key,
+            name=self.secondary_name,
+            display_name=self.secondary_name,
+            color_identity=tuple(),
+            themes=tuple(),
+            role_tags=tuple(),
+            partner_metadata=PartnerMetadata(
+                has_partner=False,
+                partner_with=tuple(),
+                supports_backgrounds=False,
+                choose_background=False,
+                is_background=False,
+                is_doctor=False,
+                is_doctors_companion=False,
+                has_plain_partner=False,
+                has_restricted_partner=False,
+                restricted_partner_labels=tuple(),
+            ),
+        )).color_identity)
+        combined = sorted(set(primary_colors) | set(secondary_colors), key=lambda c: (_COLOR_PRIORITY.get(c, len(_COLOR_PRIORITY)), c))
+        return {
+            "mode": self.mode,
+            "primary": self.primary_name,
+            "primary_canonical": self.primary_key,
+            "primary_colors": primary_colors,
+            "secondary": self.secondary_name,
+            "secondary_canonical": self.secondary_key,
+            "secondary_colors": secondary_colors,
+            "combined_colors": combined,
+            "count": self.count,
+            "tags": sorted(self.tags, key=lambda t: t.casefold()),
+            "examples": sorted(self.examples),
+        }
+
+
+def _normalize_partner_mode(value: str | None) -> str:
+    text = str(value or "").strip().replace("-", "_").casefold()
+    if not text:
+        return "none"
+    replacements = {
+        "partner with": "partner_with",
+        "partnerwith": "partner_with",
+        "choose a background": "background",
+        "choose_background": "background",
+        "backgrounds": "background",
+        "background": "background",
+        "doctor's companion": "doctor_companion",
+        "doctors companion": "doctor_companion",
+        "doctor companion": "doctor_companion",
+    }
+    normalized = replacements.get(text, text)
+    if normalized not in _ALLOWED_MODES:
+        if normalized in {"partnerwith"}:
+            normalized = "partner_with"
+        elif normalized.startswith("partner_with"):
+            normalized = "partner_with"
+        elif normalized.startswith("doctor"):
+            normalized = "doctor_companion"
+        elif normalized.startswith("background"):
+            normalized = "background"
+        else:
+            normalized = "unknown"
+    return normalized
+
+
+def _resolve_commander_csv(path: str | Path | None) -> Path:
+    if path:
+        return Path(path).resolve()
+    return Path(DEFAULT_COMMANDER_CSV).resolve()
+
+
+def _resolve_deck_dir(path: str | Path | None) -> Path:
+    if path:
+        return Path(path).resolve()
+    return Path(DEFAULT_DECK_DIR).resolve()
+
+
+def _resolve_output(path: str | Path | None) -> Path:
+    if path:
+        return Path(path).resolve()
+    return Path(DEFAULT_OUTPUT_PATH).resolve()
+
+
+def _load_commander_catalog(commander_csv: Path) -> pd.DataFrame:
+    if not commander_csv.exists():
+        raise FileNotFoundError(f"Commander catalog not found: {commander_csv}")
+    converters = getattr(_bc, "COMMANDER_CONVERTERS", None)
+    if converters:
+        df = pd.read_csv(commander_csv, converters=converters)
+    else:  # pragma: no cover - legacy path
+        df = pd.read_csv(commander_csv)
+    if "themeTags" not in df.columns:
+        df["themeTags"] = [[] for _ in range(len(df))]
+    if "roleTags" not in df.columns:
+        df["roleTags"] = [[] for _ in range(len(df))]
+    return df
+
+
+def _build_commander_index(df: pd.DataFrame) -> Tuple[Dict[str, CommanderRecord], Dict[str, dict]]:
+    index: Dict[str, CommanderRecord] = {}
+    theme_map: Dict[str, dict] = {}
+    for _, row in df.iterrows():
+        name = str(row.get("name", "")).strip()
+        display_name = str(row.get("faceName", "")).strip() or name
+        if not display_name:
+            continue
+        key = _normalize_name(display_name)
+        if key in index:
+            continue  # Prefer first occurrence for deterministic output.
+
+        color_identity = _normalize_color_identity(_coerce_sequence(row.get("colorIdentity")))
+        if not color_identity:
+            color_identity = _normalize_color_identity(_coerce_sequence(row.get("colors")))
+        theme_tags = tuple(sorted({tag.strip() for tag in _coerce_sequence(row.get("themeTags")) if tag.strip()}, key=str.casefold))
+        role_tags = tuple(sorted({tag.strip() for tag in _coerce_sequence(row.get("roleTags")) if tag.strip()}, key=str.casefold))
+
+        partner_with_col = _coerce_sequence(
+            row.get("partnerWith")
+            or row.get("partner_with")
+            or row.get("partnerNames")
+            or row.get("partner_names")
+        )
+
+        detection = analyze_partner_background(
+            row.get("type") or row.get("type_line"),
+            row.get("text") or row.get("oracleText"),
+            theme_tags or role_tags,
+        )
+
+        supports_backgrounds = bool(
+            _normalize_bool(row.get("supportsBackgrounds") or row.get("supports_backgrounds"))
+            or detection.choose_background
+        )
+        is_partner_flag = bool(_normalize_bool(row.get("isPartner") or row.get("is_partner")) or detection.has_partner)
+        is_background_flag = bool(_normalize_bool(row.get("isBackground") or row.get("is_background")) or detection.is_background)
+        is_doctor_flag = bool(_normalize_bool(row.get("isDoctor") or row.get("is_doctor")) or detection.is_doctor)
+        is_companion_flag = bool(
+            _normalize_bool(row.get("isDoctorsCompanion") or row.get("is_doctors_companion"))
+            or detection.is_doctors_companion
+        )
+
+        partner_metadata = PartnerMetadata(
+            has_partner=is_partner_flag,
+            partner_with=tuple(sorted(set(partner_with_col) | set(detection.partner_with), key=str.casefold)),
+            supports_backgrounds=supports_backgrounds,
+            choose_background=detection.choose_background,
+            is_background=is_background_flag,
+            is_doctor=is_doctor_flag,
+            is_doctors_companion=is_companion_flag,
+            has_plain_partner=detection.has_plain_partner,
+            has_restricted_partner=detection.has_restricted_partner,
+            restricted_partner_labels=tuple(sorted(detection.restricted_partner_labels, key=str.casefold)),
+        )
+
+        record = CommanderRecord(
+            key=key,
+            name=name,
+            display_name=display_name,
+            color_identity=color_identity,
+            themes=theme_tags,
+            role_tags=role_tags,
+            partner_metadata=partner_metadata,
+        )
+        index[key] = record
+
+        for tag in theme_tags:
+            display, canon = _normalize_tag(tag)
+            if not canon:
+                continue
+            entry = theme_map.setdefault(canon, {"name": display, "commanders": set(), "co_occurrence": {}, "deck_count": 0})
+            if not entry["name"]:
+                entry["name"] = display
+            entry["commanders"].add(display_name)
+    return index, theme_map
+
+
+def _deck_id_from_path(path: Path) -> str:
+    name = path.name
+    if name.endswith(".summary.json"):
+        return name[:-len(".summary.json")]
+    stem = path.stem
+    return stem
+
+
+def _collect_deck_records(deck_dir: Path) -> Dict[str, DeckRecord]:
+    records: Dict[str, DeckRecord] = {}
+    if not deck_dir.exists():
+        return records
+
+    summary_paths = sorted(deck_dir.glob("*.summary.json"))
+    for path in summary_paths:
+        deck_id = _deck_id_from_path(path)
+        record = records.setdefault(deck_id, DeckRecord(deck_id=deck_id))
+        record.sources.add(str(path.name))
+        try:
+            payload = json.loads(path.read_text(encoding="utf-8"))
+        except Exception:
+            continue
+        meta = payload.get("meta")
+        if isinstance(meta, dict):
+            commander_name = meta.get("commander")
+            if commander_name and not record.commanders:
+                record.commanders = [str(commander_name).strip()]
+            tags = meta.get("tags")
+            if isinstance(tags, list):
+                record.add_tags(tags)
+        summary = payload.get("summary")
+        if isinstance(summary, dict):
+            commander_block = summary.get("commander")
+            if isinstance(commander_block, dict):
+                names = commander_block.get("names")
+                if isinstance(names, list) and names:
+                    record.commanders = [str(name).strip() for name in names if str(name).strip()]
+                primary = commander_block.get("primary")
+                secondary = commander_block.get("secondary")
+                if primary and not record.commanders:
+                    record.commanders = [str(primary).strip()]
+                    if secondary:
+                        record.commanders.append(str(secondary).strip())
+                record.set_mode(commander_block.get("partner_mode"))
+    text_paths = sorted(deck_dir.glob("*.txt"))
+    for path in text_paths:
+        deck_id = _deck_id_from_path(path)
+        record = records.setdefault(deck_id, DeckRecord(deck_id=deck_id))
+        record.sources.add(str(path.name))
+        try:
+            with path.open("r", encoding="utf-8") as handle:
+                lines = [next(handle).rstrip("\n") for _ in range(10)]
+        except StopIteration:
+            lines = []
+        except Exception:
+            lines = []
+        commanders_line = next((line for line in lines if line.startswith("# Commanders:")), None)
+        if commanders_line:
+            commanders_txt = commanders_line.split(":", 1)[1].strip()
+            commanders = [part.strip() for part in commanders_txt.split(",") if part.strip()]
+            if commanders:
+                record.commanders = commanders
+        else:
+            single_line = next((line for line in lines if line.startswith("# Commander:")), None)
+            if single_line and not record.commanders:
+                commander_txt = single_line.split(":", 1)[1].strip()
+                if commander_txt:
+                    record.commanders = [commander_txt]
+        mode_line = next((line for line in lines if line.startswith("# Partner Mode:")), None)
+        if mode_line:
+            mode_txt = mode_line.split(":", 1)[1].strip()
+            record.set_mode(mode_txt)
+        background_line = next((line for line in lines if line.startswith("# Background:")), None)
+        if background_line:
+            background_txt = background_line.split(":", 1)[1].strip()
+            if background_txt:
+                if record.commanders and len(record.commanders) == 1:
+                    record.commanders.append(background_txt)
+                elif background_txt not in record.commanders:
+                    record.commanders.append(background_txt)
+                record.set_mode("background")
+    return records
+
+
+def _infer_missing_modes(records: Dict[str, DeckRecord], commander_index: Dict[str, CommanderRecord]) -> None:
+    for record in records.values():
+        if len(record.commanders) <= 1:
+            continue
+        if record.partner_mode not in {"partner", "partner_with", "background", "doctor_companion"}:
+            primary_key = _normalize_name(record.commanders[0])
+            secondary_key = _normalize_name(record.commanders[1])
+            primary = commander_index.get(primary_key)
+            secondary = commander_index.get(secondary_key)
+            if primary and secondary:
+                if secondary.partner_metadata.is_background:
+                    record.partner_mode = "background"
+                elif primary.partner_metadata.partner_with and secondary.display_name in primary.partner_metadata.partner_with:
+                    record.partner_mode = "partner_with"
+                elif primary.partner_metadata.is_doctor and secondary.partner_metadata.is_doctors_companion:
+                    record.partner_mode = "doctor_companion"
+                elif primary.partner_metadata.is_doctors_companion and secondary.partner_metadata.is_doctor:
+                    record.partner_mode = "doctor_companion"
+                elif primary.partner_metadata.has_partner and secondary.partner_metadata.has_partner:
+                    record.partner_mode = "partner"
+                else:
+                    record.partner_mode = "unknown"
+            else:
+                record.partner_mode = "unknown"
+
+
+def _update_commander_usage(records: Dict[str, DeckRecord], commander_index: Dict[str, CommanderRecord]) -> None:
+    for record in records.values():
+        if not record.commanders:
+            continue
+        for idx, name in enumerate(record.commanders):
+            key = _normalize_name(name)
+            entry = commander_index.get(key)
+            if entry is None:
+                continue
+            if idx == 0:
+                entry.usage_primary += 1
+            else:
+                entry.usage_secondary += 1
+
+
+def _build_theme_statistics(
+    records: Dict[str, DeckRecord],
+    theme_map: Dict[str, dict],
+) -> None:
+    for record in records.values():
+        if not record.tags:
+            continue
+        tags = list(record.tags.items())
+        for canonical, display in tags:
+            entry = theme_map.setdefault(canonical, {"name": display, "commanders": set(), "co_occurrence": {}, "deck_count": 0})
+            if not entry["name"]:
+                entry["name"] = display
+            entry["deck_count"] += 1
+        for i in range(len(tags)):
+            canon_a, display_a = tags[i]
+            for j in range(i + 1, len(tags)):
+                canon_b, display_b = tags[j]
+                if canon_a == canon_b:
+                    continue
+                entry_a = theme_map.setdefault(canon_a, {"name": display_a, "commanders": set(), "co_occurrence": {}, "deck_count": 0})
+                entry_b = theme_map.setdefault(canon_b, {"name": display_b, "commanders": set(), "co_occurrence": {}, "deck_count": 0})
+                co_a = entry_a.setdefault("co_occurrence", {})
+                co_b = entry_b.setdefault("co_occurrence", {})
+                co_a[canon_b] = co_a.get(canon_b, 0) + 1
+                co_b[canon_a] = co_b.get(canon_a, 0) + 1
+
+
+def _collect_pairing_stats(
+    records: Dict[str, DeckRecord],
+    commander_index: Dict[str, CommanderRecord],
+    max_examples: int,
+) -> Tuple[List[dict], Dict[str, int]]:
+    stats: Dict[Tuple[str, str, str], PairingStat] = {}
+    mode_counts: Dict[str, int] = defaultdict(int)
+    for record in records.values():
+        if len(record.commanders) <= 1:
+            continue
+        primary_name = record.commanders[0]
+        secondary_name = record.commanders[1]
+        primary_key = _normalize_name(primary_name)
+        secondary_key = _normalize_name(secondary_name)
+        mode = record.partner_mode or "unknown"
+        mode_counts[mode] += 1
+        stat = stats.get((mode, primary_key, secondary_key))
+        if stat is None:
+            stat = PairingStat(
+                mode=mode,
+                primary_key=primary_key,
+                primary_name=commander_index.get(primary_key, CommanderRecord(
+                    key=primary_key,
+                    name=primary_name,
+                    display_name=primary_name,
+                    color_identity=tuple(),
+                    themes=tuple(),
+                    role_tags=tuple(),
+                    partner_metadata=PartnerMetadata(
+                        has_partner=False,
+                        partner_with=tuple(),
+                        supports_backgrounds=False,
+                        choose_background=False,
+                        is_background=False,
+                        is_doctor=False,
+                        is_doctors_companion=False,
+                        has_plain_partner=False,
+                        has_restricted_partner=False,
+                        restricted_partner_labels=tuple(),
+                    ),
+                )).display_name,
+                secondary_key=secondary_key,
+                secondary_name=commander_index.get(secondary_key, CommanderRecord(
+                    key=secondary_key,
+                    name=secondary_name,
+                    display_name=secondary_name,
+                    color_identity=tuple(),
+                    themes=tuple(),
+                    role_tags=tuple(),
+                    partner_metadata=PartnerMetadata(
+                        has_partner=False,
+                        partner_with=tuple(),
+                        supports_backgrounds=False,
+                        choose_background=False,
+                        is_background=False,
+                        is_doctor=False,
+                        is_doctors_companion=False,
+                        has_plain_partner=False,
+                        has_restricted_partner=False,
+                        restricted_partner_labels=tuple(),
+                    ),
+                )).display_name,
+            )
+            stats[(mode, primary_key, secondary_key)] = stat
+        stat.add(record.deck_id, record.tags.values(), max_examples)
+    records_list = [stat.to_dict(commander_index) for stat in stats.values()]
+    records_list.sort(key=lambda entry: (-entry["count"], entry["mode"], entry["primary"], entry.get("secondary", "")))
+    return records_list, dict(sorted(mode_counts.items(), key=lambda item: item[0]))
+
+
+def build_partner_suggestions(
+    *,
+    commander_csv: str | Path | None = None,
+    deck_dir: str | Path | None = None,
+    output_path: str | Path | None = None,
+    max_examples: int = 5,
+) -> dict[str, object]:
+    """Generate the partner suggestion support dataset."""
+
+    commander_csv_path = _resolve_commander_csv(commander_csv)
+    deck_directory = _resolve_deck_dir(deck_dir)
+    output_file = _resolve_output(output_path)
+    output_file.parent.mkdir(parents=True, exist_ok=True)
+
+    commander_df = _load_commander_catalog(commander_csv_path)
+    commander_index, theme_map = _build_commander_index(commander_df)
+    deck_records = _collect_deck_records(deck_directory)
+    _infer_missing_modes(deck_records, commander_index)
+    _update_commander_usage(deck_records, commander_index)
+    _build_theme_statistics(deck_records, theme_map)
+    pairing_records, mode_counts = _collect_pairing_stats(deck_records, commander_index, max_examples)
+
+    commanders_payload = {
+        key: record.to_dict() for key, record in sorted(commander_index.items(), key=lambda item: item[0])
+    }
+
+    themes_payload: Dict[str, dict] = {}
+    for canonical, entry in sorted(theme_map.items(), key=lambda item: item[0]):
+        commanders = sorted(entry.get("commanders", []), key=str.casefold)
+        co_map = entry.get("co_occurrence", {}) or {}
+        co_payload = {
+            other: {
+                "name": theme_map.get(other, {"name": other}).get("name", other),
+                "count": count,
+            }
+            for other, count in sorted(co_map.items(), key=lambda item: item[0])
+        }
+        themes_payload[canonical] = {
+            "name": entry.get("name", canonical),
+            "commanders": commanders,
+            "commander_count": len(commanders),
+            "deck_count": entry.get("deck_count", 0),
+            "co_occurrence": co_payload,
+        }
+
+    generated_at = datetime.now(UTC).replace(microsecond=0).isoformat().replace("+00:00", "Z")
+    decks_processed = sum(1 for record in deck_records.values() if record.commanders)
+    decks_with_pairs = sum(1 for record in deck_records.values() if len(record.commanders) >= 2)
+
+    payload: dict[str, object] = {
+        "metadata": {
+            "generated_at": generated_at,
+            "commander_csv": str(commander_csv_path),
+            "deck_directory": str(deck_directory),
+            "output_path": str(output_file),
+            "commander_count": len(commander_index),
+            "theme_count": len(themes_payload),
+            "deck_exports_total": len(deck_records),
+            "deck_exports_processed": decks_processed,
+            "deck_exports_with_pairs": decks_with_pairs,
+        },
+        "commanders": commanders_payload,
+        "themes": themes_payload,
+        "pairings": {
+            "records": pairing_records,
+            "mode_counts": mode_counts,
+        },
+    }
+
+    hash_input = json.dumps(payload, sort_keys=True, separators=(",", ":")).encode("utf-8")
+    version_hash = hashlib.sha256(hash_input).hexdigest()
+    payload["metadata"]["version_hash"] = version_hash
+    payload["curated_overrides"] = {"version": version_hash, "entries": {}}
+
+    with output_file.open("w", encoding="utf-8") as handle:
+        json.dump(payload, handle, indent=2, sort_keys=True)
+        handle.write("\n")
+
+    return payload
+
+
+def main(argv: Sequence[str] | None = None) -> int:
+    parser = argparse.ArgumentParser(description="Build partner suggestion support dataset")
+    parser.add_argument("--commander-csv", dest="commander_csv", default=None, help="Path to commander_cards.csv")
+    parser.add_argument("--deck-dir", dest="deck_dir", default=None, help="Directory containing deck export files")
+    parser.add_argument("--output", dest="output_path", default=None, help="Output JSON path")
+    parser.add_argument("--max-examples", dest="max_examples", type=int, default=5, help="Maximum example deck IDs to retain per pairing")
+    args = parser.parse_args(list(argv) if argv is not None else None)
+
+    payload = build_partner_suggestions(
+        commander_csv=args.commander_csv,
+        deck_dir=args.deck_dir,
+        output_path=args.output_path,
+        max_examples=args.max_examples,
+    )
+
+    summary = payload.get("metadata", {})
+    decks = summary.get("deck_exports_processed", 0)
+    pairs = len(payload.get("pairings", {}).get("records", []))
+    print(
+        f"partner_suggestions dataset written to {summary.get('output_path')} "
+        f"(commanders={summary.get('commander_count')}, decks={decks}, pairings={pairs})"
+    )
+    return 0
+
+
+if __name__ == "__main__":  # pragma: no cover
+    raise SystemExit(main())