🤖 feat: Claude Opus 4.5 Token Rates and Window Limits (#10653)

* 🤖 feat: Claude Opus 4.5 Token Rates and Window Limits - Introduced new model 'claude-opus-4-5' with defined prompt and completion values in tokenValues and cacheTokenValues. - Updated tests to validate prompt, completion, and cache rates for the new model. - Enhanced model name handling to accommodate variations for 'claude-opus-4-5' across different contexts. - Adjusted schemas to ensure correct max output token limits for the new model. * ci: Add tests for "prompt-caching" beta header in Claude Opus 4.5 models - Implemented tests to verify the addition of the "prompt-caching" beta header for the 'claude-opus-4-5' model and its variations. - Updated future-proofing logic to ensure correct max token limits for Claude 4.x and 5.x Opus models, adjusting defaults to 64K where applicable. - Enhanced existing tests to reflect changes in expected max token values for future Claude models. * chore: Remove redundant max output check for Anthropic settings - Eliminated the unnecessary check for ANTHROPIC_MAX_OUTPUT in the anthropicSettings schema, streamlining the logic for handling max output values.
2026-02-03 00:01:49 +01:00 · 2025-11-24 16:30:56 -05:00 · 2025-11-24 16:30:56 -05:00 · 9211d59388
commit 9211d59388
parent e123e5f9ec
8 changed files with 508 additions and 14 deletions
--- a/packages/api/src/endpoints/anthropic/llm.spec.ts
+++ b/packages/api/src/endpoints/anthropic/llm.spec.ts
@ -122,6 +122,38 @@ describe('getLLMConfig', () => {
    });
  });

+  it('should add "prompt-caching" beta header for claude-opus-4-5 model', () => {
+    const modelOptions = {
+      model: 'claude-opus-4-5',
+      promptCache: true,
+    };
+    const result = getLLMConfig('test-key', { modelOptions });
+    const clientOptions = result.llmConfig.clientOptions;
+    expect(clientOptions?.defaultHeaders).toBeDefined();
+    expect(clientOptions?.defaultHeaders).toHaveProperty('anthropic-beta');
+    const defaultHeaders = clientOptions?.defaultHeaders as Record<string, string>;
+    expect(defaultHeaders['anthropic-beta']).toBe('prompt-caching-2024-07-31');
+  });
+
+  it('should add "prompt-caching" beta header for claude-opus-4-5 model formats', () => {
+    const modelVariations = [
+      'claude-opus-4-5',
+      'claude-opus-4-5-20250420',
+      'claude-opus-4.5',
+      'anthropic/claude-opus-4-5',
+    ];
+
+    modelVariations.forEach((model) => {
+      const modelOptions = { model, promptCache: true };
+      const result = getLLMConfig('test-key', { modelOptions });
+      const clientOptions = result.llmConfig.clientOptions;
+      expect(clientOptions?.defaultHeaders).toBeDefined();
+      expect(clientOptions?.defaultHeaders).toHaveProperty('anthropic-beta');
+      const defaultHeaders = clientOptions?.defaultHeaders as Record<string, string>;
+      expect(defaultHeaders['anthropic-beta']).toBe('prompt-caching-2024-07-31');
+    });
+  });
+
  it('should NOT include topK and topP for Claude-3.7 models with thinking enabled (decimal notation)', () => {
    const result = getLLMConfig('test-api-key', {
      modelOptions: {
@ -707,6 +739,7 @@ describe('getLLMConfig', () => {
          { model: 'claude-haiku-4-5-20251001', expectedMaxTokens: 64000 },
          { model: 'claude-opus-4-1', expectedMaxTokens: 32000 },
          { model: 'claude-opus-4-1-20250805', expectedMaxTokens: 32000 },
+          { model: 'claude-opus-4-5', expectedMaxTokens: 64000 },
          { model: 'claude-sonnet-4-20250514', expectedMaxTokens: 64000 },
          { model: 'claude-opus-4-0', expectedMaxTokens: 32000 },
        ];
@ -771,6 +804,17 @@ describe('getLLMConfig', () => {
        });
      });

+      it('should default Claude Opus 4.5 model to 64K tokens', () => {
+        const testCases = ['claude-opus-4-5', 'claude-opus-4-5-20250420', 'claude-opus-4.5'];
+
+        testCases.forEach((model) => {
+          const result = getLLMConfig('test-key', {
+            modelOptions: { model },
+          });
+          expect(result.llmConfig.maxTokens).toBe(64000);
+        });
+      });
+
      it('should default future Claude 4.x Sonnet/Haiku models to 64K (future-proofing)', () => {
        const testCases = ['claude-sonnet-4-20250514', 'claude-sonnet-4-9', 'claude-haiku-4-8'];

@ -782,15 +826,24 @@ describe('getLLMConfig', () => {
        });
      });

-      it('should default future Claude 4.x Opus models to 32K (future-proofing)', () => {
-        const testCases = ['claude-opus-4-0', 'claude-opus-4-7'];
-
-        testCases.forEach((model) => {
+      it('should default future Claude 4.x Opus models (future-proofing)', () => {
+        // opus-4-0 through opus-4-4 get 32K
+        const opus32kModels = ['claude-opus-4-0', 'claude-opus-4-1', 'claude-opus-4-4'];
+        opus32kModels.forEach((model) => {
          const result = getLLMConfig('test-key', {
            modelOptions: { model },
          });
          expect(result.llmConfig.maxTokens).toBe(32000);
        });
+
+        // opus-4-5+ get 64K
+        const opus64kModels = ['claude-opus-4-5', 'claude-opus-4-7', 'claude-opus-4-10'];
+        opus64kModels.forEach((model) => {
+          const result = getLLMConfig('test-key', {
+            modelOptions: { model },
+          });
+          expect(result.llmConfig.maxTokens).toBe(64000);
+        });
      });

      it('should handle explicit maxOutputTokens override for Claude 4.x models', () => {
@ -908,7 +961,7 @@ describe('getLLMConfig', () => {
        });
      });

-      it('should future-proof Claude 5.x Opus models with 32K default', () => {
+      it('should future-proof Claude 5.x Opus models with 64K default', () => {
        const testCases = [
          'claude-opus-5',
          'claude-opus-5-0',
@ -920,28 +973,28 @@ describe('getLLMConfig', () => {
          const result = getLLMConfig('test-key', {
            modelOptions: { model },
          });
-          expect(result.llmConfig.maxTokens).toBe(32000);
+          expect(result.llmConfig.maxTokens).toBe(64000);
        });
      });

      it('should future-proof Claude 6-9.x models with correct defaults', () => {
        const testCases = [
-          // Claude 6.x
+          // Claude 6.x - All get 64K since they're version 5+
          { model: 'claude-sonnet-6', expected: 64000 },
          { model: 'claude-haiku-6-0', expected: 64000 },
-          { model: 'claude-opus-6-1', expected: 32000 },
+          { model: 'claude-opus-6-1', expected: 64000 }, // opus 6+ gets 64K
          // Claude 7.x
          { model: 'claude-sonnet-7-20270101', expected: 64000 },
          { model: 'claude-haiku-7.5', expected: 64000 },
-          { model: 'claude-opus-7', expected: 32000 },
+          { model: 'claude-opus-7', expected: 64000 }, // opus 7+ gets 64K
          // Claude 8.x
          { model: 'claude-sonnet-8', expected: 64000 },
          { model: 'claude-haiku-8-2', expected: 64000 },
-          { model: 'claude-opus-8-latest', expected: 32000 },
+          { model: 'claude-opus-8-latest', expected: 64000 }, // opus 8+ gets 64K
          // Claude 9.x
          { model: 'claude-sonnet-9', expected: 64000 },
          { model: 'claude-haiku-9', expected: 64000 },
-          { model: 'claude-opus-9', expected: 32000 },
+          { model: 'claude-opus-9', expected: 64000 }, // opus 9+ gets 64K
        ];

        testCases.forEach(({ model, expected }) => {
--- a/packages/api/src/utils/tokens.ts
+++ b/packages/api/src/utils/tokens.ts
@ -133,8 +133,9 @@ const anthropicModels = {
  'claude-3.5-sonnet-latest': 200000,
  'claude-haiku-4-5': 200000,
  'claude-sonnet-4': 1000000,
-  'claude-opus-4': 200000,
  'claude-4': 200000,
+  'claude-opus-4': 200000,
+  'claude-opus-4-5': 200000,
 };

 const deepseekModels = {
@ -334,8 +335,9 @@ const anthropicMaxOutputs = {
  'claude-3-sonnet': 4096,
  'claude-3-opus': 4096,
  'claude-haiku-4-5': 64000,
-  'claude-opus-4': 32000,
  'claude-sonnet-4': 64000,
+  'claude-opus-4': 32000,
+  'claude-opus-4-5': 64000,
  'claude-3.5-sonnet': 8192,
  'claude-3-5-sonnet': 8192,
  'claude-3.7-sonnet': 128000,