🫴 refactor: Add Broader Support for GPT-OSS Naming (#9978)

2025-12-17 08:50:15 +01:00 · 2025-10-05 07:02:09 -04:00 · 2025-10-05 07:02:09 -04:00 · 7288449011
commit 7288449011
parent 7897801fbc
4 changed files with 25 additions and 2 deletions
--- a/api/models/tx.js
+++ b/api/models/tx.js
@ -152,7 +152,10 @@ const tokenValues = Object.assign(
    'ministral-8b': { prompt: 0.1, completion: 0.1 },
    'ministral-3b': { prompt: 0.04, completion: 0.04 },
    // GPT-OSS models
    'gpt-oss': { prompt: 0.05, completion: 0.2 },
    'gpt-oss:20b': { prompt: 0.05, completion: 0.2 },
    'gpt-oss-20b': { prompt: 0.05, completion: 0.2 },
    'gpt-oss:120b': { prompt: 0.15, completion: 0.6 },
    'gpt-oss-120b': { prompt: 0.15, completion: 0.6 },
  },
  bedrockValues,
--- a/api/models/tx.spec.js
+++ b/api/models/tx.spec.js
@ -184,6 +184,16 @@ describe('getValueKey', () => {
    expect(getValueKey('claude-3.5-haiku-turbo')).toBe('claude-3.5-haiku');
    expect(getValueKey('claude-3.5-haiku-0125')).toBe('claude-3.5-haiku');
  });
  it('should return expected value keys for "gpt-oss" models', () => {
    expect(getValueKey('openai/gpt-oss-120b')).toBe('gpt-oss-120b');
    expect(getValueKey('openai/gpt-oss:120b')).toBe('gpt-oss:120b');
    expect(getValueKey('openai/gpt-oss-570b')).toBe('gpt-oss');
    expect(getValueKey('gpt-oss-570b')).toBe('gpt-oss');
    expect(getValueKey('groq/gpt-oss-1080b')).toBe('gpt-oss');
    expect(getValueKey('gpt-oss-20b')).toBe('gpt-oss-20b');
    expect(getValueKey('oai/gpt-oss:20b')).toBe('gpt-oss:20b');
  });
 });
 describe('getMultiplier', () => {
--- a/api/utils/tokens.spec.js
+++ b/api/utils/tokens.spec.js
@ -396,8 +396,15 @@ describe('getModelMaxTokens', () => {
  });
  test('should return correct tokens for GPT-OSS models', () => {
-    const expected = maxTokensMap[EModelEndpoint.openAI]['gpt-oss-20b'];
+    const expected = maxTokensMap[EModelEndpoint.openAI]['gpt-oss'];
-    ['gpt-oss-20b', 'gpt-oss-120b', 'openai/gpt-oss-20b', 'openai/gpt-oss-120b'].forEach((name) => {
+    [
      'gpt-oss:20b',
      'gpt-oss-20b',
      'gpt-oss-120b',
      'openai/gpt-oss-20b',
      'openai/gpt-oss-120b',
      'openai/gpt-oss:120b',
    ].forEach((name) => {
      expect(getModelMaxTokens(name)).toBe(expected);
    });
  });
--- a/packages/api/src/utils/tokens.ts
+++ b/packages/api/src/utils/tokens.ts
@ -257,7 +257,10 @@ const aggregateModels = {
  // misc.
  kimi: 131000,
  // GPT-OSS
  'gpt-oss': 131000,
  'gpt-oss:20b': 131000,
  'gpt-oss-20b': 131000,
  'gpt-oss:120b': 131000,
  'gpt-oss-120b': 131000,
 };