✨ feat: GPT-OSS models Token Limits & Rates

2026-01-31 14:55:19 +01:00 · 2025-08-07 15:03:19 -04:00 · 2025-08-07 15:03:19 -04:00 · d95d8032cc
commit d95d8032cc
parent b9f72f4869
4 changed files with 51 additions and 4 deletions
--- a/api/models/tx.js
+++ b/api/models/tx.js
@ -1,4 +1,4 @@
-const { matchModelName } = require('../utils');
+const { matchModelName } = require('../utils/tokens');
 const defaultRate = 6;

 /**
@ -147,6 +147,9 @@ const tokenValues = Object.assign(
    codestral: { prompt: 0.3, completion: 0.9 },
    'ministral-8b': { prompt: 0.1, completion: 0.1 },
    'ministral-3b': { prompt: 0.04, completion: 0.04 },
+    // GPT-OSS models
+    'gpt-oss-20b': { prompt: 0.05, completion: 0.2 },
+    'gpt-oss-120b': { prompt: 0.15, completion: 0.6 },
  },
  bedrockValues,
 );
--- a/api/models/tx.spec.js
+++ b/api/models/tx.spec.js
@ -311,6 +311,18 @@ describe('getMultiplier', () => {
      defaultRate,
    );
  });
+
+  it('should return correct multipliers for GPT-OSS models', () => {
+    const models = ['gpt-oss-20b', 'gpt-oss-120b'];
+    models.forEach((key) => {
+      const expectedPrompt = tokenValues[key].prompt;
+      const expectedCompletion = tokenValues[key].completion;
+      expect(getMultiplier({ valueKey: key, tokenType: 'prompt' })).toBe(expectedPrompt);
+      expect(getMultiplier({ valueKey: key, tokenType: 'completion' })).toBe(expectedCompletion);
+      expect(getMultiplier({ model: key, tokenType: 'prompt' })).toBe(expectedPrompt);
+      expect(getMultiplier({ model: key, tokenType: 'completion' })).toBe(expectedCompletion);
+    });
+  });
 });

 describe('AWS Bedrock Model Tests', () => {