🚀 fix: Resolve Google Client Issues, CDN Screenshots, Update Models (#5703)

* 🤖 refactor: streamline model selection logic for title model in GoogleClient * refactor: add options for empty object schemas in convertJsonSchemaToZod * refactor: add utility function to check for empty object schemas in convertJsonSchemaToZod * fix: Google MCP Tool errors, and remove Object Unescaping as Google fixed this * fix: google safetySettings * feat: add safety settings exclusion via GOOGLE_EXCLUDE_SAFETY_SETTINGS environment variable * fix: rename environment variable for console JSON string length * fix: disable portal for dropdown in ExportModal component * fix: screenshot functionality to use image placeholder for remote images * feat: add visionMode property to BaseClient and initialize in GoogleClient to fix resendFiles issue * fix: enhance formatMessages to include image URLs in message content for Vertex AI * fix: safety settings for titleChatCompletion * fix: remove deprecated model assignment in GoogleClient and streamline title model retrieval * fix: remove unused image preloading logic in ScreenshotContext * chore: update default google models to latest models shared by vertex ai and gen ai * refactor: enhance Google error messaging * fix: update token values and model limits for Gemini models * ci: fix model matching * chore: bump version of librechat-data-provider to 0.7.699
2026-01-31 14:55:19 +01:00 · 2025-02-06 18:13:18 -05:00 · 2025-02-06 18:13:18 -05:00 · 63afb317c6
commit 63afb317c6
parent 33e60c379b
19 changed files with 939 additions and 720 deletions
--- a/api/utils/tokens.js
+++ b/api/utils/tokens.js
@ -49,11 +49,14 @@ const cohereModels = {
 const googleModels = {
  /* Max I/O is combined so we subtract the amount from max response tokens for actual total */
  gemini: 30720, // -2048 from max
-  'gemini-pro-vision': 12288, // -4096 from max
-  'gemini-exp': 8000,
-  'gemini-2.0-flash-thinking-exp': 30720, // -2048 from max
-  'gemini-2.0': 1048576,
-  'gemini-1.5': 1048576,
+  'gemini-pro-vision': 12288,
+  'gemini-exp': 2000000,
+  'gemini-2.0': 2000000,
+  'gemini-2.0-flash': 1000000,
+  'gemini-2.0-flash-lite': 1000000,
+  'gemini-1.5': 1000000,
+  'gemini-1.5-flash': 1000000,
+  'gemini-1.5-flash-8b': 1000000,
  'text-bison-32k': 32758, // -10 from max
  'chat-bison-32k': 32758, // -10 from max
  'code-bison-32k': 32758, // -10 from max
--- a/api/utils/tokens.spec.js
+++ b/api/utils/tokens.spec.js
@ -154,6 +154,24 @@ describe('getModelMaxTokens', () => {
  });

  test('should return correct tokens for partial match - Google models', () => {
+    expect(getModelMaxTokens('gemini-2.0-flash-lite-preview-02-05', EModelEndpoint.google)).toBe(
+      maxTokensMap[EModelEndpoint.google]['gemini-2.0-flash-lite'],
+    );
+    expect(getModelMaxTokens('gemini-2.0-flash-001', EModelEndpoint.google)).toBe(
+      maxTokensMap[EModelEndpoint.google]['gemini-2.0-flash'],
+    );
+    expect(getModelMaxTokens('gemini-2.0-flash-exp', EModelEndpoint.google)).toBe(
+      maxTokensMap[EModelEndpoint.google]['gemini-2.0-flash'],
+    );
+    expect(getModelMaxTokens('gemini-2.0-pro-exp-02-05', EModelEndpoint.google)).toBe(
+      maxTokensMap[EModelEndpoint.google]['gemini-2.0'],
+    );
+    expect(getModelMaxTokens('gemini-1.5-flash-8b', EModelEndpoint.google)).toBe(
+      maxTokensMap[EModelEndpoint.google]['gemini-1.5-flash-8b'],
+    );
+    expect(getModelMaxTokens('gemini-1.5-flash-thinking', EModelEndpoint.google)).toBe(
+      maxTokensMap[EModelEndpoint.google]['gemini-1.5-flash'],
+    );
    expect(getModelMaxTokens('gemini-1.5-pro-latest', EModelEndpoint.google)).toBe(
      maxTokensMap[EModelEndpoint.google]['gemini-1.5'],
    );