🔧 feat: Lazy file provisioning — defer uploads to tool invocation time

Move file provisioning from eager (at chat-request start) to lazy (at tool invocation time via ON_TOOL_EXECUTE). Files are now only uploaded to code env / vector DB when the LLM actually calls the respective tool. - resources.ts: primeResources no longer provisions; computes provisionState (which files need code env / vector DB uploads) with staleness check and single credential load - handlers.ts: add provisionFiles callback to ToolExecuteOptions, called once per tool-call batch before execution - initialize.ts: pass provisionState through InitializedAgent - initialize.js: implement provisionFiles closure that provisions files in parallel, batches DB updates, clears state after use; store provisionState in agentToolContexts for all agent types
2026-04-07 00:15:23 +02:00 · 2026-03-22 13:50:59 -04:00 · 2026-03-22 13:50:59 -04:00 · 8684da106d
commit 8684da106d
parent 455d377600
4 changed files with 144 additions and 122 deletions
--- a/api/server/services/Endpoints/agents/initialize.js
+++ b/api/server/services/Endpoints/agents/initialize.js
@ -1,5 +1,5 @@
 const { logger } = require('@librechat/data-schemas');
-const { createContentAggregator } = require('@librechat/agents');
+const { Constants, createContentAggregator } = require('@librechat/agents');
 const {
  initializeAgent,
  validateAgentModel,
@ -148,6 +148,70 @@ const initializeClient = async ({ req, res, signal, endpointOption }) => {
      return result;
    },
    toolEndCallback,
+    provisionFiles: async (toolNames, agentId) => {
+      const ctx = agentToolContexts.get(agentId);
+      if (!ctx?.provisionState) {
+        return;
+      }
+
+      const { provisionState, tool_resources } = ctx;
+      const needsCode =
+        toolNames.includes(Constants.EXECUTE_CODE) ||
+        toolNames.includes(Constants.PROGRAMMATIC_TOOL_CALLING);
+      const needsSearch = toolNames.includes('file_search');
+
+      if (!needsCode && !needsSearch) {
+        return;
+      }
+
+      /** @type {import('@librechat/api').TFileUpdate[]} */
+      const pendingUpdates = [];
+
+      if (needsCode && provisionState.codeEnvFiles.length > 0 && provisionState.codeApiKey) {
+        const results = await Promise.allSettled(
+          provisionState.codeEnvFiles.map(async (file) => {
+            const { fileIdentifier, fileUpdate } = await provisionToCodeEnv({
+              req,
+              file,
+              entity_id: agentId,
+              apiKey: provisionState.codeApiKey,
+            });
+            file.metadata = { ...file.metadata, fileIdentifier };
+            pendingUpdates.push(fileUpdate);
+          }),
+        );
+        for (const result of results) {
+          if (result.status === 'rejected') {
+            logger.error('[provisionFiles] Code env provisioning failed', result.reason);
+          }
+        }
+        provisionState.codeEnvFiles = [];
+      }
+
+      if (needsSearch && provisionState.vectorDBFiles.length > 0) {
+        const results = await Promise.allSettled(
+          provisionState.vectorDBFiles.map(async (file) => {
+            const result = await provisionToVectorDB({ req, file, entity_id: agentId });
+            if (result.embedded) {
+              file.embedded = true;
+              if (result.fileUpdate) {
+                pendingUpdates.push(result.fileUpdate);
+              }
+            }
+          }),
+        );
+        for (const result of results) {
+          if (result.status === 'rejected') {
+            logger.error('[provisionFiles] Vector DB provisioning failed', result.reason);
+          }
+        }
+        provisionState.vectorDBFiles = [];
+      }
+
+      if (pendingUpdates.length > 0) {
+        await Promise.allSettled(pendingUpdates.map((update) => db.updateFile(update)));
+      }
+    },
  };

  const summarizationOptions =
@ -239,6 +303,7 @@ const initializeClient = async ({ req, res, signal, endpointOption }) => {
    userMCPAuthMap: primaryConfig.userMCPAuthMap,
    tool_resources: primaryConfig.tool_resources,
    actionsEnabled: primaryConfig.actionsEnabled,
+    provisionState: primaryConfig.provisionState,
  });

  const agent_ids = primaryConfig.agent_ids;
@ -329,6 +394,7 @@ const initializeClient = async ({ req, res, signal, endpointOption }) => {
      userMCPAuthMap: config.userMCPAuthMap,
      tool_resources: config.tool_resources,
      actionsEnabled: config.actionsEnabled,
+      provisionState: config.provisionState,
    });

    agentConfigs.set(agentId, config);
@ -412,6 +478,7 @@ const initializeClient = async ({ req, res, signal, endpointOption }) => {
      userMCPAuthMap: config.userMCPAuthMap,
      tool_resources: config.tool_resources,
      actionsEnabled: config.actionsEnabled,
+      provisionState: config.provisionState,
    });
  }

--- a/packages/api/src/agents/handlers.ts
+++ b/packages/api/src/agents/handlers.ts
@ -43,6 +43,8 @@ export interface ToolExecuteOptions {
  }>;
  /** Callback to process tool artifacts (code output files, file citations, etc.) */
  toolEndCallback?: ToolEndCallback;
+  /** Called once per batch before tool execution to lazily provision files to tool environments */
+  provisionFiles?: (toolNames: string[], agentId?: string) => Promise<void>;
 }

 /**
@ -51,7 +53,7 @@ export interface ToolExecuteOptions {
 * executes them in parallel, and resolves with the results.
 */
 export function createToolExecuteHandler(options: ToolExecuteOptions): EventHandler {
-  const { loadTools, toolEndCallback } = options;
+  const { loadTools, toolEndCallback, provisionFiles } = options;

  return {
    handle: async (_event: string, data: ToolExecuteBatchRequest) => {
@ -61,6 +63,11 @@ export function createToolExecuteHandler(options: ToolExecuteOptions): EventHand
        await runOutsideTracing(async () => {
          try {
            const toolNames = [...new Set(toolCalls.map((tc: ToolCallRequest) => tc.name))];
+
+            if (provisionFiles) {
+              await provisionFiles(toolNames, agentId);
+            }
+
            const { loadedTools, configurable: toolConfigurable } = await loadTools(
              toolNames,
              agentId,
--- a/packages/api/src/agents/initialize.ts
+++ b/packages/api/src/agents/initialize.ts
@ -31,6 +31,7 @@ import { filterFilesByEndpointConfig } from '~/files';
 import { generateArtifactsPrompt } from '~/prompts';
 import { getProviderConfig } from '~/endpoints';
 import { primeResources } from './resources';
+import type { ProvisionState } from './resources';
 import type {
  TFileUpdate,
  TFilterFilesByAgentAccess,
@ -75,6 +76,8 @@ export type InitializedAgent = Agent & {
  maxToolResultChars?: number;
  /** Warnings from lazy file provisioning (e.g., failed uploads) */
  provisionWarnings?: string[];
+  /** State for deferred file provisioning — actual uploads happen at tool invocation time */
+  provisionState?: ProvisionState;
 };

 /**
@ -306,6 +309,7 @@ export async function initializeAgent(
  const {
    attachments: primedAttachments,
    tool_resources,
+    provisionState,
    warnings: provisionWarnings,
  } = await primeResources({
    req: req as never,
@ -319,11 +323,8 @@ export async function initializeAgent(
    tool_resources: agent.tool_resources,
    requestFileSet: new Set(requestFiles?.map((file) => file.file_id)),
    enabledToolResources: toolResourceSet,
-    provisionToCodeEnv: db.provisionToCodeEnv,
-    provisionToVectorDB: db.provisionToVectorDB,
    checkSessionsAlive: db.checkSessionsAlive,
    loadCodeApiKey: db.loadCodeApiKey,
-    updateFile: db.updateFile as ((data: TFileUpdate) => Promise<unknown>) | undefined,
  });

  const {
@ -481,6 +482,7 @@ export async function initializeAgent(
    useLegacyContent: !!options.useLegacyContent,
    tools: (tools ?? []) as GenericTool[] & string[],
    maxToolResultChars: maxToolResultCharsResolved,
+    provisionState,
    provisionWarnings:
      provisionWarnings != null && provisionWarnings.length > 0 ? provisionWarnings : undefined,
    maxContextTokens:
--- a/packages/api/src/agents/resources.ts
+++ b/packages/api/src/agents/resources.ts
@ -48,6 +48,18 @@ export type TCheckSessionsAlive = (params: {
 /** Loads CODE_API_KEY for a user. Call once per request. */
 export type TLoadCodeApiKey = (userId: string) => Promise<string>;

+/** State computed during primeResources for lazy provisioning at tool invocation time */
+export type ProvisionState = {
+  /** Files that need uploading to the code execution environment */
+  codeEnvFiles: TFile[];
+  /** Files that need embedding into the vector DB for file_search */
+  vectorDBFiles: TFile[];
+  /** Pre-loaded CODE_API_KEY to avoid redundant credential fetches */
+  codeApiKey?: string;
+  /** Set of file_ids confirmed alive in code env (from staleness check) */
+  aliveFileIds: Set<string>;
+};
+
 /**
 * Function type for retrieving files from the database
 * @param filter - MongoDB filter query for files
@ -82,7 +94,7 @@ export type TFilterFilesByAgentAccess = (params: {
 * @param params.tool_resources - The agent's tool resources object to update
 * @param params.processedResourceFiles - Set tracking processed files per resource type
 */
-const addFileToResource = ({
+export const addFileToResource = ({
  file,
  resourceType,
  tool_resources,
@ -206,11 +218,8 @@ export const primeResources = async ({
  tool_resources: _tool_resources,
  agentId,
  enabledToolResources,
-  provisionToCodeEnv,
-  provisionToVectorDB,
  checkSessionsAlive,
  loadCodeApiKey,
-  updateFile,
 }: {
  req: ServerRequest & { user?: IUser };
  appConfig?: AppConfig;
@ -222,19 +231,14 @@ export const primeResources = async ({
  agentId?: string;
  /** Set of tool resource types the agent has enabled (e.g., execute_code, file_search) */
  enabledToolResources?: Set<EToolResources>;
-  /** Optional callback to provision a file to the code execution environment */
-  provisionToCodeEnv?: TProvisionToCodeEnv;
-  /** Optional callback to provision a file to the vector DB for file_search */
-  provisionToVectorDB?: TProvisionToVectorDB;
  /** Optional callback to batch-check code env file liveness by session */
  checkSessionsAlive?: TCheckSessionsAlive;
  /** Optional callback to load CODE_API_KEY once per request */
  loadCodeApiKey?: TLoadCodeApiKey;
-  /** Optional callback to persist file metadata updates after provisioning */
-  updateFile?: (data: TFileUpdate) => Promise<unknown>;
 }): Promise<{
  attachments: Array<TFile | undefined>;
  tool_resources: AgentToolResources | undefined;
+  provisionState?: ProvisionState;
  warnings: string[];
 }> => {
  try {
@ -371,20 +375,18 @@ export const primeResources = async ({
    }

    /**
-     * Lazy provisioning: for deferred files that haven't been provisioned to the
-     * agent's enabled tool resources, provision them now (at chat-request start).
-     * This handles files uploaded via the unified upload flow (no tool_resource chosen at upload time).
+     * Lazy provisioning: instead of provisioning files now, compute which files
+     * need provisioning and return that state. Actual provisioning happens at
+     * tool invocation time via the ON_TOOL_EXECUTE handler.
     */
    const warnings: string[] = [];
+    let provisionState: ProvisionState | undefined;

    if (enabledToolResources && enabledToolResources.size > 0 && attachments.length > 0) {
-      const needsCodeEnv =
-        enabledToolResources.has(EToolResources.execute_code) && provisionToCodeEnv != null;
-      const needsVectorDB =
-        enabledToolResources.has(EToolResources.file_search) && provisionToVectorDB != null;
+      const needsCodeEnv = enabledToolResources.has(EToolResources.execute_code);
+      const needsVectorDB = enabledToolResources.has(EToolResources.file_search);

      if (needsCodeEnv || needsVectorDB) {
-        // Load CODE_API_KEY once for all code env operations
        let codeApiKey: string | undefined;
        if (needsCodeEnv && loadCodeApiKey && req.user?.id) {
          try {
@ -395,7 +397,7 @@ export const primeResources = async ({
          }
        }

-        // Batch staleness check: verify code env files are still alive
+        // Batch staleness check: identify which code env files are still alive
        let aliveFileIds: Set<string> = new Set();
        if (needsCodeEnv && codeApiKey && checkSessionsAlive) {
          const filesWithIdentifiers = attachments.filter(
@ -409,117 +411,60 @@ export const primeResources = async ({
          }
        }

-        // Collect deferred DB updates from provisioning
-        const pendingUpdates: TFileUpdate[] = [];
+        // Compute which files need provisioning (don't actually provision yet)
+        const codeEnvFiles: TFile[] = [];
+        const vectorDBFiles: TFile[] = [];

-        // Provision files in parallel
-        const provisionResults = await Promise.allSettled(
-          attachments.map(async (file) => {
-            if (!file?.file_id) {
-              return;
-            }
+        for (const file of attachments) {
+          if (!file?.file_id) {
+            continue;
+          }

-            const isImage = file.type?.startsWith('image') ?? false;
-            const typedReq = req as ServerRequest & { user?: IUser };
+          if (
+            needsCodeEnv &&
+            codeApiKey &&
+            !processedResourceFiles.has(`${EToolResources.execute_code}:${file.file_id}`)
+          ) {
+            const hasFileIdentifier = !!file.metadata?.fileIdentifier;
+            const isStale = hasFileIdentifier && !aliveFileIds.has(file.file_id);

-            // Code env provisioning (with staleness check)
-            if (
-              needsCodeEnv &&
-              codeApiKey &&
-              !processedResourceFiles.has(`${EToolResources.execute_code}:${file.file_id}`)
-            ) {
-              const hasFileIdentifier = !!file.metadata?.fileIdentifier;
-              const isStale = hasFileIdentifier && !aliveFileIds.has(file.file_id);
-              const needsProvision = !hasFileIdentifier || isStale;
-
-              if (needsProvision) {
-                if (isStale) {
-                  logger.info(
-                    `[primeResources] Code env file expired for "${file.filename}" (${file.file_id}), re-provisioning`,
-                  );
-                  file.metadata = { ...file.metadata, fileIdentifier: undefined };
-                }
-
-                try {
-                  const { fileIdentifier, fileUpdate } = await provisionToCodeEnv({
-                    req: typedReq,
-                    file,
-                    entity_id: agentId,
-                    apiKey: codeApiKey,
-                  });
-                  file.metadata = { ...file.metadata, fileIdentifier };
-                  pendingUpdates.push(fileUpdate);
-                  addFileToResource({
-                    file,
-                    resourceType: EToolResources.execute_code,
-                    tool_resources,
-                    processedResourceFiles,
-                  });
-                } catch (error) {
-                  const msg = `Failed to provision "${file.filename}" to code env`;
-                  logger.error(`[primeResources] ${msg}`, error);
-                  warnings.push(msg);
-                }
-              } else {
-                // File is alive, ensure it's categorized
-                addFileToResource({
-                  file,
-                  resourceType: EToolResources.execute_code,
-                  tool_resources,
-                  processedResourceFiles,
-                });
+            if (!hasFileIdentifier || isStale) {
+              if (isStale) {
+                logger.info(
+                  `[primeResources] Code env file expired for "${file.filename}" (${file.file_id}), will re-provision on tool use`,
+                );
+                file.metadata = { ...file.metadata, fileIdentifier: undefined };
              }
+              codeEnvFiles.push(file);
+            } else {
+              // File is alive, categorize it now
+              addFileToResource({
+                file,
+                resourceType: EToolResources.execute_code,
+                tool_resources,
+                processedResourceFiles,
+              });
            }
+          }

-            // Vector DB provisioning
-            if (
-              needsVectorDB &&
-              !isImage &&
-              file.embedded !== true &&
-              !processedResourceFiles.has(`${EToolResources.file_search}:${file.file_id}`)
-            ) {
-              try {
-                const result = await provisionToVectorDB({
-                  req: typedReq,
-                  file,
-                  entity_id: agentId,
-                });
-                if (result.embedded) {
-                  file.embedded = true;
-                  if (result.fileUpdate) {
-                    pendingUpdates.push(result.fileUpdate);
-                  }
-                  addFileToResource({
-                    file,
-                    resourceType: EToolResources.file_search,
-                    tool_resources,
-                    processedResourceFiles,
-                  });
-                }
-              } catch (error) {
-                const msg = `Failed to provision "${file.filename}" to vector DB`;
-                logger.error(`[primeResources] ${msg}`, error);
-                warnings.push(msg);
-              }
-            }
-          }),
-        );
-
-        // Log any unexpected rejections from Promise.allSettled
-        for (const result of provisionResults) {
-          if (result.status === 'rejected') {
-            logger.error('[primeResources] Unexpected provisioning rejection', result.reason);
+          const isImage = file.type?.startsWith('image') ?? false;
+          if (
+            needsVectorDB &&
+            !isImage &&
+            file.embedded !== true &&
+            !processedResourceFiles.has(`${EToolResources.file_search}:${file.file_id}`)
+          ) {
+            vectorDBFiles.push(file);
          }
        }

-        // Batch DB updates after all provisioning completes
-        if (pendingUpdates.length > 0 && updateFile) {
-          await Promise.allSettled(pendingUpdates.map((update) => updateFile(update)));
+        if (codeEnvFiles.length > 0 || vectorDBFiles.length > 0) {
+          provisionState = { codeEnvFiles, vectorDBFiles, codeApiKey, aliveFileIds };
        }
      }
    }

-    return { attachments, tool_resources, warnings };
+    return { attachments, tool_resources, provisionState, warnings };
  } catch (error) {
    logger.error('Error priming resources', error);

@ -539,6 +484,7 @@ export const primeResources = async ({
    return {
      attachments: safeAttachments,
      tool_resources: _tool_resources,
+      provisionState: undefined,
      warnings: [],
    };
  }