From f7761df52cf6890988bd24da89a22276b2eb2ee0 Mon Sep 17 00:00:00 2001
From: Danny Avila <messagedaniel@protonmail.com>
Date: Tue, 19 Mar 2024 20:54:30 -0400
Subject: [PATCH] =?UTF-8?q?=F0=9F=97=83=EF=B8=8F=20feat:=20General=20File?=
 =?UTF-8?q?=20Support=20for=20OpenAI,=20Azure,=20Custom,=20Anthropic=20and?=
 =?UTF-8?q?=20Google=20(RAG)=20(#2143)?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

* refactor: re-purpose `resendImages` as `resendFiles`

* refactor: re-purpose `resendImages` as `resendFiles`

* feat: upload general files

* feat: embed file during upload

* feat: delete file embeddings on file deletion

* chore(fileConfig): add epub+zip type

* feat(encodeAndFormat): handle non-image files

* feat(createContextHandlers): build context prompt from file attachments and successful RAG

* fix: prevent non-temp files as well as embedded files to be deleted on new conversation

* fix: remove temp_file_id on usage, prevent non-temp files as well as embedded files to be deleted on new conversation

* fix: prevent non-temp files as well as embedded files to be deleted on new conversation

* feat(OpenAI/Anthropic/Google): basic RAG support

* fix: delete `resendFiles` only when true (Default)

* refactor(RAG): update endpoints and pass JWT

* fix(resendFiles): default values

* fix(context/processFile): query unique ids only

* feat: rag-api.yaml

* feat: file upload improved ux for longer uploads

* chore: await embed call and catch embedding errors

* refactor: store augmentedPrompt in Client

* refactor(processFileUpload): throw error if not assistant file upload

* fix(useFileHandling): handle markdown empty mimetype issue

* chore: necessary compose file changes
---
 api/app/clients/AnthropicClient.js            |  97 ++++++--------
 api/app/clients/BaseClient.js                 |  53 +++++++-
 api/app/clients/GoogleClient.js               |  87 +++++++++----
 api/app/clients/OpenAIClient.js               | 113 +++++++----------
 .../clients/prompts/createContextHandlers.js  | 119 ++++++++++++++++++
 api/app/clients/prompts/index.js              |   2 +
 api/models/File.js                            |   2 +-
 api/models/schema/defaults.js                 |   6 +-
 api/models/schema/fileSchema.js               |   4 +
 .../Endpoints/anthropic/buildOptions.js       |   4 +-
 .../services/Endpoints/custom/buildOptions.js |   4 +-
 .../services/Endpoints/openAI/buildOptions.js |   4 +-
 api/server/services/Files/Firebase/crud.js    |  46 +++++++
 api/server/services/Files/Local/crud.js       |  58 ++++++++-
 api/server/services/Files/OpenAI/crud.js      |   9 +-
 api/server/services/Files/images/encode.js    |  33 +++--
 api/server/services/Files/process.js          |  41 +++++-
 api/server/services/Files/strategies.js       |   4 +
 client/src/common/types.ts                    |   1 +
 .../Chat/Input/Files/FilePreview.tsx          |   3 +-
 client/src/components/Chat/Presentation.tsx   |   3 +-
 .../Endpoints/Settings/Anthropic.tsx          |  24 ++--
 .../components/Endpoints/Settings/OpenAI.tsx  |  14 +--
 .../Endpoints/Settings/OptionHover.tsx        |   2 +-
 .../src/hooks/Files/useDelayedUploadToast.ts  |  34 +++++
 client/src/hooks/Files/useFileDeletion.ts     |   7 +-
 client/src/hooks/Files/useFileHandling.ts     |  29 ++++-
 client/src/hooks/Messages/useProgress.ts      |   7 +-
 client/src/hooks/useNewConvo.ts               |   3 +-
 client/src/localization/languages/Eng.tsx     |   5 +
 client/src/utils/convos.fakeData.ts           |  50 ++++----
 deploy-compose.yml                            |   2 +
 docker-compose.yml                            |   1 +
 packages/data-provider/src/file-config.ts     |   8 +-
 packages/data-provider/src/schemas.ts         |  28 +++--
 packages/data-provider/src/types.ts           |   2 +-
 packages/data-provider/src/types/files.ts     |   2 +
 rag.yml                                       |  33 +++++
 38 files changed, 683 insertions(+), 261 deletions(-)
 create mode 100644 api/app/clients/prompts/createContextHandlers.js
 create mode 100644 client/src/hooks/Files/useDelayedUploadToast.ts
 create mode 100644 rag.yml

diff --git a/api/app/clients/AnthropicClient.js b/api/app/clients/AnthropicClient.js
index 084c28eaa..93750eed0 100644
--- a/api/app/clients/AnthropicClient.js
+++ b/api/app/clients/AnthropicClient.js
@@ -6,10 +6,9 @@ const {
   validateVisionModel,
 } = require('librechat-data-provider');
 const { encodeAndFormat } = require('~/server/services/Files/images/encode');
+const { formatMessage, createContextHandlers } = require('./prompts');
 const spendTokens = require('~/models/spendTokens');
 const { getModelMaxTokens } = require('~/utils');
-const { formatMessage } = require('./prompts');
-const { getFiles } = require('~/models/File');
 const BaseClient = require('./BaseClient');
 const { logger } = require('~/config');
 
@@ -67,7 +66,7 @@ class AnthropicClient extends BaseClient {
     this.useMessages = this.isClaude3 || !!this.options.attachments;
 
     this.defaultVisionModel = this.options.visionModel ?? 'claude-3-sonnet-20240229';
-    this.checkVisionRequest(this.options.attachments);
+    this.options.attachments?.then((attachments) => this.checkVisionRequest(attachments));
 
     this.maxContextTokens =
       getModelMaxTokens(this.modelOptions.model, EModelEndpoint.anthropic) ?? 100000;
@@ -134,14 +133,19 @@ class AnthropicClient extends BaseClient {
    * - Sets `this.modelOptions.model` to `gpt-4-vision-preview` if the request is a vision request.
    * - Sets `this.isVisionModel` to `true` if vision request.
    * - Deletes `this.modelOptions.stop` if vision request.
-   * @param {Array<Promise<MongoFile[]> | MongoFile[]> | Record<string, MongoFile[]>} attachments
+   * @param {MongoFile[]} attachments
    */
   checkVisionRequest(attachments) {
     const availableModels = this.options.modelsConfig?.[EModelEndpoint.anthropic];
     this.isVisionModel = validateVisionModel({ model: this.modelOptions.model, availableModels });
 
     const visionModelAvailable = availableModels?.includes(this.defaultVisionModel);
-    if (attachments && visionModelAvailable && !this.isVisionModel) {
+    if (
+      attachments &&
+      attachments.some((file) => file?.type && file?.type?.includes('image')) &&
+      visionModelAvailable &&
+      !this.isVisionModel
+    ) {
       this.modelOptions.model = this.defaultVisionModel;
       this.isVisionModel = true;
     }
@@ -168,7 +172,7 @@ class AnthropicClient extends BaseClient {
       attachments,
       EModelEndpoint.anthropic,
     );
-    message.image_urls = image_urls;
+    message.image_urls = image_urls.length ? image_urls : undefined;
     return files;
   }
 
@@ -186,54 +190,6 @@ class AnthropicClient extends BaseClient {
     );
   }
 
-  /**
-   *
-   * @param {TMessage[]} _messages
-   * @returns {TMessage[]}
-   */
-  async addPreviousAttachments(_messages) {
-    if (!this.options.resendImages) {
-      return _messages;
-    }
-
-    /**
-     *
-     * @param {TMessage} message
-     */
-    const processMessage = async (message) => {
-      if (!this.message_file_map) {
-        /** @type {Record<string, MongoFile[]> */
-        this.message_file_map = {};
-      }
-
-      const fileIds = message.files.map((file) => file.file_id);
-      const files = await getFiles({
-        file_id: { $in: fileIds },
-      });
-
-      await this.addImageURLs(message, files);
-
-      this.message_file_map[message.messageId] = files;
-      return message;
-    };
-
-    const promises = [];
-
-    for (const message of _messages) {
-      if (!message.files) {
-        promises.push(message);
-        continue;
-      }
-
-      promises.push(processMessage(message));
-    }
-
-    const messages = await Promise.all(promises);
-
-    this.checkVisionRequest(this.message_file_map);
-    return messages;
-  }
-
   async buildMessages(messages, parentMessageId) {
     const orderedMessages = this.constructor.getMessagesForConversation({
       messages,
@@ -242,12 +198,13 @@ class AnthropicClient extends BaseClient {
 
     logger.debug('[AnthropicClient] orderedMessages', { orderedMessages, parentMessageId });
 
-    if (!this.isVisionModel && this.options.attachments) {
-      throw new Error('Attachments are only supported with the Claude 3 family of models');
-    } else if (this.options.attachments) {
-      const attachments = (await this.options.attachments).filter((file) =>
-        file.type.includes('image'),
-      );
+    if (this.options.attachments) {
+      const attachments = await this.options.attachments;
+      const images = attachments.filter((file) => file.type.includes('image'));
+
+      if (images.length && !this.isVisionModel) {
+        throw new Error('Images are only supported with the Claude 3 family of models');
+      }
 
       const latestMessage = orderedMessages[orderedMessages.length - 1];
 
@@ -264,6 +221,13 @@ class AnthropicClient extends BaseClient {
       this.options.attachments = files;
     }
 
+    if (this.message_file_map) {
+      this.contextHandlers = createContextHandlers(
+        this.options.req,
+        orderedMessages[orderedMessages.length - 1].text,
+      );
+    }
+
     const formattedMessages = orderedMessages.map((message, i) => {
       const formattedMessage = this.useMessages
         ? formatMessage({
@@ -285,6 +249,11 @@ class AnthropicClient extends BaseClient {
       if (this.message_file_map && this.message_file_map[message.messageId]) {
         const attachments = this.message_file_map[message.messageId];
         for (const file of attachments) {
+          if (file.embedded) {
+            this.contextHandlers?.processFile(file);
+            continue;
+          }
+
           orderedMessages[i].tokenCount += this.calculateImageTokenCost({
             width: file.width,
             height: file.height,
@@ -296,6 +265,11 @@ class AnthropicClient extends BaseClient {
       return formattedMessage;
     });
 
+    if (this.contextHandlers) {
+      this.augmentedPrompt = await this.contextHandlers.createContext();
+      this.options.promptPrefix = this.augmentedPrompt + (this.options.promptPrefix ?? '');
+    }
+
     let { context: messagesInWindow, remainingContextTokens } =
       await this.getMessagesWithinTokenLimit(formattedMessages);
 
@@ -389,7 +363,7 @@ class AnthropicClient extends BaseClient {
     let isEdited = lastAuthor === this.assistantLabel;
     const promptSuffix = isEdited ? '' : `${promptPrefix}${this.assistantLabel}\n`;
     let currentTokenCount =
-      isEdited || this.useMEssages
+      isEdited || this.useMessages
         ? this.getTokenCount(promptPrefix)
         : this.getTokenCount(promptSuffix);
 
@@ -663,6 +637,7 @@ class AnthropicClient extends BaseClient {
     return {
       promptPrefix: this.options.promptPrefix,
       modelLabel: this.options.modelLabel,
+      resendFiles: this.options.resendFiles,
       ...this.modelOptions,
     };
   }
diff --git a/api/app/clients/BaseClient.js b/api/app/clients/BaseClient.js
index a359ed719..d102617a7 100644
--- a/api/app/clients/BaseClient.js
+++ b/api/app/clients/BaseClient.js
@@ -3,6 +3,7 @@ const { supportsBalanceCheck, Constants } = require('librechat-data-provider');
 const { getConvo, getMessages, saveMessage, updateMessage, saveConvo } = require('~/models');
 const { addSpaceIfNeeded, isEnabled } = require('~/server/utils');
 const checkBalance = require('~/models/checkBalance');
+const { getFiles } = require('~/models/File');
 const TextStream = require('./TextStream');
 const { logger } = require('~/config');
 
@@ -46,10 +47,6 @@ class BaseClient {
     logger.debug('`[BaseClient] recordTokenUsage` not implemented.', response);
   }
 
-  async addPreviousAttachments(messages) {
-    return messages;
-  }
-
   async recordTokenUsage({ promptTokens, completionTokens }) {
     logger.debug('`[BaseClient] recordTokenUsage` not implemented.', {
       promptTokens,
@@ -683,6 +680,54 @@ class BaseClient {
 
     return await this.sendCompletion(payload, opts);
   }
+
+  /**
+   *
+   * @param {TMessage[]} _messages
+   * @returns {Promise<TMessage[]>}
+   */
+  async addPreviousAttachments(_messages) {
+    if (!this.options.resendFiles) {
+      return _messages;
+    }
+
+    /**
+     *
+     * @param {TMessage} message
+     */
+    const processMessage = async (message) => {
+      if (!this.message_file_map) {
+        /** @type {Record<string, MongoFile[]> */
+        this.message_file_map = {};
+      }
+
+      const fileIds = message.files.map((file) => file.file_id);
+      const files = await getFiles({
+        file_id: { $in: fileIds },
+      });
+
+      await this.addImageURLs(message, files);
+
+      this.message_file_map[message.messageId] = files;
+      return message;
+    };
+
+    const promises = [];
+
+    for (const message of _messages) {
+      if (!message.files) {
+        promises.push(message);
+        continue;
+      }
+
+      promises.push(processMessage(message));
+    }
+
+    const messages = await Promise.all(promises);
+
+    this.checkVisionRequest(Object.values(this.message_file_map ?? {}).flat());
+    return messages;
+  }
 }
 
 module.exports = BaseClient;
diff --git a/api/app/clients/GoogleClient.js b/api/app/clients/GoogleClient.js
index 22e80159c..c5edcb275 100644
--- a/api/app/clients/GoogleClient.js
+++ b/api/app/clients/GoogleClient.js
@@ -13,8 +13,8 @@ const {
   AuthKeys,
 } = require('librechat-data-provider');
 const { encodeAndFormat } = require('~/server/services/Files/images');
+const { formatMessage, createContextHandlers } = require('./prompts');
 const { getModelMaxTokens } = require('~/utils');
-const { formatMessage } = require('./prompts');
 const BaseClient = require('./BaseClient');
 const { logger } = require('~/config');
 
@@ -124,24 +124,7 @@ class GoogleClient extends BaseClient {
       // stop: modelOptions.stop // no stop method for now
     };
 
-    /* Validation vision request */
-    this.defaultVisionModel = this.options.visionModel ?? 'gemini-pro-vision';
-    const availableModels = this.options.modelsConfig?.[EModelEndpoint.google];
-    this.isVisionModel = validateVisionModel({ model: this.modelOptions.model, availableModels });
-
-    if (
-      this.options.attachments &&
-      availableModels?.includes(this.defaultVisionModel) &&
-      !this.isVisionModel
-    ) {
-      this.modelOptions.model = this.defaultVisionModel;
-      this.isVisionModel = true;
-    }
-
-    if (this.isVisionModel && !this.options.attachments) {
-      this.modelOptions.model = 'gemini-pro';
-      this.isVisionModel = false;
-    }
+    this.options.attachments?.then((attachments) => this.checkVisionRequest(attachments));
 
     // TODO: as of 12/14/23, only gemini models are "Generative AI" models provided by Google
     this.isGenerativeModel = this.modelOptions.model.includes('gemini');
@@ -230,6 +213,33 @@ class GoogleClient extends BaseClient {
     return this;
   }
 
+  /**
+   *
+   * Checks if the model is a vision model based on request attachments and sets the appropriate options:
+   * @param {MongoFile[]} attachments
+   */
+  checkVisionRequest(attachments) {
+    /* Validation vision request */
+    this.defaultVisionModel = this.options.visionModel ?? 'gemini-pro-vision';
+    const availableModels = this.options.modelsConfig?.[EModelEndpoint.google];
+    this.isVisionModel = validateVisionModel({ model: this.modelOptions.model, availableModels });
+
+    if (
+      attachments &&
+      attachments.some((file) => file?.type && file?.type?.includes('image')) &&
+      availableModels?.includes(this.defaultVisionModel) &&
+      !this.isVisionModel
+    ) {
+      this.modelOptions.model = this.defaultVisionModel;
+      this.isVisionModel = true;
+    }
+
+    if (this.isVisionModel && !attachments) {
+      this.modelOptions.model = 'gemini-pro';
+      this.isVisionModel = false;
+    }
+  }
+
   formatMessages() {
     return ((message) => ({
       author: message?.author ?? (message.isCreatedByUser ? this.userLabel : this.modelLabel),
@@ -237,18 +247,45 @@ class GoogleClient extends BaseClient {
     })).bind(this);
   }
 
-  async buildVisionMessages(messages = [], parentMessageId) {
-    const { prompt } = await this.buildMessagesPrompt(messages, parentMessageId);
-    const attachments = await this.options.attachments;
+  /**
+   *
+   * Adds image URLs to the message object and returns the files
+   *
+   * @param {TMessage[]} messages
+   * @param {MongoFile[]} files
+   * @returns {Promise<MongoFile[]>}
+   */
+  async addImageURLs(message, attachments) {
     const { files, image_urls } = await encodeAndFormat(
       this.options.req,
-      attachments.filter((file) => file.type.includes('image')),
+      attachments,
       EModelEndpoint.google,
     );
+    message.image_urls = image_urls.length ? image_urls : undefined;
+    return files;
+  }
 
+  async buildVisionMessages(messages = [], parentMessageId) {
+    const attachments = await this.options.attachments;
     const latestMessage = { ...messages[messages.length - 1] };
+    this.contextHandlers = createContextHandlers(this.options.req, latestMessage.text);
+
+    if (this.contextHandlers) {
+      for (const file of attachments) {
+        if (file.embedded) {
+          this.contextHandlers?.processFile(file);
+          continue;
+        }
+      }
+
+      this.augmentedPrompt = await this.contextHandlers.createContext();
+      this.options.promptPrefix = this.augmentedPrompt + this.options.promptPrefix;
+    }
+
+    const { prompt } = await this.buildMessagesPrompt(messages, parentMessageId);
+
+    const files = await this.addImageURLs(latestMessage, attachments);
 
-    latestMessage.image_urls = image_urls;
     this.options.attachments = files;
 
     latestMessage.text = prompt;
@@ -275,7 +312,7 @@ class GoogleClient extends BaseClient {
       );
     }
 
-    if (this.options.attachments) {
+    if (this.options.attachments && this.isGenerativeModel) {
       return this.buildVisionMessages(messages, parentMessageId);
     }
 
diff --git a/api/app/clients/OpenAIClient.js b/api/app/clients/OpenAIClient.js
index bb4b5c6bb..9d87d8885 100644
--- a/api/app/clients/OpenAIClient.js
+++ b/api/app/clients/OpenAIClient.js
@@ -16,14 +16,13 @@ const {
   getModelMaxTokens,
   genAzureChatCompletion,
 } = require('~/utils');
+const { truncateText, formatMessage, createContextHandlers, CUT_OFF_PROMPT } = require('./prompts');
 const { encodeAndFormat } = require('~/server/services/Files/images/encode');
-const { truncateText, formatMessage, CUT_OFF_PROMPT } = require('./prompts');
 const { handleOpenAIErrors } = require('./tools/util');
 const spendTokens = require('~/models/spendTokens');
 const { createLLM, RunManager } = require('./llm');
 const ChatGPTClient = require('./ChatGPTClient');
 const { isEnabled } = require('~/server/utils');
-const { getFiles } = require('~/models/File');
 const { summaryBuffer } = require('./memory');
 const { runTitleChain } = require('./chains');
 const { tokenSplit } = require('./document');
@@ -92,7 +91,7 @@ class OpenAIClient extends BaseClient {
     }
 
     this.defaultVisionModel = this.options.visionModel ?? 'gpt-4-vision-preview';
-    this.checkVisionRequest(this.options.attachments);
+    this.options.attachments?.then((attachments) => this.checkVisionRequest(attachments));
 
     const { OPENROUTER_API_KEY, OPENAI_FORCE_PROMPT } = process.env ?? {};
     if (OPENROUTER_API_KEY && !this.azure) {
@@ -223,14 +222,19 @@ class OpenAIClient extends BaseClient {
    * - Sets `this.modelOptions.model` to `gpt-4-vision-preview` if the request is a vision request.
    * - Sets `this.isVisionModel` to `true` if vision request.
    * - Deletes `this.modelOptions.stop` if vision request.
-   * @param {Array<Promise<MongoFile[]> | MongoFile[]> | Record<string, MongoFile[]>} attachments
+   * @param {MongoFile[]} attachments
    */
   checkVisionRequest(attachments) {
     const availableModels = this.options.modelsConfig?.[this.options.endpoint];
     this.isVisionModel = validateVisionModel({ model: this.modelOptions.model, availableModels });
 
     const visionModelAvailable = availableModels?.includes(this.defaultVisionModel);
-    if (attachments && visionModelAvailable && !this.isVisionModel) {
+    if (
+      attachments &&
+      attachments.some((file) => file?.type && file?.type?.includes('image')) &&
+      visionModelAvailable &&
+      !this.isVisionModel
+    ) {
       this.modelOptions.model = this.defaultVisionModel;
       this.isVisionModel = true;
     }
@@ -366,7 +370,7 @@ class OpenAIClient extends BaseClient {
     return {
       chatGptLabel: this.options.chatGptLabel,
       promptPrefix: this.options.promptPrefix,
-      resendImages: this.options.resendImages,
+      resendFiles: this.options.resendFiles,
       imageDetail: this.options.imageDetail,
       ...this.modelOptions,
     };
@@ -380,54 +384,6 @@ class OpenAIClient extends BaseClient {
     };
   }
 
-  /**
-   *
-   * @param {TMessage[]} _messages
-   * @returns {TMessage[]}
-   */
-  async addPreviousAttachments(_messages) {
-    if (!this.options.resendImages) {
-      return _messages;
-    }
-
-    /**
-     *
-     * @param {TMessage} message
-     */
-    const processMessage = async (message) => {
-      if (!this.message_file_map) {
-        /** @type {Record<string, MongoFile[]> */
-        this.message_file_map = {};
-      }
-
-      const fileIds = message.files.map((file) => file.file_id);
-      const files = await getFiles({
-        file_id: { $in: fileIds },
-      });
-
-      await this.addImageURLs(message, files);
-
-      this.message_file_map[message.messageId] = files;
-      return message;
-    };
-
-    const promises = [];
-
-    for (const message of _messages) {
-      if (!message.files) {
-        promises.push(message);
-        continue;
-      }
-
-      promises.push(processMessage(message));
-    }
-
-    const messages = await Promise.all(promises);
-
-    this.checkVisionRequest(this.message_file_map);
-    return messages;
-  }
-
   /**
    *
    * Adds image URLs to the message object and returns the files
@@ -438,8 +394,7 @@ class OpenAIClient extends BaseClient {
    */
   async addImageURLs(message, attachments) {
     const { files, image_urls } = await encodeAndFormat(this.options.req, attachments);
-
-    message.image_urls = image_urls;
+    message.image_urls = image_urls.length ? image_urls : undefined;
     return files;
   }
 
@@ -467,23 +422,9 @@ class OpenAIClient extends BaseClient {
     let promptTokens;
 
     promptPrefix = (promptPrefix || this.options.promptPrefix || '').trim();
-    if (promptPrefix) {
-      promptPrefix = `Instructions:\n${promptPrefix}`;
-      instructions = {
-        role: 'system',
-        name: 'instructions',
-        content: promptPrefix,
-      };
-
-      if (this.contextStrategy) {
-        instructions.tokenCount = this.getTokenCountForMessage(instructions);
-      }
-    }
 
     if (this.options.attachments) {
-      const attachments = (await this.options.attachments).filter((file) =>
-        file.type.includes('image'),
-      );
+      const attachments = await this.options.attachments;
 
       if (this.message_file_map) {
         this.message_file_map[orderedMessages[orderedMessages.length - 1].messageId] = attachments;
@@ -501,6 +442,13 @@ class OpenAIClient extends BaseClient {
       this.options.attachments = files;
     }
 
+    if (this.message_file_map) {
+      this.contextHandlers = createContextHandlers(
+        this.options.req,
+        orderedMessages[orderedMessages.length - 1].text,
+      );
+    }
+
     const formattedMessages = orderedMessages.map((message, i) => {
       const formattedMessage = formatMessage({
         message,
@@ -519,6 +467,11 @@ class OpenAIClient extends BaseClient {
       if (this.message_file_map && this.message_file_map[message.messageId]) {
         const attachments = this.message_file_map[message.messageId];
         for (const file of attachments) {
+          if (file.embedded) {
+            this.contextHandlers?.processFile(file);
+            continue;
+          }
+
           orderedMessages[i].tokenCount += this.calculateImageTokenCost({
             width: file.width,
             height: file.height,
@@ -530,6 +483,24 @@ class OpenAIClient extends BaseClient {
       return formattedMessage;
     });
 
+    if (this.contextHandlers) {
+      this.augmentedPrompt = await this.contextHandlers.createContext();
+      promptPrefix = this.augmentedPrompt + promptPrefix;
+    }
+
+    if (promptPrefix) {
+      promptPrefix = `Instructions:\n${promptPrefix.trim()}`;
+      instructions = {
+        role: 'system',
+        name: 'instructions',
+        content: promptPrefix,
+      };
+
+      if (this.contextStrategy) {
+        instructions.tokenCount = this.getTokenCountForMessage(instructions);
+      }
+    }
+
     // TODO: need to handle interleaving instructions better
     if (this.contextStrategy) {
       ({ payload, tokenCountMap, promptTokens, messages } = await this.handleContextStrategy({
diff --git a/api/app/clients/prompts/createContextHandlers.js b/api/app/clients/prompts/createContextHandlers.js
new file mode 100644
index 000000000..22eefb012
--- /dev/null
+++ b/api/app/clients/prompts/createContextHandlers.js
@@ -0,0 +1,119 @@
+const axios = require('axios');
+
+function createContextHandlers(req, userMessageContent) {
+  if (!process.env.RAG_API_URL) {
+    return;
+  }
+
+  const queryPromises = [];
+  const processedFiles = [];
+  const processedIds = new Set();
+  const jwtToken = req.headers.authorization.split(' ')[1];
+
+  const processFile = async (file) => {
+    if (file.embedded && !processedIds.has(file.file_id)) {
+      try {
+        const promise = axios.post(
+          `${process.env.RAG_API_URL}/query`,
+          {
+            file_id: file.file_id,
+            query: userMessageContent,
+            k: 4,
+          },
+          {
+            headers: {
+              Authorization: `Bearer ${jwtToken}`,
+              'Content-Type': 'application/json',
+            },
+          },
+        );
+
+        queryPromises.push(promise);
+        processedFiles.push(file);
+        processedIds.add(file.file_id);
+      } catch (error) {
+        console.error(`Error processing file ${file.filename}:`, error);
+      }
+    }
+  };
+
+  const createContext = async () => {
+    try {
+      if (!queryPromises.length || !processedFiles.length) {
+        return '';
+      }
+
+      const resolvedQueries = await Promise.all(queryPromises);
+
+      const context = resolvedQueries
+        .map((queryResult, index) => {
+          const file = processedFiles[index];
+          const contextItems = queryResult.data
+            .map((item) => {
+              const pageContent = item[0].page_content;
+              return `
+            <contextItem>
+              <![CDATA[${pageContent}]]>
+            </contextItem>
+          `;
+            })
+            .join('');
+
+          return `
+          <file>
+            <filename>${file.filename}</filename>
+            <context>
+              ${contextItems}
+            </context>
+          </file>
+        `;
+        })
+        .join('');
+
+      const template = `The user has attached ${
+        processedFiles.length === 1 ? 'a' : processedFiles.length
+      } file${processedFiles.length !== 1 ? 's' : ''} to the conversation:
+
+        <files>
+          ${processedFiles
+    .map(
+      (file) => `
+            <file>
+              <filename>${file.filename}</filename>
+              <type>${file.type}</type>
+            </file>
+          `,
+    )
+    .join('')}
+        </files>
+
+        A semantic search was executed with the user's message as the query, retrieving the following context inside <context></context> XML tags.
+
+        <context>
+          ${context}
+        </context>
+
+        Use the context as your learned knowledge to better answer the user.
+
+        In your response, remember to follow these guidelines:
+        - If you don't know the answer, simply say that you don't know.
+        - If you are unsure how to answer, ask for clarification.
+        - Avoid mentioning that you obtained the information from the context.
+
+        Answer appropriately in the user's language.
+      `;
+
+      return template;
+    } catch (error) {
+      console.error('Error creating context:', error);
+      throw error; // Re-throw the error to propagate it to the caller
+    }
+  };
+
+  return {
+    processFile,
+    createContext,
+  };
+}
+
+module.exports = createContextHandlers;
diff --git a/api/app/clients/prompts/index.js b/api/app/clients/prompts/index.js
index 40db3d904..9edb9954f 100644
--- a/api/app/clients/prompts/index.js
+++ b/api/app/clients/prompts/index.js
@@ -4,6 +4,7 @@ const handleInputs = require('./handleInputs');
 const instructions = require('./instructions');
 const titlePrompts = require('./titlePrompts');
 const truncateText = require('./truncateText');
+const createContextHandlers = require('./createContextHandlers');
 
 module.exports = {
   ...formatMessages,
@@ -12,4 +13,5 @@ module.exports = {
   ...instructions,
   ...titlePrompts,
   truncateText,
+  createContextHandlers,
 };
diff --git a/api/models/File.js b/api/models/File.js
index fa14af3b2..16e9ab6a0 100644
--- a/api/models/File.js
+++ b/api/models/File.js
@@ -69,7 +69,7 @@ const updateFileUsage = async (data) => {
   const { file_id, inc = 1 } = data;
   const updateOperation = {
     $inc: { usage: inc },
-    $unset: { expiresAt: '' },
+    $unset: { expiresAt: '', temp_file_id: '' },
   };
   return await File.findOneAndUpdate({ file_id }, updateOperation, { new: true }).lean();
 };
diff --git a/api/models/schema/defaults.js b/api/models/schema/defaults.js
index fc0add4e0..b2ea3a12c 100644
--- a/api/models/schema/defaults.js
+++ b/api/models/schema/defaults.js
@@ -70,10 +70,14 @@ const conversationPreset = {
     type: String,
   },
   file_ids: { type: [{ type: String }], default: undefined },
-  // vision
+  // deprecated
   resendImages: {
     type: Boolean,
   },
+  // files
+  resendFiles: {
+    type: Boolean,
+  },
   imageDetail: {
     type: String,
   },
diff --git a/api/models/schema/fileSchema.js b/api/models/schema/fileSchema.js
index e470a8d7e..8025c3fee 100644
--- a/api/models/schema/fileSchema.js
+++ b/api/models/schema/fileSchema.js
@@ -15,6 +15,7 @@ const mongoose = require('mongoose');
  * @property {'file'} object - Type of object, always 'file'
  * @property {string} type - Type of file
  * @property {number} usage - Number of uses of the file
+ * @property {boolean} [embedded] - Whether or not the file is embedded in vector db
  * @property {string} [source] - The source of the file
  * @property {number} [width] - Optional width of the file
  * @property {number} [height] - Optional height of the file
@@ -61,6 +62,9 @@ const fileSchema = mongoose.Schema(
       required: true,
       default: 'file',
     },
+    embedded: {
+      type: Boolean,
+    },
     type: {
       type: String,
       required: true,
diff --git a/api/server/services/Endpoints/anthropic/buildOptions.js b/api/server/services/Endpoints/anthropic/buildOptions.js
index 966906209..4cd9ba8b9 100644
--- a/api/server/services/Endpoints/anthropic/buildOptions.js
+++ b/api/server/services/Endpoints/anthropic/buildOptions.js
@@ -1,10 +1,10 @@
 const buildOptions = (endpoint, parsedBody) => {
-  const { modelLabel, promptPrefix, resendImages, ...rest } = parsedBody;
+  const { modelLabel, promptPrefix, resendFiles, ...rest } = parsedBody;
   const endpointOption = {
     endpoint,
     modelLabel,
     promptPrefix,
-    resendImages,
+    resendFiles,
     modelOptions: {
       ...rest,
     },
diff --git a/api/server/services/Endpoints/custom/buildOptions.js b/api/server/services/Endpoints/custom/buildOptions.js
index 0bba48e2b..3d9379573 100644
--- a/api/server/services/Endpoints/custom/buildOptions.js
+++ b/api/server/services/Endpoints/custom/buildOptions.js
@@ -1,11 +1,11 @@
 const buildOptions = (endpoint, parsedBody, endpointType) => {
-  const { chatGptLabel, promptPrefix, resendImages, imageDetail, ...rest } = parsedBody;
+  const { chatGptLabel, promptPrefix, resendFiles, imageDetail, ...rest } = parsedBody;
   const endpointOption = {
     endpoint,
     endpointType,
     chatGptLabel,
     promptPrefix,
-    resendImages,
+    resendFiles,
     imageDetail,
     modelOptions: {
       ...rest,
diff --git a/api/server/services/Endpoints/openAI/buildOptions.js b/api/server/services/Endpoints/openAI/buildOptions.js
index 80037fb4b..0b1fb3eab 100644
--- a/api/server/services/Endpoints/openAI/buildOptions.js
+++ b/api/server/services/Endpoints/openAI/buildOptions.js
@@ -1,10 +1,10 @@
 const buildOptions = (endpoint, parsedBody) => {
-  const { chatGptLabel, promptPrefix, resendImages, imageDetail, ...rest } = parsedBody;
+  const { chatGptLabel, promptPrefix, resendFiles, imageDetail, ...rest } = parsedBody;
   const endpointOption = {
     endpoint,
     chatGptLabel,
     promptPrefix,
-    resendImages,
+    resendFiles,
     imageDetail,
     modelOptions: {
       ...rest,
diff --git a/api/server/services/Files/Firebase/crud.js b/api/server/services/Files/Firebase/crud.js
index 0567d2afa..40337ad44 100644
--- a/api/server/services/Files/Firebase/crud.js
+++ b/api/server/services/Files/Firebase/crud.js
@@ -1,3 +1,6 @@
+const fs = require('fs');
+const path = require('path');
+const axios = require('axios');
 const fetch = require('node-fetch');
 const { ref, uploadBytes, getDownloadURL, deleteObject } = require('firebase/storage');
 const { getBufferMetadata } = require('~/server/utils');
@@ -160,6 +163,18 @@ function extractFirebaseFilePath(urlString) {
  *          Throws an error if there is an issue with deletion.
  */
 const deleteFirebaseFile = async (req, file) => {
+  if (file.embedded && process.env.RAG_API_URL) {
+    const jwtToken = req.headers.authorization.split(' ')[1];
+    axios.delete(`${process.env.RAG_API_URL}/documents`, {
+      headers: {
+        Authorization: `Bearer ${jwtToken}`,
+        'Content-Type': 'application/json',
+        accept: 'application/json',
+      },
+      data: [file.file_id],
+    });
+  }
+
   const fileName = extractFirebaseFilePath(file.filepath);
   if (!fileName.includes(req.user.id)) {
     throw new Error('Invalid file path');
@@ -167,10 +182,41 @@ const deleteFirebaseFile = async (req, file) => {
   await deleteFile('', fileName);
 };
 
+/**
+ * Uploads a file to Firebase Storage.
+ *
+ * @param {Object} params - The params object.
+ * @param {Express.Request} params.req - The request object from Express. It should have a `user` property with an `id`
+ *                       representing the user.
+ * @param {Express.Multer.File} params.file - The file object, which is part of the request. The file object should
+ *                                     have a `path` property that points to the location of the uploaded file.
+ * @param {string} params.file_id - The file ID.
+ *
+ * @returns {Promise<{ filepath: string, bytes: number }>}
+ *          A promise that resolves to an object containing:
+ *            - filepath: The download URL of the uploaded file.
+ *            - bytes: The size of the uploaded file in bytes.
+ */
+async function uploadFileToFirebase({ req, file, file_id }) {
+  const inputFilePath = file.path;
+  const inputBuffer = await fs.promises.readFile(inputFilePath);
+  const bytes = Buffer.byteLength(inputBuffer);
+  const userId = req.user.id;
+
+  const fileName = `${file_id}__${path.basename(inputFilePath)}`;
+
+  const downloadURL = await saveBufferToFirebase({ userId, buffer: inputBuffer, fileName });
+
+  await fs.promises.unlink(inputFilePath);
+
+  return { filepath: downloadURL, bytes };
+}
+
 module.exports = {
   deleteFile,
   getFirebaseURL,
   saveURLToFirebase,
   deleteFirebaseFile,
+  uploadFileToFirebase,
   saveBufferToFirebase,
 };
diff --git a/api/server/services/Files/Local/crud.js b/api/server/services/Files/Local/crud.js
index a60038e8e..859556635 100644
--- a/api/server/services/Files/Local/crud.js
+++ b/api/server/services/Files/Local/crud.js
@@ -188,7 +188,26 @@ const isValidPath = (req, base, subfolder, filepath) => {
  *          file path is invalid or if there is an error in deletion.
  */
 const deleteLocalFile = async (req, file) => {
-  const { publicPath } = req.app.locals.paths;
+  const { publicPath, uploads } = req.app.locals.paths;
+  if (file.embedded && process.env.RAG_API_URL) {
+    const jwtToken = req.headers.authorization.split(' ')[1];
+    axios.delete(`${process.env.RAG_API_URL}/documents`, {
+      headers: {
+        Authorization: `Bearer ${jwtToken}`,
+        'Content-Type': 'application/json',
+        accept: 'application/json',
+      },
+      data: [file.file_id],
+    });
+  }
+
+  if (file.filepath.startsWith(`/uploads/${req.user.id}`)) {
+    const basePath = file.filepath.split('/uploads/')[1];
+    const filepath = path.join(uploads, basePath);
+    await fs.promises.unlink(filepath);
+    return;
+  }
+
   const parts = file.filepath.split(path.sep);
   const subfolder = parts[1];
   const filepath = path.join(publicPath, file.filepath);
@@ -200,6 +219,42 @@ const deleteLocalFile = async (req, file) => {
   await fs.promises.unlink(filepath);
 };
 
+/**
+ * Uploads a file to the specified upload directory.
+ *
+ * @param {Object} params - The params object.
+ * @param {Object} params.req - The request object from Express. It should have a `user` property with an `id`
+ *                       representing the user, and an `app.locals.paths` object with an `uploads` path.
+ * @param {Express.Multer.File} params.file - The file object, which is part of the request. The file object should
+ *                                     have a `path` property that points to the location of the uploaded file.
+ * @param {string} params.file_id - The file ID.
+ *
+ * @returns {Promise<{ filepath: string, bytes: number }>}
+ *          A promise that resolves to an object containing:
+ *            - filepath: The path where the file is saved.
+ *            - bytes: The size of the file in bytes.
+ */
+async function uploadLocalFile({ req, file, file_id }) {
+  const inputFilePath = file.path;
+  const inputBuffer = await fs.promises.readFile(inputFilePath);
+  const bytes = Buffer.byteLength(inputBuffer);
+
+  const { uploads } = req.app.locals.paths;
+  const userPath = path.join(uploads, req.user.id);
+
+  if (!fs.existsSync(userPath)) {
+    fs.mkdirSync(userPath, { recursive: true });
+  }
+
+  const fileName = `${file_id}__${path.basename(inputFilePath)}`;
+  const newPath = path.join(userPath, fileName);
+
+  await fs.promises.writeFile(newPath, inputBuffer);
+  const filepath = path.posix.join('/', 'uploads', req.user.id, path.basename(newPath));
+
+  return { filepath, bytes };
+}
+
 module.exports = {
   saveLocalFile,
   saveLocalImage,
@@ -207,4 +262,5 @@ module.exports = {
   saveFileFromURL,
   getLocalFileURL,
   deleteLocalFile,
+  uploadLocalFile,
 };
diff --git a/api/server/services/Files/OpenAI/crud.js b/api/server/services/Files/OpenAI/crud.js
index 7ee8eb9e9..6740c4f64 100644
--- a/api/server/services/Files/OpenAI/crud.js
+++ b/api/server/services/Files/OpenAI/crud.js
@@ -6,13 +6,14 @@ const { logger } = require('~/config');
 /**
  * Uploads a file that can be used across various OpenAI services.
  *
- * @param {Express.Request} req - The request object from Express. It should have a `user` property with an `id`
+ * @param {Object} params - The params object.
+ * @param {Express.Request} params.req - The request object from Express. It should have a `user` property with an `id`
  *                       representing the user, and an `app.locals.paths` object with an `imageOutput` path.
- * @param {Express.Multer.File} file - The file uploaded to the server via multer.
- * @param {OpenAIClient} openai - The initialized OpenAI client.
+ * @param {Express.Multer.File} params.file - The file uploaded to the server via multer.
+ * @param {OpenAIClient} params.openai - The initialized OpenAI client.
  * @returns {Promise<OpenAIFile>}
  */
-async function uploadOpenAIFile(req, file, openai) {
+async function uploadOpenAIFile({ req, file, openai }) {
   const uploadedFile = await openai.files.create({
     file: fs.createReadStream(file.path),
     purpose: FilePurpose.Assistants,
diff --git a/api/server/services/Files/images/encode.js b/api/server/services/Files/images/encode.js
index aa152cf75..ade39ac2e 100644
--- a/api/server/services/Files/images/encode.js
+++ b/api/server/services/Files/images/encode.js
@@ -39,6 +39,11 @@ async function encodeAndFormat(req, files, endpoint) {
   for (let file of files) {
     const source = file.source ?? FileSources.local;
 
+    if (!file.height) {
+      promises.push([file, null]);
+      continue;
+    }
+
     if (!encodingMethods[source]) {
       const { prepareImagePayload } = getStrategyFunctions(source);
       if (!prepareImagePayload) {
@@ -70,6 +75,24 @@ async function encodeAndFormat(req, files, endpoint) {
   };
 
   for (const [file, imageContent] of formattedImages) {
+    const fileMetadata = {
+      type: file.type,
+      file_id: file.file_id,
+      filepath: file.filepath,
+      filename: file.filename,
+      embedded: !!file.embedded,
+    };
+
+    if (file.height && file.width) {
+      fileMetadata.height = file.height;
+      fileMetadata.width = file.width;
+    }
+
+    if (!imageContent) {
+      result.files.push(fileMetadata);
+      continue;
+    }
+
     const imagePart = {
       type: 'image_url',
       image_url: {
@@ -93,15 +116,7 @@ async function encodeAndFormat(req, files, endpoint) {
     }
 
     result.image_urls.push(imagePart);
-
-    result.files.push({
-      file_id: file.file_id,
-      // filepath: file.filepath,
-      // filename: file.filename,
-      // type: file.type,
-      // height: file.height,
-      // width: file.width,
-    });
+    result.files.push(fileMetadata);
   }
   return result;
 }
diff --git a/api/server/services/Files/process.js b/api/server/services/Files/process.js
index 4a7d1c6e2..8b6cfb7a7 100644
--- a/api/server/services/Files/process.js
+++ b/api/server/services/Files/process.js
@@ -1,5 +1,6 @@
 const path = require('path');
 const { v4 } = require('uuid');
+const axios = require('axios');
 const mime = require('mime/lite');
 const {
   isUUID,
@@ -189,12 +190,14 @@ const processImageFile = async ({ req, res, file, metadata }) => {
   const source = req.app.locals.fileStrategy;
   const { handleImageUpload } = getStrategyFunctions(source);
   const { file_id, temp_file_id, endpoint } = metadata;
+
   const { filepath, bytes, width, height } = await handleImageUpload({
     req,
     file,
     file_id,
     endpoint,
   });
+
   const result = await createFile(
     {
       user: req.user.id,
@@ -266,13 +269,46 @@ const processFileUpload = async ({ req, res, file, metadata }) => {
   const { handleFileUpload } = getStrategyFunctions(source);
   const { file_id, temp_file_id } = metadata;
 
+  let embedded = false;
+  if (process.env.RAG_API_URL) {
+    try {
+      const jwtToken = req.headers.authorization.split(' ')[1];
+      const filepath = `./uploads/temp/${file.path.split('uploads/temp/')[1]}`;
+      const response = await axios.post(
+        `${process.env.RAG_API_URL}/embed`,
+        {
+          filename: file.originalname,
+          file_content_type: file.mimetype,
+          filepath,
+          file_id,
+        },
+        {
+          headers: {
+            Authorization: `Bearer ${jwtToken}`,
+            'Content-Type': 'application/json',
+          },
+        },
+      );
+
+      if (response.status === 200) {
+        embedded = true;
+      }
+    } catch (error) {
+      logger.error('Error embedding file', error);
+      throw new Error(error);
+    }
+  } else if (!isAssistantUpload) {
+    logger.error('RAG_API_URL not set, cannot support process file upload');
+    throw new Error('RAG_API_URL not set, cannot support process file upload');
+  }
+
   /** @type {OpenAI | undefined} */
   let openai;
   if (source === FileSources.openai) {
     ({ openai } = await initializeClient({ req }));
   }
 
-  const { id, bytes, filename, filepath } = await handleFileUpload(req, file, openai);
+  const { id, bytes, filename, filepath } = await handleFileUpload({ req, file, file_id, openai });
 
   if (isAssistantUpload && !metadata.message_file) {
     await openai.beta.assistants.files.create(metadata.assistant_id, {
@@ -289,8 +325,9 @@ const processFileUpload = async ({ req, res, file, metadata }) => {
       filepath: isAssistantUpload ? `${openai.baseURL}/files/${id}` : filepath,
       filename: filename ?? file.originalname,
       context: isAssistantUpload ? FileContext.assistants : FileContext.message_attachment,
-      source,
       type: file.mimetype,
+      embedded,
+      source,
     },
     true,
   );
diff --git a/api/server/services/Files/strategies.js b/api/server/services/Files/strategies.js
index e69251a2c..ecbe09c1e 100644
--- a/api/server/services/Files/strategies.js
+++ b/api/server/services/Files/strategies.js
@@ -5,6 +5,7 @@ const {
   saveURLToFirebase,
   deleteFirebaseFile,
   saveBufferToFirebase,
+  uploadFileToFirebase,
   uploadImageToFirebase,
   processFirebaseAvatar,
 } = require('./Firebase');
@@ -14,6 +15,7 @@ const {
   saveFileFromURL,
   saveLocalBuffer,
   deleteLocalFile,
+  uploadLocalFile,
   uploadLocalImage,
   prepareImagesLocal,
   processLocalAvatar,
@@ -32,6 +34,7 @@ const firebaseStrategy = () => ({
   saveBuffer: saveBufferToFirebase,
   prepareImagePayload: prepareImageURL,
   processAvatar: processFirebaseAvatar,
+  handleFileUpload: uploadFileToFirebase,
   handleImageUpload: uploadImageToFirebase,
 });
 
@@ -46,6 +49,7 @@ const localStrategy = () => ({
   saveBuffer: saveLocalBuffer,
   deleteFile: deleteLocalFile,
   processAvatar: processLocalAvatar,
+  handleFileUpload: uploadLocalFile,
   handleImageUpload: uploadLocalImage,
   prepareImagePayload: prepareImagesLocal,
 });
diff --git a/client/src/common/types.ts b/client/src/common/types.ts
index babbe5579..4cbb97737 100644
--- a/client/src/common/types.ts
+++ b/client/src/common/types.ts
@@ -312,6 +312,7 @@ export interface ExtendedFile {
   progress: number;
   source?: FileSources;
   attached?: boolean;
+  embedded?: boolean;
 }
 
 export type ContextType = { navVisible: boolean; setNavVisible: (visible: boolean) => void };
diff --git a/client/src/components/Chat/Input/Files/FilePreview.tsx b/client/src/components/Chat/Input/Files/FilePreview.tsx
index 3735d7c36..fcf4d01f6 100644
--- a/client/src/components/Chat/Input/Files/FilePreview.tsx
+++ b/client/src/components/Chat/Input/Files/FilePreview.tsx
@@ -2,6 +2,7 @@ import type { TFile } from 'librechat-data-provider';
 import type { ExtendedFile } from '~/common';
 import FileIcon from '~/components/svg/Files/FileIcon';
 import ProgressCircle from './ProgressCircle';
+import { useProgress } from '~/hooks';
 import { cn } from '~/utils';
 
 const FilePreview = ({
@@ -19,7 +20,7 @@ const FilePreview = ({
 }) => {
   const radius = 55; // Radius of the SVG circle
   const circumference = 2 * Math.PI * radius;
-  const progress = file?.['progress'] ?? 1;
+  const progress = useProgress(file?.['progress'] ?? 1, 0.001);
 
   // Calculate the offset based on the loading progress
   const offset = circumference - progress * circumference;
diff --git a/client/src/components/Chat/Presentation.tsx b/client/src/components/Chat/Presentation.tsx
index eb7848f7b..990f1b9c6 100644
--- a/client/src/components/Chat/Presentation.tsx
+++ b/client/src/components/Chat/Presentation.tsx
@@ -34,11 +34,12 @@ export default function Presentation({
     const filesToDelete = localStorage.getItem('filesToDelete');
     const map = JSON.parse(filesToDelete ?? '{}') as Record<string, ExtendedFile>;
     const files = Object.values(map)
-      .filter((file) => file.filepath)
+      .filter((file) => file.filepath && file.source && !file.embedded && file.temp_file_id)
       .map((file) => ({
         file_id: file.file_id,
         filepath: file.filepath as string,
         source: file.source as FileSources,
+        embedded: !!file.embedded,
       }));
 
     if (files.length === 0) {
diff --git a/client/src/components/Endpoints/Settings/Anthropic.tsx b/client/src/components/Endpoints/Settings/Anthropic.tsx
index 10607472f..55ef42a23 100644
--- a/client/src/components/Endpoints/Settings/Anthropic.tsx
+++ b/client/src/components/Endpoints/Settings/Anthropic.tsx
@@ -21,16 +21,8 @@ export default function Settings({ conversation, setOption, models, readonly }:
   if (!conversation) {
     return null;
   }
-  const {
-    model,
-    modelLabel,
-    promptPrefix,
-    temperature,
-    topP,
-    topK,
-    maxOutputTokens,
-    resendImages,
-  } = conversation;
+  const { model, modelLabel, promptPrefix, temperature, topP, topK, maxOutputTokens, resendFiles } =
+    conversation;
 
   const setModel = setOption('model');
   const setModelLabel = setOption('modelLabel');
@@ -39,7 +31,7 @@ export default function Settings({ conversation, setOption, models, readonly }:
   const setTopP = setOption('topP');
   const setTopK = setOption('topK');
   const setMaxOutputTokens = setOption('maxOutputTokens');
-  const setResendImages = setOption('resendImages');
+  const setResendFiles = setOption('resendFiles');
 
   return (
     <div className="grid grid-cols-5 gap-6">
@@ -257,13 +249,13 @@ export default function Settings({ conversation, setOption, models, readonly }:
         <HoverCard openDelay={500}>
           <HoverCardTrigger className="grid w-full">
             <div className="flex justify-between">
-              <Label htmlFor="resend-images" className="text-left text-sm font-medium">
-                {localize('com_endpoint_plug_resend_images')}{' '}
+              <Label htmlFor="resend-files" className="text-left text-sm font-medium">
+                {localize('com_endpoint_plug_resend_files')}{' '}
               </Label>
               <Switch
-                id="resend-images"
-                checked={resendImages ?? false}
-                onCheckedChange={(checked: boolean) => setResendImages(checked)}
+                id="resend-files"
+                checked={resendFiles ?? true}
+                onCheckedChange={(checked: boolean) => setResendFiles(checked)}
                 disabled={readonly}
                 className="flex"
               />
diff --git a/client/src/components/Endpoints/Settings/OpenAI.tsx b/client/src/components/Endpoints/Settings/OpenAI.tsx
index f5ba96f85..9558d5ec1 100644
--- a/client/src/components/Endpoints/Settings/OpenAI.tsx
+++ b/client/src/components/Endpoints/Settings/OpenAI.tsx
@@ -28,7 +28,7 @@ export default function Settings({ conversation, setOption, models, readonly }:
     top_p: topP,
     frequency_penalty: freqP,
     presence_penalty: presP,
-    resendImages,
+    resendFiles,
     imageDetail,
   } = conversation ?? {};
   const [setChatGptLabel, chatGptLabelValue] = useDebouncedInput({
@@ -67,7 +67,7 @@ export default function Settings({ conversation, setOption, models, readonly }:
   }
 
   const setModel = setOption('model');
-  const setResendImages = setOption('resendImages');
+  const setResendFiles = setOption('resendFiles');
   const setImageDetail = setOption('imageDetail');
 
   const optionEndpoint = endpointType ?? endpoint;
@@ -283,10 +283,10 @@ export default function Settings({ conversation, setOption, models, readonly }:
         <div className="w-full">
           <div className="mb-2 flex w-full justify-between gap-2">
             <label
-              htmlFor="resend-images"
+              htmlFor="resend-files"
               className="text-sm font-medium leading-none peer-disabled:cursor-not-allowed peer-disabled:opacity-70 dark:text-gray-50"
             >
-              <small>{localize('com_endpoint_plug_resend_images')}</small>
+              <small>{localize('com_endpoint_plug_resend_files')}</small>
             </label>
             <label
               htmlFor="image-detail-value"
@@ -310,9 +310,9 @@ export default function Settings({ conversation, setOption, models, readonly }:
             <HoverCard openDelay={500}>
               <HoverCardTrigger>
                 <Switch
-                  id="resend-images"
-                  checked={resendImages ?? false}
-                  onCheckedChange={(checked: boolean) => setResendImages(checked)}
+                  id="resend-files"
+                  checked={resendFiles ?? true}
+                  onCheckedChange={(checked: boolean) => setResendFiles(checked)}
                   disabled={readonly}
                   className="flex"
                 />
diff --git a/client/src/components/Endpoints/Settings/OptionHover.tsx b/client/src/components/Endpoints/Settings/OptionHover.tsx
index 6c745683f..bcff28940 100644
--- a/client/src/components/Endpoints/Settings/OptionHover.tsx
+++ b/client/src/components/Endpoints/Settings/OptionHover.tsx
@@ -15,7 +15,7 @@ const openAI = {
   topp: 'com_endpoint_openai_topp',
   freq: 'com_endpoint_openai_freq',
   pres: 'com_endpoint_openai_pres',
-  resend: 'com_endpoint_openai_resend',
+  resend: 'com_endpoint_openai_resend_files',
   detail: 'com_endpoint_openai_detail',
 };
 
diff --git a/client/src/hooks/Files/useDelayedUploadToast.ts b/client/src/hooks/Files/useDelayedUploadToast.ts
new file mode 100644
index 000000000..d6bc1ff04
--- /dev/null
+++ b/client/src/hooks/Files/useDelayedUploadToast.ts
@@ -0,0 +1,34 @@
+import { useState } from 'react';
+import { useToastContext } from '~/Providers/ToastContext';
+import useLocalize from '~/hooks/useLocalize';
+
+export const useDelayedUploadToast = () => {
+  const localize = useLocalize();
+  const { showToast } = useToastContext();
+  const [uploadTimers, setUploadTimers] = useState({});
+
+  const startUploadTimer = (fileId: string, fileName: string) => {
+    const timer = setTimeout(() => {
+      const message = localize('com_ui_upload_delay', fileName);
+      showToast({
+        message,
+        status: 'warning',
+        duration: 7000,
+      });
+    }, 3000); // 3 seconds delay
+
+    setUploadTimers((prev) => ({ ...prev, [fileId]: timer }));
+  };
+
+  const clearUploadTimer = (fileId: string) => {
+    if (uploadTimers[fileId]) {
+      clearTimeout(uploadTimers[fileId]);
+      setUploadTimers((prev) => {
+        const { [fileId]: _, ...rest } = prev as Record<string, unknown>;
+        return rest;
+      });
+    }
+  };
+
+  return { startUploadTimer, clearUploadTimer };
+};
diff --git a/client/src/hooks/Files/useFileDeletion.ts b/client/src/hooks/Files/useFileDeletion.ts
index d2ed8f8ed..81a46fbdc 100644
--- a/client/src/hooks/Files/useFileDeletion.ts
+++ b/client/src/hooks/Files/useFileDeletion.ts
@@ -48,6 +48,7 @@ const useFileDeletion = ({
         temp_file_id = '',
         filepath = '',
         source = FileSources.local,
+        embedded,
         attached,
       } = _file as TFile & { attached?: boolean };
 
@@ -58,6 +59,7 @@ const useFileDeletion = ({
       }
       const file: BatchFile = {
         file_id,
+        embedded,
         filepath,
         source,
       };
@@ -89,12 +91,13 @@ const useFileDeletion = ({
   const deleteFiles = useCallback(
     ({ files, setFiles }: { files: ExtendedFile[] | TFile[]; setFiles?: FileMapSetter }) => {
       const batchFiles = files.map((_file) => {
-        const { file_id, filepath = '', source = FileSources.local } = _file;
+        const { file_id, embedded, filepath = '', source = FileSources.local } = _file;
 
         return {
+          source,
           file_id,
           filepath,
-          source,
+          embedded,
         };
       });
 
diff --git a/client/src/hooks/Files/useFileHandling.ts b/client/src/hooks/Files/useFileHandling.ts
index 2673d4b88..c288c912a 100644
--- a/client/src/hooks/Files/useFileHandling.ts
+++ b/client/src/hooks/Files/useFileHandling.ts
@@ -9,6 +9,7 @@ import {
 } from 'librechat-data-provider';
 import type { ExtendedFile, FileSetter } from '~/common';
 import { useUploadFileMutation, useGetFileConfig } from '~/data-provider';
+import { useDelayedUploadToast } from './useDelayedUploadToast';
 import { useToastContext } from '~/Providers/ToastContext';
 import { useChatContext } from '~/Providers/ChatContext';
 import useUpdateFiles from './useUpdateFiles';
@@ -24,6 +25,7 @@ type UseFileHandling = {
 const useFileHandling = (params?: UseFileHandling) => {
   const { showToast } = useToastContext();
   const [errors, setErrors] = useState<string[]>([]);
+  const { startUploadTimer, clearUploadTimer } = useDelayedUploadToast();
   const { files, setFiles, setFilesLoading, conversation } = useChatContext();
   const setError = (error: string) => setErrors((prevErrors) => [...prevErrors, error]);
   const { addFile, replaceFile, updateFileById, deleteFileById } = useUpdateFiles(
@@ -72,6 +74,7 @@ const useFileHandling = (params?: UseFileHandling) => {
 
   const uploadFile = useUploadFileMutation({
     onSuccess: (data) => {
+      clearUploadTimer(data.temp_file_id);
       console.log('upload success', data);
       updateFileById(
         data.temp_file_id,
@@ -95,6 +98,7 @@ const useFileHandling = (params?: UseFileHandling) => {
             width: data.width,
             filename: data.filename,
             source: data.source,
+            embedded: data.embedded,
           },
           params?.additionalMetadata?.assistant_id ? true : false,
         );
@@ -103,6 +107,7 @@ const useFileHandling = (params?: UseFileHandling) => {
     onError: (error, body) => {
       console.log('upload error', error);
       const file_id = body.get('file_id');
+      clearUploadTimer(file_id as string);
       deleteFileById(file_id as string);
       setError(
         (error as { response: { data: { message?: string } } })?.response?.data?.message ??
@@ -117,6 +122,8 @@ const useFileHandling = (params?: UseFileHandling) => {
       return;
     }
 
+    startUploadTimer(extendedFile.file_id, extendedFile.file?.name || 'File');
+
     const formData = new FormData();
     formData.append('file', extendedFile.file as File);
     formData.append('file_id', extendedFile.file_id);
@@ -159,7 +166,27 @@ const useFileHandling = (params?: UseFileHandling) => {
     }
 
     for (let i = 0; i < fileList.length; i++) {
-      const originalFile = fileList[i];
+      let originalFile = fileList[i];
+      let fileType = originalFile.type;
+
+      // Infer MIME type for Markdown files when the type is empty
+      if (!fileType && originalFile.name.endsWith('.md')) {
+        fileType = 'text/markdown';
+      }
+
+      // Check if the file type is still empty after the extension check
+      if (!fileType) {
+        setError('Unable to determine file type for: ' + originalFile.name);
+        return false;
+      }
+
+      // Replace empty type with inferred type
+      if (originalFile.type !== fileType) {
+        const newFile = new File([originalFile], originalFile.name, { type: fileType });
+        originalFile = newFile;
+        fileList[i] = newFile;
+      }
+
       if (!checkType(originalFile.type, supportedMimeTypes)) {
         console.log(originalFile);
         setError('Currently, unsupported file type: ' + originalFile.type);
diff --git a/client/src/hooks/Messages/useProgress.ts b/client/src/hooks/Messages/useProgress.ts
index e8c6862e3..d76a25b22 100644
--- a/client/src/hooks/Messages/useProgress.ts
+++ b/client/src/hooks/Messages/useProgress.ts
@@ -1,6 +1,7 @@
 import { useState, useEffect } from 'react';
 
-export default function useProgress(initialProgress = 0.01) {
+export default function useProgress(initialProgress = 0.01, increment = 0.007) {
+  const [incrementValue] = useState(increment);
   const [progress, setProgress] = useState(initialProgress);
 
   useEffect(() => {
@@ -20,7 +21,7 @@ export default function useProgress(initialProgress = 0.01) {
             clearInterval(timer);
             return 1;
           }
-          return Math.min(prevProgress + 0.007, 0.95);
+          return Math.min(prevProgress + incrementValue, 0.95);
         });
       }, 200);
     }
@@ -29,7 +30,7 @@ export default function useProgress(initialProgress = 0.01) {
       clearInterval(timer);
       clearTimeout(timeout);
     };
-  }, [progress, initialProgress]);
+  }, [progress, initialProgress, incrementValue]);
 
   return progress;
 }
diff --git a/client/src/hooks/useNewConvo.ts b/client/src/hooks/useNewConvo.ts
index 52ac45174..8a34c4f23 100644
--- a/client/src/hooks/useNewConvo.ts
+++ b/client/src/hooks/useNewConvo.ts
@@ -165,9 +165,10 @@ const useNewConvo = (index = 0) => {
 
       if (conversation.conversationId === 'new' && !modelsData) {
         const filesToDelete = Array.from(files.values())
-          .filter((file) => file.filepath && file.source)
+          .filter((file) => file.filepath && file.source && !file.embedded && file.temp_file_id)
           .map((file) => ({
             file_id: file.file_id,
+            embedded: !!file.embedded,
             filepath: file.filepath as string,
             source: file.source as FileSources, // Ensure that the source is of type FileSources
           }));
diff --git a/client/src/localization/languages/Eng.tsx b/client/src/localization/languages/Eng.tsx
index 72f836dd9..cff9b405c 100644
--- a/client/src/localization/languages/Eng.tsx
+++ b/client/src/localization/languages/Eng.tsx
@@ -102,6 +102,8 @@ export default {
   com_ui_preview: 'Preview',
   com_ui_upload: 'Upload',
   com_ui_connect: 'Connect',
+  com_ui_upload_delay:
+    'Uploading "{0}" is taking more time than anticipated. Please wait while the file finishes indexing for retrieval.',
   com_ui_privacy_policy: 'Privacy policy',
   com_ui_terms_of_service: 'Terms of service',
   com_auth_error_login:
@@ -218,6 +220,8 @@ export default {
     'Number between -2.0 and 2.0. Positive values penalize new tokens based on whether they appear in the text so far, increasing the model\'s likelihood to talk about new topics.',
   com_endpoint_openai_resend:
     'Resend all previously attached images. Note: this can significantly increase token cost and you may experience errors with many image attachments.',
+  com_endpoint_openai_resend_files:
+    'Resend all previously attached files. Note: this will increase token cost and you may experience errors with many attachments.',
   com_endpoint_openai_detail:
     'The resolution for Vision requests. "Low" is cheaper and faster, "High" is more detailed and expensive, and "Auto" will automatically choose between the two based on the image resolution.',
   com_endpoint_openai_custom_name_placeholder: 'Set a custom name for ChatGPT',
@@ -235,6 +239,7 @@ export default {
   com_endpoint_frequency_penalty: 'Frequency Penalty',
   com_endpoint_presence_penalty: 'Presence Penalty',
   com_endpoint_plug_use_functions: 'Use Functions',
+  com_endpoint_plug_resend_files: 'Resend Files',
   com_endpoint_plug_resend_images: 'Resend Images',
   com_endpoint_plug_image_detail: 'Image Detail',
   com_endpoint_plug_skip_completion: 'Skip Completion',
diff --git a/client/src/utils/convos.fakeData.ts b/client/src/utils/convos.fakeData.ts
index bcb7229d0..f5a3398fe 100644
--- a/client/src/utils/convos.fakeData.ts
+++ b/client/src/utils/convos.fakeData.ts
@@ -26,7 +26,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0125',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'A Long Story',
           top_p: 1,
@@ -51,7 +51,7 @@ export const convoData: ConversationData = {
           model: 'meta-llama/llama-2-13b-chat',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'How Are You Doing?',
           top_p: 1,
@@ -69,7 +69,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'A Long Story',
           top_p: 1,
@@ -94,7 +94,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Write Einstein\'s Famous Equation in LaTeX',
           top_p: 1,
@@ -120,7 +120,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Fibonacci Solver in Python',
           top_p: 1,
@@ -153,7 +153,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'test',
           top_p: 1,
@@ -175,7 +175,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0125',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Hello! How can I assist you today?',
           top_p: 1,
@@ -205,7 +205,7 @@ export const convoData: ConversationData = {
           model: 'gpt-4-0125-preview',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'test',
           top_p: 1,
@@ -227,7 +227,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Hello! How can I assist you today?',
           top_p: 1,
@@ -263,7 +263,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'test',
           top_p: 1,
@@ -286,7 +286,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Hello, How Can I Help You?',
           top_p: 1,
@@ -304,7 +304,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Hello there! How may I assist you today?',
           top_p: 1,
@@ -322,7 +322,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Hello! How may I assist you today?',
           top_p: 1,
@@ -340,7 +340,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Hello! How can I assist you today?',
           top_p: 1,
@@ -358,7 +358,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Hello! How may I assist you today?',
           top_p: 1,
@@ -376,7 +376,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Hello! How can I assist you today?',
           top_p: 1,
@@ -394,7 +394,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Hello! How can I assist you today?',
           top_p: 1,
@@ -412,7 +412,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Hello! How can I assist you today?',
           top_p: 1,
@@ -430,7 +430,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Hello! How can I assist you today?',
           top_p: 1,
@@ -448,7 +448,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Hello! How can I assist you today?',
           top_p: 1,
@@ -466,7 +466,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Hello! How can I assist you today?',
           top_p: 1,
@@ -484,7 +484,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Hello! How can I assist you today?',
           top_p: 1,
@@ -502,7 +502,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Hello! How can I assist you today?',
           top_p: 1,
@@ -525,7 +525,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'test 2',
           top_p: 1,
@@ -550,7 +550,7 @@ export const convoData: ConversationData = {
           model: 'gpt-3.5-turbo-0301',
           presence_penalty: 0,
           promptPrefix: null,
-          resendImages: false,
+          resendFiles: false,
           temperature: 1,
           title: 'Hi there! How can I assist you today?',
           top_p: 1,
diff --git a/deploy-compose.yml b/deploy-compose.yml
index 4f432c31e..4d760bb2c 100644
--- a/deploy-compose.yml
+++ b/deploy-compose.yml
@@ -24,6 +24,8 @@ services:
     volumes:
       - ./images:/app/client/public/images
       - ./librechat.yaml:/app/librechat.yaml
+      - ./logs:/app/api/logs
+      - ./uploads:/app/uploads
   client:
     build:
       context: .
diff --git a/docker-compose.yml b/docker-compose.yml
index ac6102309..49cfb6ab1 100644
--- a/docker-compose.yml
+++ b/docker-compose.yml
@@ -22,6 +22,7 @@ services:
     volumes:
       - ./.env:/app/.env
       - ./images:/app/client/public/images
+      - ./uploads:/app/uploads
       - ./logs:/app/api/logs
   mongodb:
     container_name: chat-mongodb
diff --git a/packages/data-provider/src/file-config.ts b/packages/data-provider/src/file-config.ts
index e458ed5fc..9e9b7ae84 100644
--- a/packages/data-provider/src/file-config.ts
+++ b/packages/data-provider/src/file-config.ts
@@ -109,7 +109,7 @@ export const textMimeTypes =
   /^(text\/(x-c|x-c\+\+|x-java|html|markdown|x-php|x-python|x-script\.python|x-ruby|x-tex|plain|css|javascript|csv))$/;
 
 export const applicationMimeTypes =
-  /^(application\/(csv|json|pdf|x-tar|typescript|vnd\.openxmlformats-officedocument\.(wordprocessingml\.document|presentationml\.presentation|spreadsheetml\.sheet)|xml|zip))$/;
+  /^(application\/(epub\+zip|csv|json|pdf|x-tar|typescript|vnd\.openxmlformats-officedocument\.(wordprocessingml\.document|presentationml\.presentation|spreadsheetml\.sheet)|xml|zip))$/;
 
 export const imageMimeTypes = /^image\/(jpeg|gif|png|webp)$/;
 
@@ -147,9 +147,9 @@ export const fileConfig = {
     },
     default: {
       fileLimit: 10,
-      fileSizeLimit: mbToBytes(20),
-      totalSizeLimit: mbToBytes(25),
-      supportedMimeTypes: [imageMimeTypes],
+      fileSizeLimit: mbToBytes(512),
+      totalSizeLimit: mbToBytes(512),
+      supportedMimeTypes,
       disabled: false,
     },
   },
diff --git a/packages/data-provider/src/schemas.ts b/packages/data-provider/src/schemas.ts
index 69bb660da..266aa9e98 100644
--- a/packages/data-provider/src/schemas.ts
+++ b/packages/data-provider/src/schemas.ts
@@ -216,8 +216,10 @@ export const tConversationSchema = z.object({
   maxOutputTokens: z.number().optional(),
   agentOptions: tAgentOptionsSchema.nullable().optional(),
   file_ids: z.array(z.string()).optional(),
-  /* vision */
+  /** @deprecated */
   resendImages: z.boolean().optional(),
+  /* vision */
+  resendFiles: z.boolean().optional(),
   imageDetail: eImageDetailSchema.optional(),
   /* assistant */
   assistant_id: z.string().optional(),
@@ -273,7 +275,7 @@ export const openAISchema = tConversationSchema
     top_p: true,
     presence_penalty: true,
     frequency_penalty: true,
-    resendImages: true,
+    resendFiles: true,
     imageDetail: true,
   })
   .transform((obj) => ({
@@ -285,7 +287,7 @@ export const openAISchema = tConversationSchema
     top_p: obj.top_p ?? 1,
     presence_penalty: obj.presence_penalty ?? 0,
     frequency_penalty: obj.frequency_penalty ?? 0,
-    resendImages: obj.resendImages ?? false,
+    resendFiles: typeof obj.resendFiles === 'boolean' ? obj.resendFiles : true,
     imageDetail: obj.imageDetail ?? ImageDetail.auto,
   }))
   .catch(() => ({
@@ -296,7 +298,7 @@ export const openAISchema = tConversationSchema
     top_p: 1,
     presence_penalty: 0,
     frequency_penalty: 0,
-    resendImages: false,
+    resendFiles: true,
     imageDetail: ImageDetail.auto,
   }));
 
@@ -391,7 +393,7 @@ export const anthropicSchema = tConversationSchema
     maxOutputTokens: true,
     topP: true,
     topK: true,
-    resendImages: true,
+    resendFiles: true,
   })
   .transform((obj) => ({
     ...obj,
@@ -402,7 +404,7 @@ export const anthropicSchema = tConversationSchema
     maxOutputTokens: obj.maxOutputTokens ?? 4000,
     topP: obj.topP ?? 0.7,
     topK: obj.topK ?? 5,
-    resendImages: obj.resendImages ?? false,
+    resendFiles: typeof obj.resendFiles === 'boolean' ? obj.resendFiles : true,
   }))
   .catch(() => ({
     model: 'claude-1',
@@ -412,7 +414,7 @@ export const anthropicSchema = tConversationSchema
     maxOutputTokens: 4000,
     topP: 0.7,
     topK: 5,
-    resendImages: false,
+    resendFiles: true,
   }));
 
 export const chatGPTBrowserSchema = tConversationSchema
@@ -504,7 +506,7 @@ export const compactOpenAISchema = tConversationSchema
     top_p: true,
     presence_penalty: true,
     frequency_penalty: true,
-    resendImages: true,
+    resendFiles: true,
     imageDetail: true,
   })
   .transform((obj: Partial<TConversation>) => {
@@ -521,8 +523,8 @@ export const compactOpenAISchema = tConversationSchema
     if (newObj.frequency_penalty === 0) {
       delete newObj.frequency_penalty;
     }
-    if (newObj.resendImages !== true) {
-      delete newObj.resendImages;
+    if (newObj.resendFiles === true) {
+      delete newObj.resendFiles;
     }
     if (newObj.imageDetail === ImageDetail.auto) {
       delete newObj.imageDetail;
@@ -571,7 +573,7 @@ export const compactAnthropicSchema = tConversationSchema
     maxOutputTokens: true,
     topP: true,
     topK: true,
-    resendImages: true,
+    resendFiles: true,
   })
   .transform((obj) => {
     const newObj: Partial<TConversation> = { ...obj };
@@ -587,8 +589,8 @@ export const compactAnthropicSchema = tConversationSchema
     if (newObj.topK === 5) {
       delete newObj.topK;
     }
-    if (newObj.resendImages !== true) {
-      delete newObj.resendImages;
+    if (newObj.resendFiles === true) {
+      delete newObj.resendFiles;
     }
 
     return removeNullishValues(newObj);
diff --git a/packages/data-provider/src/types.ts b/packages/data-provider/src/types.ts
index 28b072490..bb0c4d4a3 100644
--- a/packages/data-provider/src/types.ts
+++ b/packages/data-provider/src/types.ts
@@ -16,7 +16,7 @@ export type TEndpointOption = {
   endpoint: EModelEndpoint;
   endpointType?: EModelEndpoint;
   modelDisplayLabel?: string;
-  resendImages?: boolean;
+  resendFiles?: boolean;
   imageDetail?: ImageDetail;
   model?: string | null;
   promptPrefix?: string;
diff --git a/packages/data-provider/src/types/files.ts b/packages/data-provider/src/types/files.ts
index 6f619d4e5..264d0073c 100644
--- a/packages/data-provider/src/types/files.ts
+++ b/packages/data-provider/src/types/files.ts
@@ -40,6 +40,7 @@ export type TFile = {
   file_id: string;
   temp_file_id?: string;
   bytes: number;
+  embedded: boolean;
   filename: string;
   filepath: string;
   object: 'file';
@@ -83,6 +84,7 @@ export type DeleteFilesResponse = {
 export type BatchFile = {
   file_id: string;
   filepath: string;
+  embedded: boolean;
   source: FileSources;
 };
 
diff --git a/rag.yml b/rag.yml
new file mode 100644
index 000000000..3f5758479
--- /dev/null
+++ b/rag.yml
@@ -0,0 +1,33 @@
+version: '3.8'
+
+services:
+  vectordb:
+    image: ankane/pgvector:latest
+    environment:
+      POSTGRES_DB: mydatabase
+      POSTGRES_USER: myuser
+      POSTGRES_PASSWORD: mypassword
+    volumes:
+      - pgdata2:/var/lib/postgresql/data
+    ports:
+      - "5433:5432"
+
+  rag_api:
+    image: ghcr.io/danny-avila/librechat-rag-api-dev:latest
+    environment:
+      - DB_HOST=vectordb
+      - DB_PORT=5432
+      - POSTGRES_DB=mydatabase
+      - POSTGRES_USER=myuser
+      - POSTGRES_PASSWORD=mypassword
+    ports:
+      - "8000:8000"
+    volumes:
+      - ./uploads/temp:/app/uploads/temp
+    depends_on:
+      - vectordb
+    env_file:
+      - .env
+
+volumes:
+  pgdata2: