jakobhoeg · jakobhoeg · Mar 3, 2026 · Mar 3, 2026 · Mar 3, 2026
diff --git a/.changeset/green-geckos-teach.md b/.changeset/green-geckos-teach.md
@@ -0,0 +1,5 @@
+---
+"@browser-ai/web-llm": patch
+---
+
+fix: type requestOptions & fix providerOptions key lookup
diff --git a/packages/vercel/web-llm/src/chat/web-llm-language-model.ts b/packages/vercel/web-llm/src/chat/web-llm-language-model.ts
@@ -15,6 +15,7 @@ import { convertToWebLLMMessages } from "../utils/convert-to-webllm-messages";
 
 import {
   AppConfig,
+  ChatCompletionRequestNonStreaming,
   ChatCompletionRequestStreaming,
   CreateWebWorkerMLCEngine,
   InitProgressReport,
@@ -266,20 +267,25 @@ export class WebLLMLanguageModel implements LanguageModelV3 {
     const messages = convertToWebLLMMessages(prompt);
 
     // Build request options
-    const requestOptions: any = {
+    const requestOptions: ChatCompletionRequestNonStreaming = {
       messages,
       temperature,
       max_tokens: maxOutputTokens,
       top_p: topP,
       seed,
     };
 
-    if (providerOptions?.extra_body) {
+    const webLLMOptions = providerOptions?.[this.provider];
+    const extraBody = webLLMOptions?.extra_body as
+      | Record<string, unknown>
+      | undefined;
+    if (extraBody) {
       // https://webllm.mlc.ai/docs/user/api_reference.html#generationconfig
       requestOptions.extra_body = {
-        enable_thinking: providerOptions.extra_body.enable_thinking,
-        enable_latency_breakdown:
-          providerOptions.extra_body.enable_latency_breakdown,
+        enable_thinking: extraBody.enable_thinking as boolean | undefined,
+        enable_latency_breakdown: extraBody.enable_latency_breakdown as
+          | boolean
+          | undefined,
       };
     }
 
@@ -400,7 +406,7 @@ export class WebLLMLanguageModel implements LanguageModelV3 {
               reasoning: undefined,
             },
           },
-          request: { body: { messages: promptMessages, ...requestOptions } },
+          request: { body: { ...requestOptions, messages: promptMessages } },
           warnings,
         };
       }
@@ -439,7 +445,7 @@ export class WebLLMLanguageModel implements LanguageModelV3 {
             total: response.usage?.total_tokens,
           },
         },
-        request: { body: { messages: promptMessages, ...requestOptions } },
+        request: { body: { ...requestOptions, messages: promptMessages } },
         warnings,
       };
     } catch (error) {
@@ -688,7 +694,7 @@ export class WebLLMLanguageModel implements LanguageModelV3 {
 
     return {
       stream,
-      request: { body: { messages: promptMessages, ...requestOptions } },
+      request: { body: { ...requestOptions, messages: promptMessages } },
     };
   }
 }
diff --git a/packages/vercel/web-llm/test/web-llm-language-model.test.ts b/packages/vercel/web-llm/test/web-llm-language-model.test.ts
@@ -162,6 +162,35 @@ describe("WebLLMLanguageModel", () => {
         }),
       );
     });
+
+    it("should forward extra_body provider options to the request", async () => {
+      mockChatCompletionsCreate.mockResolvedValue({
+        choices: [{ message: { content: "ok" }, finish_reason: "stop" }],
+        usage: { prompt_tokens: 5, completion_tokens: 2, total_tokens: 7 },
+      });
+
+      const model = new WebLLMLanguageModel("test-model");
+      await model.doGenerate({
+        prompt: [{ role: "user", content: [{ type: "text", text: "hi" }] }],
+        providerOptions: {
+          "web-llm": {
+            extra_body: {
+              enable_thinking: true,
+              enable_latency_breakdown: false,
+            },
+          },
+        },
+      });
+
+      expect(mockChatCompletionsCreate).toHaveBeenCalledWith(
+        expect.objectContaining({
+          extra_body: {
+            enable_thinking: true,
+            enable_latency_breakdown: false,
+          },
+        }),
+      );
+    });
   });
 
   describe("doStream", () => {