maximhq
diff --git a/‎core/providers/anthropic/anthropic.go‎
Lines changed: 44 additions & 70 deletions b/‎core/providers/anthropic/anthropic.go‎
Lines changed: 44 additions & 70 deletions
diff --git a/‎core/providers/azure/azure.go‎
Lines changed: 4 additions & 11 deletions b/‎core/providers/azure/azure.go‎
Lines changed: 4 additions & 11 deletions
diff --git a/‎core/providers/cerebras.go‎
Lines changed: 4 additions & 12 deletions b/‎core/providers/cerebras.go‎
Lines changed: 4 additions & 12 deletions
@@ -2,11 +2,9 @@ package anthropic
 
 import (
 	"bufio"
-	"bytes"
 	"context"
 	"errors"
 	"fmt"
-	"io"
 	"net/http"
 	"strings"
 	"sync"
@@ -22,7 +20,6 @@ import (
 type AnthropicProvider struct {
 	logger               schemas.Logger                // Logger for provider operations
 	client               *fasthttp.Client              // HTTP client for API requests
-	streamClient         *http.Client                  // HTTP client for streaming requests
 	apiVersion           string                        // API version for the provider
 	networkConfig        schemas.NetworkConfig         // Network configuration including extra headers
 	sendBackRawResponse  bool                          // Whether to include raw response in BifrostResponse
@@ -83,11 +80,7 @@ func NewAnthropicProvider(config *schemas.ProviderConfig, logger schemas.Logger)
 		MaxConnsPerHost: config.ConcurrencyAndBufferSize.Concurrency,
 	}
 
-	// Initialize streaming HTTP client
-	streamClient := &http.Client{
-		Timeout: time.Second * time.Duration(config.NetworkConfig.DefaultRequestTimeoutInSeconds),
-	}
-
+	
 	// Pre-warm response pools
 	for i := 0; i < config.ConcurrencyAndBufferSize.Concurrency; i++ {
 		anthropicTextResponsePool.Put(&AnthropicTextResponse{})
@@ -106,7 +99,6 @@ func NewAnthropicProvider(config *schemas.ProviderConfig, logger schemas.Logger)
 	return &AnthropicProvider{
 		logger:               logger,
 		client:               client,
-		streamClient:         streamClient,
 		apiVersion:           "2023-06-01",
 		networkConfig:        config.NetworkConfig,
 		sendBackRawResponse:  config.SendBackRawResponse,
@@ -120,13 +112,10 @@ func (provider *AnthropicProvider) GetProviderKey() schemas.ModelProvider {
 }
 
 // parseStreamAnthropicError parses Anthropic streaming error responses.
-func parseStreamAnthropicError(resp *http.Response, providerType schemas.ModelProvider) *schemas.BifrostError {
-	statusCode := resp.StatusCode
-	body, _ := io.ReadAll(resp.Body)
-	resp.Body.Close()
-
+func parseStreamAnthropicError(resp *fasthttp.Response, providerType schemas.ModelProvider) *schemas.BifrostError {
+	statusCode := resp.StatusCode()
 	var errorResp AnthropicError
-	if err := sonic.Unmarshal(body, &errorResp); err != nil {
+	if err := sonic.Unmarshal(resp.Body(), &errorResp); err != nil {
 		return providerUtils.NewBifrostOperationError(schemas.ErrProviderResponseUnmarshal, err, providerType)
 	}
 
@@ -378,7 +367,7 @@ func (provider *AnthropicProvider) ChatCompletionStream(ctx context.Context, pos
 	// Use shared Anthropic streaming logic
 	return HandleAnthropicChatCompletionStreaming(
 		ctx,
-		provider.streamClient,
+		provider.client,
 		provider.networkConfig.BaseURL+"/v1/messages",
 		reqBody,
 		headers,
@@ -394,7 +383,7 @@ func (provider *AnthropicProvider) ChatCompletionStream(ctx context.Context, pos
 // This shared function reduces code duplication between providers that use the same SSE event format.
 func HandleAnthropicChatCompletionStreaming(
 	ctx context.Context,
-	httpClient *http.Client,
+	client *fasthttp.Client,
 	url string,
 	requestBody interface{},
 	headers map[string]string,
@@ -409,36 +398,28 @@ func HandleAnthropicChatCompletionStreaming(
 		return nil, providerUtils.NewBifrostOperationError(schemas.ErrProviderJSONMarshaling, err, providerType)
 	}
 
-	// Create HTTP request for streaming
-	req, err := http.NewRequestWithContext(ctx, http.MethodPost, url, bytes.NewReader(jsonBody))
-	if err != nil {
-		if errors.Is(err, context.Canceled) {
-			return nil, &schemas.BifrostError{
-				IsBifrostError: false,
-				Error: &schemas.ErrorField{
-					Type:    schemas.Ptr(schemas.RequestCancelled),
-					Message: schemas.ErrRequestCancelled,
-					Error:   err,
-				},
-			}
-		}
-		if errors.Is(err, http.ErrHandlerTimeout) || errors.Is(err, context.DeadlineExceeded) {
-			return nil, providerUtils.NewBifrostOperationError(schemas.ErrProviderRequestTimedOut, err, providerType)
-		}
-		return nil, providerUtils.NewBifrostOperationError(schemas.ErrProviderRequest, err, providerType)
-	}
+	req := fasthttp.AcquireRequest()
+	resp := fasthttp.AcquireResponse()
+	defer fasthttp.ReleaseRequest(req)
+	defer fasthttp.ReleaseResponse(resp)
+
+	req.Header.SetMethod(http.MethodPost)
+	req.SetRequestURI(url)
+	req.Header.SetContentType("application/json")
+	providerUtils.SetExtraHeaders(req, extraHeaders, nil)
 
 	// Set headers
 	for key, value := range headers {
 		req.Header.Set(key, value)
 	}
 
-	// Set any extra headers from network config
-	providerUtils.SetExtraHeadersHTTP(req, extraHeaders, nil)
+	req.SetBody(jsonBody)
+
 
 	// Make the request
-	resp, err := httpClient.Do(req)
-	if err != nil {
+	// Make the request
+	_, bifrostErr := providerUtils.MakeRequestWithContext(ctx, client, req, resp)
+	if bifrostErr != nil {
 		if errors.Is(err, context.Canceled) {
 			return nil, &schemas.BifrostError{
 				IsBifrostError: false,
@@ -449,14 +430,14 @@ func HandleAnthropicChatCompletionStreaming(
 				},
 			}
 		}
-		if errors.Is(err, http.ErrHandlerTimeout) || errors.Is(err, context.DeadlineExceeded) {
+		if errors.Is(err, fasthttp.ErrTimeout) || errors.Is(err, context.DeadlineExceeded) {
 			return nil, providerUtils.NewBifrostOperationError(schemas.ErrProviderRequestTimedOut, err, providerType)
 		}
 		return nil, providerUtils.NewBifrostOperationError(schemas.ErrProviderRequest, err, providerType)
 	}
 
 	// Check for HTTP errors
-	if resp.StatusCode != http.StatusOK {
+	if resp.StatusCode() != fasthttp.StatusOK {
 		return nil, parseStreamAnthropicError(resp, providerType)
 	}
 
@@ -466,9 +447,8 @@ func HandleAnthropicChatCompletionStreaming(
 	// Start streaming in a goroutine
 	go func() {
 		defer close(responseChan)
-		defer resp.Body.Close()
-
-		scanner := bufio.NewScanner(resp.Body)
+		
+		scanner := bufio.NewScanner(resp.BodyStream())
 		chunkIndex := 0
 
 		startTime := time.Now()
@@ -659,35 +639,30 @@ func (provider *AnthropicProvider) ResponsesStream(ctx context.Context, postHook
 	}
 
 	// Create HTTP request for streaming
-	req, err := http.NewRequestWithContext(ctx, http.MethodPost, provider.networkConfig.BaseURL+"/v1/messages", bytes.NewReader(jsonBody))
-	if err != nil {
-		if errors.Is(err, context.Canceled) {
-			return nil, &schemas.BifrostError{
-				IsBifrostError: false,
-				Error: &schemas.ErrorField{
-					Type:    schemas.Ptr(schemas.RequestCancelled),
-					Message: schemas.ErrRequestCancelled,
-					Error:   err,
-				},
-			}
-		}
-		if errors.Is(err, http.ErrHandlerTimeout) || errors.Is(err, context.DeadlineExceeded) {
-			return nil, providerUtils.NewBifrostOperationError(schemas.ErrProviderRequestTimedOut, err, provider.GetProviderKey())
-		}
-		return nil, providerUtils.NewBifrostOperationError(schemas.ErrProviderRequest, err, provider.GetProviderKey())
-	}
+	req := fasthttp.AcquireRequest()
+	resp := fasthttp.AcquireResponse()
+	defer fasthttp.ReleaseRequest(req)
+	defer fasthttp.ReleaseResponse(resp)	
+
+	url := fmt.Sprintf("%s/v1/messages", provider.networkConfig.BaseURL)
+
+	req.Header.SetMethod(http.MethodPost)
+	req.SetRequestURI(url)
+	req.Header.SetContentType("application/json")
 
 	// Set headers
 	for key, value := range headers {
 		req.Header.Set(key, value)
 	}
-
 	// Set any extra headers from network config
-	providerUtils.SetExtraHeadersHTTP(req, provider.networkConfig.ExtraHeaders, nil)
+	providerUtils.SetExtraHeaders(req, provider.networkConfig.ExtraHeaders, nil)
+	// Set body
+	req.SetBody(jsonBody)
 
 	// Make the request
-	resp, err := provider.streamClient.Do(req)
-	if err != nil {
+	// Make the request
+	_, bifrostErr := providerUtils.MakeRequestWithContext(ctx, provider.client, req, resp)
+	if bifrostErr != nil {
 		if errors.Is(err, context.Canceled) {
 			return nil, &schemas.BifrostError{
 				IsBifrostError: false,
@@ -698,14 +673,14 @@ func (provider *AnthropicProvider) ResponsesStream(ctx context.Context, postHook
 				},
 			}
 		}
-		if errors.Is(err, http.ErrHandlerTimeout) || errors.Is(err, context.DeadlineExceeded) {
+		if errors.Is(err, fasthttp.ErrTimeout) || errors.Is(err, context.DeadlineExceeded) {
 			return nil, providerUtils.NewBifrostOperationError(schemas.ErrProviderRequestTimedOut, err, provider.GetProviderKey())
 		}
 		return nil, providerUtils.NewBifrostOperationError(schemas.ErrProviderRequest, err, provider.GetProviderKey())
 	}
 
 	// Check for HTTP errors
-	if resp.StatusCode != http.StatusOK {
+	if resp.StatusCode() != fasthttp.StatusOK {
 		return nil, parseStreamAnthropicError(resp, provider.GetProviderKey())
 	}
 
@@ -715,9 +690,8 @@ func (provider *AnthropicProvider) ResponsesStream(ctx context.Context, postHook
 	// Start streaming in a goroutine
 	go func() {
 		defer close(responseChan)
-		defer resp.Body.Close()
-
-		scanner := bufio.NewScanner(resp.Body)
+		
+		scanner := bufio.NewScanner(resp.BodyStream())
 		chunkIndex := 0
 
 		startTime := time.Now()
 
@@ -21,8 +21,7 @@ const AzureAuthorizationTokenKey schemas.BifrostContextKey = "azure-authorizatio
 // AzureProvider implements the Provider interface for Azure's OpenAI API.
 type AzureProvider struct {
 	logger              schemas.Logger        // Logger for provider operations
-	client              *fasthttp.Client      // HTTP client for API requests
-	streamClient        *http.Client          // HTTP client for streaming requests
+	client              *fasthttp.Client      // HTTP client for API requests	
 	networkConfig       schemas.NetworkConfig // Network configuration including extra headers
 	sendBackRawResponse bool                  // Whether to include raw response in BifrostResponse
 }
@@ -39,18 +38,12 @@ func NewAzureProvider(config *schemas.ProviderConfig, logger schemas.Logger) (*A
 		MaxConnsPerHost: config.ConcurrencyAndBufferSize.Concurrency,
 	}
 
-	// Initialize streaming HTTP client
-	streamClient := &http.Client{
-		Timeout: time.Second * time.Duration(config.NetworkConfig.DefaultRequestTimeoutInSeconds),
-	}
-
 	// Configure proxy if provided
 	client = providerUtils.ConfigureProxy(client, config.ProxyConfig, logger)
 
 	return &AzureProvider{
 		logger:              logger,
 		client:              client,
-		streamClient:        streamClient,
 		networkConfig:       config.NetworkConfig,
 		sendBackRawResponse: config.SendBackRawResponse,
 	}, nil
@@ -279,7 +272,7 @@ func (provider *AzureProvider) TextCompletionStream(ctx context.Context, postHoo
 
 	return openai.HandleOpenAITextCompletionStreaming(
 		ctx,
-		provider.streamClient,
+		provider.client,
 		url,
 		request,
 		authHeader,
@@ -364,7 +357,7 @@ func (provider *AzureProvider) ChatCompletionStream(ctx context.Context, postHoo
 	// Use shared streaming logic from OpenAI
 	return openai.HandleOpenAIChatCompletionStreaming(
 		ctx,
-		provider.streamClient,
+		provider.client,
 		url,
 		request,
 		authHeader,
@@ -489,7 +482,7 @@ func (provider *AzureProvider) ResponsesStream(ctx context.Context, postHookRunn
 	// Use shared streaming logic from OpenAI
 	return openai.HandleOpenAIResponsesStreaming(
 		ctx,
-		provider.streamClient,
+		provider.client,
 		url,
 		request,
 		authHeader,
 
@@ -4,7 +4,6 @@ package providers
 
 import (
 	"context"
-	"net/http"
 	"strings"
 	"time"
 
@@ -17,8 +16,7 @@ import (
 // CerebrasProvider implements the Provider interface for Cerebras's API.
 type CerebrasProvider struct {
 	logger              schemas.Logger        // Logger for provider operations
-	client              *fasthttp.Client      // HTTP client for API requests
-	streamClient        *http.Client          // HTTP client for streaming requests
+	client              *fasthttp.Client      // HTTP client for API requests	
 	networkConfig       schemas.NetworkConfig // Network configuration including extra headers
 	sendBackRawResponse bool                  // Whether to include raw response in BifrostResponse
 }
@@ -35,11 +33,6 @@ func NewCerebrasProvider(config *schemas.ProviderConfig, logger schemas.Logger)
 		MaxConnsPerHost: config.ConcurrencyAndBufferSize.BufferSize,
 	}
 
-	// Initialize streaming HTTP client
-	streamClient := &http.Client{
-		Timeout: time.Second * time.Duration(config.NetworkConfig.DefaultRequestTimeoutInSeconds),
-	}
-
 	// Configure proxy if provided
 	client = providerUtils.ConfigureProxy(client, config.ProxyConfig, logger)
 
@@ -51,8 +44,7 @@ func NewCerebrasProvider(config *schemas.ProviderConfig, logger schemas.Logger)
 
 	return &CerebrasProvider{
 		logger:              logger,
-		client:              client,
-		streamClient:        streamClient,
+		client:              client,		
 		networkConfig:       config.NetworkConfig,
 		sendBackRawResponse: config.SendBackRawResponse,
 	}, nil
@@ -91,7 +83,7 @@ func (provider *CerebrasProvider) TextCompletion(ctx context.Context, key schema
 func (provider *CerebrasProvider) TextCompletionStream(ctx context.Context, postHookRunner schemas.PostHookRunner, key schemas.Key, request *schemas.BifrostTextCompletionRequest) (chan *schemas.BifrostStream, *schemas.BifrostError) {
 	return openai.HandleOpenAITextCompletionStreaming(
 		ctx,
-		provider.streamClient,
+		provider.client,
 		provider.networkConfig.BaseURL+"/v1/completions",
 		request,
 		map[string]string{"Authorization": "Bearer " + key.Value},
@@ -126,7 +118,7 @@ func (provider *CerebrasProvider) ChatCompletionStream(ctx context.Context, post
 	// Use shared OpenAI-compatible streaming logic
 	return openai.HandleOpenAIChatCompletionStreaming(
 		ctx,
-		provider.streamClient,
+		provider.client,
 		provider.networkConfig.BaseURL+"/v1/chat/completions",
 		request,
 		map[string]string{"Authorization": "Bearer " + key.Value},