คู่มือการใช้งาน

API Gateway ที่รองรับ OpenAI API format — ใช้งานกับทุก framework ที่รองรับ OpenAI ได้เลย

Quick Start

ใช้งาน Gateway นี้เหมือน OpenAI API ทุกประการ — เปลี่ยนแค่ base_url และ api_key

# Python (OpenAI SDK)
from openai import OpenAI
client = OpenAI(
base_url="https://ai-proxy.origins.observer/v1",
api_key="sk-your-api-key",
)
response = client.chat.completions.create(
model="workers-ai/llama-3.3-70b",
messages=[{"role": "user", "content": "Hello!"}],
)

API Endpoints

MethodEndpointคำอธิบาย
POST/v1/chat/completionsChat / Text generation (streaming supported)
POST/v1/embeddingsText → Vector embeddings
POST/v1/images/generationsText → Image generation
GET/v1/modelsรายการ models ที่ใช้ได้

💬 Chat Completions

# curl
curl https://ai-proxy.origins.observer/v1/chat/completions \
-H "Authorization: Bearer sk-your-key" \
-H "Content-Type: application/json" \
-d '{
"model": "workers-ai/llama-3.3-70b",
"messages": [{"role": "user", "content": "สวัสดี"}],
"stream": false
}'

Parameters ที่รองรับ:

modelmessagesstreamtemperaturetop_pmax_tokensstopfrequency_penaltypresence_penaltyseedtop_kn

🔢 Embeddings

curl https://ai-proxy.origins.observer/v1/embeddings \
-H "Authorization: Bearer sk-your-key" \
-H "Content-Type: application/json" \
-d '{"model": "workers-ai/bge-base-en-v1.5", "input": "Hello world"}'

Embedding Models:

ModelDimensionsภาษา
workers-ai/bge-small-en-v1.5384EN
workers-ai/bge-base-en-v1.5768EN
workers-ai/bge-large-en-v1.51024EN
workers-ai/bge-m31024Multilingual

🎨 Image Generation

curl https://ai-proxy.origins.observer/v1/images/generations \
-H "Authorization: Bearer sk-your-key" \
-H "Content-Type: application/json" \
-d '{"model": "workers-ai/flux-1-schnell", "prompt": "a cute cat", "size": "1024x1024"}'

Response จะเป็น b64_json (base64-encoded PNG)

Image Models:

workers-ai/flux-1-schnellworkers-ai/sdxl-lightningworkers-ai/dreamshaper-8-lcm

Chat Models ทั้งหมด

ModelProviderหมายเหตุ
openai/gpt-4oOpenAI
openai/gpt-4o-miniOpenAIเร็ว ราคาถูก
gemini/gemini-2.0-flashGeminiเร็ว
gemini/gemini-2.0-proGemini
modal/llama-3.1-8bModalSelf-hosted vLLM
workers-ai/llama-4-scoutWorkers AILlama 4 MoE
workers-ai/llama-3.3-70bWorkers AI70B params
workers-ai/gemma-3-12bWorkers AI
workers-ai/deepseek-r1-32bWorkers AIReasoning model
workers-ai/qwen2.5-coder-32bWorkers AICode-optimized
workers-ai/mistral-7bWorkers AI

ใช้งานกับ Framework อื่น

LangChain (Python)

from langchain_openai import ChatOpenAI
llm = ChatOpenAI(
base_url="https://ai-proxy.origins.observer/v1",
api_key="sk-your-key",
model="workers-ai/llama-3.3-70b",
)

JavaScript / TypeScript

import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://ai-proxy.origins.observer/v1",
apiKey: "sk-your-key",
});

cURL

curl https://ai-proxy.origins.observer/v1/chat/completions \
-H "Authorization: Bearer sk-your-key" \
-H "Content-Type: application/json" \
-d '{"model":"workers-ai/llama-3.3-70b","messages":[{"role":"user","content":"Hi"}]}'

ฟีเจอร์ของ Gateway

OpenAI API Compatible

ใช้งานกับ OpenAI SDK, LangChain, LlamaIndex ได้เลย

Multi-Provider Routing

OpenAI, Gemini, Modal, Workers AI — route ผ่าน gateway เดียว

API Key Management

สร้าง/จัดการ API keys พร้อม budget limit และ rate limit

Usage Tracking

Track tokens, cost, latency ทุก request

Streaming Support

รองรับ SSE streaming เหมือน OpenAI

Model Access Control

กำหนดได้ว่า key ไหนใช้ model อะไรได้บ้าง