Drop-in OpenAI- en Anthropic-API, EU-gehost

Host je AI in Europa.
Veilig, compliant, drop-in.

Deploy je eigen AI-modellen in Europa, op een dedicated GPU of via de gedeelde Router. Wijs je OpenAI- of Anthropic-client naar één base-URL en je draait.

Gemaakt en gehost in de EU
Jouw app
OpenAI · Anthropic
EU Router
één base-URL
Qwen3-8B
gedeelde gateway
Loes (NL)
dedicated GPU
Llama-3.3
single-tenant
drop-in warm · EU
Je verzoek blijft van begin tot eind in de EU. De Router stuurt het naar een warm model en streamt het antwoord direct terug.

Open modellen, geserveerd vanuit de EU op infrastructuur die jij beheert

Loes MetaLlama Alibaba CloudQwen DeepSeekDeepSeek Mistral AIMistral GoogleGemma FLUX.1 SDXL Phi-3 vLLMvLLM Hugging FaceHuggingFace Europese GPU-marketplaces
0%
EU-gehost

Je data en je modellen blijven op Europese GPU's. GDPR-vriendelijk vanaf de basis.

0+
Geverifieerde modellen, klaar om te serveren

Llama, Qwen, DeepSeek, Mistral, FLUX en nog veel meer. Kies er een en hij is binnen minuten warm, zonder DevOps aan jouw kant.

0 SDKs
OpenAI- en Anthropic-compatibel

Richt je bestaande client op de Router en behoud je tools. Geen herschrijven, geen lock-in.

Product

Eén platform, van eerste test tot productie

Router

Eén endpoint, elk open model

Verander alleen de base-URL en behoud je OpenAI-tools.

chat.completions
# werkt met je bestaande OpenAI-client curl https://hostyourai.com/api/v1/chat/completions \ -H "Authorization: Bearer hyai-..." \ -d '{ "model": "qwen3-8b", "messages": [{ "role": "user", ... }], "stream": true }' # of je Anthropic SDK, zelfde Router curl https://hostyourai.com/api/v1/messages \ -H "x-api-key: hyai-..."
Model Garden

Blader, vergelijk, deploy

Meer dan 390 serveerbare open modellen met live status.

/models
Qwen3 8BwarmEU
Llama 3.3 70BwarmEU
Mistral SmallEU
DeepSeek R1opwarmenEU
Gemma 3 27BEU
FLUX.1 schnellwarmEU
Phi 4 MiniEU
Qwen2.5 32BEU
Playground

Test elk model direct

Chat met elk model voordat je één regel code schrijft.

qwen3-8b · streaming · EU
Vat ons retourbeleid samen in twee zinnen.
Retouren worden binnen 14 dagen na aanvraag verwerkt. Artikelen moeten ongebruikt en met de originele bon retour komen.
En wat geldt er voor afgeprijsde artikelen?
Afgeprijsde artikelen kun je binnen dezelfde termijn ruilen.
Activity

Volg elk verzoek

Verbruik, latency en kosten per verzoek in je activity-log.

Verzoeken deze weeklatency · kosten
qwen3-8b412 ms
llama-3.3-70b890 ms
mistral-small365 ms
gemma-3-27b508 ms
deepseek-r11240 ms
Platform

Alles wat je nodig hebt om te shippen

Van je eerste verzoek tot productieverkeer krijg je elk model, elk endpoint en elk inzicht dat je team nodig heeft op één plek.

EU Inference Router

Eén API. Elk open model.

Een gedeelde OpenAI-compatibele gateway die je verzoeken naar open modellen op Europese GPU's stuurt.

OpenAI-compatibele API
Automatische routing naar EU-GPU-instances
Anthropic SDK drop-in
Verbruik en activity-log per verzoek
Optionele RAG-context injectie
Ontdek de Router
EU Inference Router
Inkomend /v1/chat-verzoek
Authenticatie hyai- API-key
Kies de dichtstbijzijnde warme instance
vLLM streamt het antwoord
if (instance.warm === true)
TrueDirect serveren
FalseOpwarmen, dan routeren
qwen3-8b vLLM klaar
NVIDIA A100 · 40GB · Europese GPU-marketplace · EU-regio
VRAM19.2 / 40 GB
GPU-gebruik71%
42 ms
time-to-first-token
128
tokens / sec
62°C
temperatuur
POST /api/v1/chat/completions200 OK
Dedicated Instances

Jouw eigen GPU, jouw eigen model.

Deploy LLM's (Llama, Qwen, DeepSeek) en beeldmodellen (FLUX, SDXL) op dedicated GPU's met vLLM. Binnen minuten klaar.

Elk HuggingFace-model op ID
vLLM op Europese GPU-marketplaces
Automatisch gegenereerde setup-scripts
Warm bij aanwezigheid, idle bij inactiviteit
Privé, versleutelde upstream-keys
Ingebouwde readiness-probes
Deploy een instance
Model Garden

Blader, vergelijk, deploy.

Een gecureerde catalogus van serveerbare open modellen met live warm, EU en opwarmende status. Je weet altijd wat klaarstaat.

Gecureerde, serveerbare catalogus
Live warm / EU / opwarmende status
Landingspagina per model
Geverifieerd voordat je bouwt
Playground om direct te testen
Beeld- en chatmodellen op één plek
Ontdek de Model Garden
Model Garden
Chatmodellen
Beeldmodellen
Embeddings
Nu warm
Qwen3-8B
Llama-3.2-1B
Gemma-2-9B
Recent toegevoegd
DeepSeek-V3
FLUX.1-schnell
Serveerbaar
SDXL-Turbo
Phi-3-mini
Hoe het werkt

Van nul naar een warm endpoint in minuten

Geen infra om te beheren. Kies een model, krijg een OpenAI-compatibele URL, ship.

01Kies een model

Kies uit de Model Garden of plak een HuggingFace-ID

Stel de VRAM in en kies een Europese GPU. Meer dan 390 geverifieerde open modellen staan klaar.

02Krijg je endpoint

Wij deployen vLLM en draaien readiness-probes

Je krijgt een warme OpenAI- en Anthropic-compatibele URL plus een API-key. Geen DevOps aan jouw kant.

03Route en ship

Richt je client op de Router

Die routeert automatisch naar een warme instance en spreekt de OpenAI- en de Anthropic-API. Alleen de base-URL verandert.

04Volg en schaal

Elk verzoek gelogd, GPU's idle bij inactiviteit

Je ziet per verzoek verbruik, latency en kosten. Instances idlen automatisch als niemand online is, dus je betaalt alleen wat je draait.

Features

Alles wat je nodig hebt voor AI

Van model-hosting tot een klantgerichte API, gebouwd voor developers en bedrijven die hun AI binnen de EU willen draaien.

OpenAI-compatibel endpoint

Drop-in vervanging voor de OpenAI SDK. Alleen de base-URL verandert.

POST /api/v1/chat/completions

Anthropic Messages drop-in

Ook je Anthropic SDK werkt direct, inclusief x-api-key auth.

POST /api/v1/messages

Streaming responses

Token voor token terug naar je app, net zoals je gewend bent.

stream: true

Eigen API-keys

Maak keys aan met het hyai-voorvoegsel en beheer ze per project.

Authorization: Bearer hyai-...

390+ modellen catalogus

Llama, Qwen, Mistral, DeepSeek en Gemma, gecureerd en geverifieerd.

hostyourai.com/models

Warm-pool

Er staat altijd een warm model klaar, dus je eerste verzoek wacht niet.

status: warm

Scale to zero

Instances idlen bij inactiviteit, zodat je alleen betaalt wat je draait.

idle bij inactiviteit

Per-request activity log

Verbruik, latency en kosten voor elk verzoek, live in je dashboard.

GET /router/traces

RAG-context injectie

Koppel optioneel een kennisbank en de Router injecteert context automatisch.

knowledge_base_id: 42

Elk HuggingFace-model

Plak een repo-ID en deploy je eigen of fine-tuned model op een EU-GPU.

org/model-naam

Readiness-probes

Elke deploy wordt automatisch gezond getest voordat je er verkeer op zet.

GET /health

Embedding-modellen

Serveer embeddings vanaf dezelfde stack, voor zoeken en RAG.

POST /api/v1/embeddings

Beeldmodellen

FLUX en SDXL op dedicated GPU's, naast je chatmodellen.

FLUX · SDXL

Eén prepaid saldo

Opwaarderen met iDEAL, kaart of SEPA. Geen abonnement, geen minimum.

pay-as-you-go

Playground

Probeer elk model in de browser voordat je hem in je app zet.

?model=qwen3-8b
Voor wie

Gebouwd voor teams die data niet mogen wegsturen

Als een Amerikaanse cloud geen optie is, geeft HostYourAI je dezelfde developer-ervaring op Europese infrastructuur.

Klassiek overheidsgebouw met zuilen Publieke sector

Overheid & publieke sector

Burgerdata die wettelijk in de EU moet blijven, volledig auditeerbaar.

Zorg

Patiëntdata blijft binnen de EU, op infrastructuur met een DPA en een openbare subprocessorlijst.

Gereguleerde enterprise

Finance-, zorg- en juridische teams onder GDPR, DORA en de AI Act.

EU SaaS & scale-ups

Lever AI-functies waar je klanten op vertrouwen, zonder Amerikaanse sub-processor.

Agencies & integrators

Lever privé-AI voor klanten op infrastructuur waar je achter kunt staan.

Finance & legal

Open modellen die je kunt auditen, in plaats van een gesloten black box.

Rij Europese vlaggen voor een EU-gebouw Soevereiniteit

Geen Amerikaanse cloud in de keten

Alle inference draait op Europese GPU's. Geen US CLOUD Act-blootstelling, geen data die de EU verlaat.

Beveiliging

Privé vanaf de basis

HostYourAI houdt je modellen, prompts en data op Europese GPU's. Gebouwd voor teams die geven om compliance, betrouwbaarheid en echte controle.

GDPR-proof DPA beschikbaar AES-256 at rest TLS in transit 99.9% uptime SLA Europese datacenters

EU-dataresidentie

Prompts en outputs verlaten de EU nooit. Alle inference draait in Europese datacenters.

Encryptie overal

AES-256 voor data at rest en TLS voor al het verkeer onderweg.

Geen training op klantdata

Je prompts en outputs worden nooit gebruikt om modellen te trainen.

DPA en subprocessors

Een verwerkersovereenkomst is beschikbaar en de subprocessorlijst is openbaar.

99.9% uptime SLA

Met een publieke statuspagina, zodat je altijd ziet wat er warm staat.

Guides

Zelf aan de slag met de Router

Praktische stappen om te migreren, te deployen en te bouwen op EU-GPU's.

Host. Route. Ship.

Betaal naar gebruik en stop wanneer je wilt. Geen abonnement, geen minimum.