De EU LLM-router

Jouw AI. Jouw Infra. In Europa.

Eén endpoint voor elk open model, afgerekend per token. Gebruik het via gewone HTTP, of met de OpenAI- of Anthropic-SDK die je al hebt. Eigen machine nodig? Start in een paar minuten een dedicated GPU. Elk model testen we zelf op onze eigen hardware, en alles draait in Europa.

main.py
from openai import OpenAI

client = OpenAI(
    base_url="https://api.hostyour.ai/v1",
    api_key="hyai_..."
)

response = client.chat.completions.create(
    model="llama-3.2-70b",
    messages=[{"role": "user", "content": "Hallo!"}]
)

Vertrouwd door teams bij

Rijksuniversiteit Groningen Hanzehogeschool Provincie Drenthe Frisius AI Jumbo
4 simpele stappen

Hoe het werkt

Van registratie tot een live AI pipeline in vier stappen.

1

Maak een account

Gratis registreren met je e-mail. Geen creditcard nodig.

2

Maak een API key

Genereer in seconden een Router-key. Het is één drop-in endpoint voor elk model.

3

Kies een model

Gebruik een Router-model en betaal per token, laat hyai/auto kiezen, of deploy een dedicated GPU-instance.

Ga live

Richt je bestaande OpenAI-SDK op onze base URL en je bent live. Verder hoef je niets te veranderen.

zsh · python
$ pip install openai
Successfully installed openai-1.x
$ python
>>> from openai import OpenAI
>>> client = OpenAI(
... base_url="https://api.hostyour.ai/v1"
... )
>>> response = client.chat.completions.create(
... model="llama-3.3-70b",
... messages=[{"role": "user", "content": "Hi!"}]
... )
>>> print(response.choices[0].message.content)
"Hallo! Waar kan ik je mee helpen?"
Features

Open-weight LLM's, gehost in Europa

Een gedeelde Router die je OpenAI-SDK vervangt, plus dedicated GPU-instances. We tonen alleen modellen die we zelf hebben gedraaid en getest.

EU Inference Router

Eén endpoint die zo je OpenAI-SDK invult, afgerekend per token. Open-weight modellen draaien op vLLM in de EU, zonder afhankelijkheid van Amerikaanse clouds.

Dedicated GPU-instances

Een single-tenant vLLM-server op je eigen GPU. Geen gedeelde resources, geen rate limits van anderen, en binnen minuten klaar.

Drop-in voor OpenAI & Anthropic

Houd de OpenAI- of Anthropic-SDK die je al gebruikt. Richt hem op onze base URL, wissel het model, en je bent klaar. Geen nieuwe client, geen herschrijving.

Geverifieerde Model Garden

Elke week starten en testen we elk model op onze eigen hardware, zodat je alleen de modellen ziet die echt werken.

EU gehost & GDPR

Europese datacenters, end-to-end encryptie en volledige data-soevereiniteit. Je data verlaat de EU nooit.

Loes, ons soevereine model

We trainen een soeverein Nederlands model in de EU, op schone publieke data, in het openbaar gebouwd.

Router

Eén endpoint voor elk open model

De Router is een gedeelde inference-gateway die zo je OpenAI- of Anthropic-SDK vervangt. Richt hem op één base URL, kies een model (of laat hyai/auto voor je kiezen) en betaal alleen per token. Elk model draait open-weight op vLLM binnen de EU. Hij warmt op wanneer je hem nodig hebt en schaalt terug naar nul als het stil is.

  • Een echte drop-in voor de OpenAI- en Anthropic-SDK: wijzig één base URL en je bent live
  • hyai/auto kiest het best beschikbare model voor elk verzoek
  • Betaal per token, zonder idle GPU-kosten. Schaalt naar nul als er niets draait
  • Open-weight modellen op vLLM, allemaal gehost in de EU
POST /v1/chat/completions
{ "model": "hyai/auto",
"messages": [ … ] }
Doorgestuurd naar
llama-3.3-70b warmEU
qwen-2.5-72b warmEU
mistral-small opwarmenEU
Instances

Je eigen AI-instance

Elke instance is een dedicated AI-model dat draait op een eigen GPU. Kies uit 100+ tekstmodellen of beeldgeneratiemodellen zoals FLUX en SDXL, selecteer je Europese regio, en deploy met één klik. Je kunt ook elk custom HuggingFace-model deployen. Je krijgt een privé OpenAI-compatible API endpoint zonder gedeelde resources en zonder rate limits van anderen.

  • Tekstgeneratie (Llama, Qwen, DeepSeek) en beeldgeneratie (FLUX, SDXL) op dedicated GPU's
  • Deploy elk custom HuggingFace-model of kies uit onze gecureerde lijst
  • OpenAI-compatible API endpoint klaar in ~10 minuten, werkt met elke SDK
  • Start, stop en schaal on demand. Betaal alleen wanneer het draait
Al een API key?

Liever je eigen key van OpenAI, Groq of een andere provider gebruiken? Koppel hem in seconden en krijg hetzelfde OpenAI-compatibele endpoint, in de EU, zonder GPU om te beheren en zonder platformkosten.

OpenAI Groq Mistral DeepSeek Together Custom
Instances
DeepSeek R1 70B
A100 80GB · Amsterdam
running
Llama 3.3 70B
A100 80GB · Frankfurt
running
FLUX.1 Schnell IMAGE
RTX 4090 · Amsterdam
running
gpt-4o-mini BYOK
OpenAI · eigen key
running
Qwen 2.5 72B
H100 80GB · Helsinki
stopped
3 actief · 1 gestopt
+ Nieuwe instance
Probeer het live

API Playground

Test onze OpenAI-compatible API direct in je browser. Zelfde interface, jouw eigen infrastructuur.

curl https://api.hostyour.ai/v1/chat/completions \
  -H "Authorization: Bearer hyai_..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-r1-distill-llama-70b",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "What is the capital of the Netherlands?"}
    ],
    "temperature": 0.7,
    "max_tokens": 1024
  }'
Playground
U
User
What is the capital of the Netherlands?
AI
DeepSeek R1 127 tokens · 342ms
The capital of the Netherlands is Amsterdam. However, The Hague (Den Haag) is the seat of government where the parliament is located.
Type your message...
100%
OpenAI Compatible
<100ms
Time to first token
0
Code changes nodig
100+ modellen

Tekst & Beeldmodellen

Van Llama tot FLUX. Deploy tekst- of beeldgeneratiemodellen met één klik, of breng je eigen HuggingFace-model mee.

DeepSeek R1 32B
DeepSeek R1 70B
DeepSeek R1 7B
DeepSeek Coder V2
Qwen 2.5 72B
Qwen 2.5 32B
Qwen Coder 32B
Llama 3.3 70B
Llama 3.1 70B
Llama 3.1 8B
Mixtral 8x22B
Mixtral 8x7B
Mistral Small 22B
Mistral Nemo 12B
Mistral 7B
Codestral 22B
Gemma 2 27B
Gemma 2 9B
Phi 3.5 MoE
Phi 3 Medium
CodeLlama 70B
CodeLlama 34B
StarCoder2 15B
Command R+
Command R
Yi 1.5 34B
InternLM 2.5 20B
Vicuna 13B
FLUX.1 Schnell
SDXL 1.0
FLUX.1 Dev
SD 3.5 Medium
+ 50 meer

Wij richten je GPU in

Geen CUDA drivers, geen Docker, geen ML ops. Wij zorgen dat je model optimaal draait. Werkt voor tekst- en beeldmodellen.

Custom HuggingFace Modellen

Model niet in de lijst? Deploy elk HuggingFace-model direct. Vul het model ID en vereiste VRAM in.

0
DevOps nodig
100+
AI modellen
6
Providers (BYOK)
4
EU datacenters
EU Soeverein

Jouw data, veilig in Europa

Volledige data-soevereiniteit. Geen Amerikaanse cloud, geen CLOUD Act, geen zorgen.

EU Datacenters

Amsterdam, Frankfurt, Parijs, Helsinki

GDPR Compliant

Volledige naleving van EU privacywetgeving

Geen CLOUD Act

Buiten bereik van Amerikaanse wetgeving

Dedicated Hardware

Jouw model op eigen GPU, geen sharing

GDPR

Geen vendor lock-in, geen onverwachte prijsverhogingen, geen content policies die jou beperken, geen data die gebruikt wordt voor training. Open-source modellen, Europese infrastructuur.

Testimonials

Wat onze klanten zeggen

Teams in heel Europa bouwen met HostYourAI.

"Eindelijk een platform waar we niet zelf GPU's hoeven te beheren. Deploy in 10 minuten, OpenAI-compatible API, en alles draait in de EU."

MV
Martijn de Vries
CTO, DataFlow AI

"We zijn overgestapt van AWS Bedrock. De kosten zijn 40% lager en we hebben nu volledige controle over welk model we draaien."

SB
Sophie Bakker
Lead Developer, TechNL

"Voor ons onderzoek was GDPR-compliance essentieel. HostYourAI biedt dedicated instances in Amsterdam met volledige data-soevereiniteit."

JK
Dr. Jan Koster
AI Researcher, RUG
Prijzen

Simpel en transparant

Pay as you go. Per token op de Router, per uur voor een dedicated GPU. BYOK is gratis.

Router
Vanaf €0,03 /M tokens

Eén OpenAI-compatibel endpoint, afgerekend per token. Schaalt naar nul als er niets draait.

Account aanmaken
Dedicated instance
Vanaf €0,10 /uur

Je eigen vLLM-instance op een eigen GPU in de EU. Start, stop en schaal wanneer je wilt.

Account aanmaken

BYOK (je eigen API-key) is gratis. Opwaarderen met iDEAL, creditcard of SEPA, geen abonnement.

Enterprise nodig? Neem contact op

Klaar om een model aan het werk te zetten?

Kies een model, wijs je code naar ons endpoint, en je bent live. In een paar minuten klaar.