De EU LLM-router

Jouw AI. Jouw Infra. In Europa.

Eén centrale LLM-router voor elk open model, afgerekend per token. Roep hem aan via gewone HTTP, of zet hem in de OpenAI- of Anthropic-SDK die je al gebruikt. Isolatie nodig? Start een dedicated GPU-instance. Elk model testen we op onze eigen hardware, en alles draait in Europa.

main.py
from openai import OpenAI

client = OpenAI(
    base_url="https://api.hostyour.ai/v1",
    api_key="hyai_..."
)

response = client.chat.completions.create(
    model="llama-3.2-70b",
    messages=[{"role": "user", "content": "Hallo!"}]
)

Vertrouwd door teams bij

Rijksuniversiteit Groningen Hanzehogeschool Provincie Drenthe Frisius AI Jumbo
4 simpele stappen

Hoe het werkt

Van registratie tot een live AI pipeline in vier stappen.

1

Maak een account

Gratis registreren met je e-mail. Geen creditcard nodig.

2

Maak een API key

Genereer in seconden een Router-key. Het is één drop-in endpoint voor elk model.

3

Kies een model

Gebruik een Router-model en betaal per token, laat hyai/auto kiezen, of deploy een dedicated GPU-instance.

Ga live

Richt je bestaande OpenAI-SDK op onze base URL en je bent live. Verder hoef je niets te veranderen.

zsh · python
$ pip install openai
Successfully installed openai-1.x
$ python
>>> from openai import OpenAI
>>> client = OpenAI(
... base_url="https://api.hostyour.ai/v1"
... )
>>> response = client.chat.completions.create(
... model="llama-3.3-70b",
... messages=[{"role": "user", "content": "Hi!"}]
... )
>>> print(response.choices[0].message.content)
"Hallo! Waar kan ik je mee helpen?"
Features

Open-weight LLM's, gehost in Europa

Een gedeelde Router die je OpenAI-SDK vervangt, plus dedicated GPU-instances. We tonen alleen modellen die we zelf hebben gedraaid en getest.

EU Inference Router

Eén endpoint die zo je OpenAI-SDK invult, afgerekend per token. Open-weight modellen draaien op vLLM in de EU, zonder afhankelijkheid van Amerikaanse clouds.

Dedicated GPU-instances

Een single-tenant vLLM-server op je eigen GPU. Geen gedeelde resources, geen rate limits van anderen, en binnen minuten klaar.

Drop-in voor OpenAI & Anthropic

Houd de OpenAI- of Anthropic-SDK die je al gebruikt. Richt hem op onze base URL, wissel het model, en je bent klaar. Geen nieuwe client, geen herschrijving.

Geverifieerde Model Garden

Elke week starten en testen we elk model op onze eigen hardware, zodat je alleen de modellen ziet die echt werken.

EU gehost & GDPR

Europese datacenters, end-to-end encryptie en volledige data-soevereiniteit. Je data verlaat de EU nooit.

Playground & teams

Probeer elk model direct in je browser en neem daarna je team mee met rolgebaseerde toegang.

Router

Eén endpoint voor elk open model

De Router is een gedeelde inference-gateway die zo je OpenAI- of Anthropic-SDK vervangt. Richt hem op één base URL, kies een model (of laat hyai/auto voor je kiezen) en betaal alleen per token. Elk model draait open-weight op vLLM binnen de EU. Hij warmt op wanneer je hem nodig hebt en schaalt terug naar nul als het stil is.

  • Een echte drop-in voor de OpenAI- en Anthropic-SDK: wijzig één base URL en je bent live
  • hyai/auto kiest het best beschikbare model voor elk verzoek
  • Betaal per token, zonder idle GPU-kosten. Schaalt naar nul als er niets draait
  • Open-weight modellen op vLLM, allemaal gehost in de EU
POST /v1/chat/completions
{ "model": "hyai/auto",
"messages": [ … ] }
Doorgestuurd naar
llama-3.3-70b warmEU
qwen-2.5-72b warmEU
mistral-small opwarmenEU
Instances

Je eigen AI-instance

Elke instance is een dedicated AI-model dat draait op een eigen GPU. Kies uit 100+ tekstmodellen of beeldgeneratiemodellen zoals FLUX en SDXL, selecteer je Europese regio, en deploy met één klik. Je kunt ook elk custom HuggingFace-model deployen. Je krijgt een privé OpenAI-compatible API endpoint zonder gedeelde resources en zonder rate limits van anderen.

  • Tekstgeneratie (Llama, Qwen, DeepSeek) en beeldgeneratie (FLUX, SDXL) op dedicated GPU's
  • Deploy elk custom HuggingFace-model of kies uit onze gecureerde lijst
  • OpenAI-compatible API endpoint klaar in ~10 minuten, werkt met elke SDK
  • Start, stop en schaal on demand. Betaal alleen wanneer het draait
Al een API key?

Liever je eigen key van OpenAI, Groq of een andere provider gebruiken? Koppel hem in seconden en krijg hetzelfde proxy endpoint, kennisbank, chatbots en alle andere features. Geen GPU nodig.

OpenAI Groq Mistral DeepSeek Together Custom
Instances
DeepSeek R1 70B
A100 80GB · Amsterdam
running
Llama 3.3 70B
A100 80GB · Frankfurt
running
FLUX.1 Schnell IMAGE
RTX 4090 · Amsterdam
running
gpt-4o-mini BYOK
OpenAI · eigen key
running
Qwen 2.5 72B
H100 80GB · Helsinki
stopped
3 actief · 1 gestopt
+ Nieuwe instance
Team: Engineering
MV
Martijn de Vries
martijn@company.com
admin
SB
Sophie Bakker
sophie@company.com
member
JK
Jan Koster
jan@company.com
member
3 instances
2 kennisbanken
+ Uitnodigen
Teams

Werk samen met je team

Nodig collega's uit in je workspace en werk samen aan AI-projecten. Deel instances, kennisbanken en bots met je team. Elk lid krijgt een rol (admin of member) zodat je bepaalt wie kan deployen, bewerken, of alleen bekijken.

  • Nodig teamleden uit per e-mail. Ze doen direct mee met één klik
  • Deel instances, kennisbanken en bots binnen het team
  • Rolgebaseerde toegang: admin (volledige controle) of member (gebruik & bekijk)
Probeer het live

API Playground

Test onze OpenAI-compatible API direct in je browser. Zelfde interface, jouw eigen infrastructuur.

curl https://api.hostyour.ai/v1/chat/completions \
  -H "Authorization: Bearer hyai_..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-r1-distill-llama-70b",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "What is the capital of the Netherlands?"}
    ],
    "temperature": 0.7,
    "max_tokens": 1024
  }'
Playground
U
User
What is the capital of the Netherlands?
AI
DeepSeek R1 127 tokens · 342ms
The capital of the Netherlands is Amsterdam. However, The Hague (Den Haag) is the seat of government where the parliament is located.
Type your message...
100%
OpenAI Compatible
<100ms
Time to first token
0
Code changes nodig
100+ modellen

Tekst & Beeldmodellen

Van Llama tot FLUX. Deploy tekst- of beeldgeneratiemodellen met één klik, of breng je eigen HuggingFace-model mee.

DeepSeek R1 32B
DeepSeek R1 70B
DeepSeek R1 7B
DeepSeek Coder V2
Qwen 2.5 72B
Qwen 2.5 32B
Qwen Coder 32B
Llama 3.3 70B
Llama 3.1 70B
Llama 3.1 8B
Mixtral 8x22B
Mixtral 8x7B
Mistral Small 22B
Mistral Nemo 12B
Mistral 7B
Codestral 22B
Gemma 2 27B
Gemma 2 9B
Phi 3.5 MoE
Phi 3 Medium
CodeLlama 70B
CodeLlama 34B
StarCoder2 15B
Command R+
Command R
Yi 1.5 34B
InternLM 2.5 20B
Vicuna 13B
FLUX.1 Schnell
SDXL 1.0
FLUX.1 Dev
SD 3.5 Medium
+ 50 meer

Wij richten je GPU in

Geen CUDA drivers, geen Docker, geen ML ops. Wij zorgen dat je model optimaal draait. Werkt voor tekst- en beeldmodellen.

Custom HuggingFace Modellen

Model niet in de lijst? Deploy elk HuggingFace-model direct. Vul het model ID en vereiste VRAM in.

0
DevOps nodig
100+
AI modellen
6
Providers (BYOK)
4
EU datacenters
EU Soeverein

Jouw data, veilig in Europa

Volledige data-soevereiniteit. Geen Amerikaanse cloud, geen CLOUD Act, geen zorgen.

EU Datacenters

Amsterdam, Frankfurt, Parijs, Helsinki

GDPR Compliant

Volledige naleving van EU privacywetgeving

Geen CLOUD Act

Buiten bereik van Amerikaanse wetgeving

Dedicated Hardware

Jouw model op eigen GPU, geen sharing

GDPR

Geen vendor lock-in, geen onverwachte prijsverhogingen, geen content policies die jou beperken, geen data die gebruikt wordt voor training. Open-source modellen, Europese infrastructuur.

Testimonials

Wat onze klanten zeggen

Teams in heel Europa bouwen met HostYourAI.

"Eindelijk een platform waar we niet zelf GPU's hoeven te beheren. Deploy in 10 minuten, OpenAI-compatible API, en alles draait in de EU."

MV
Martijn de Vries
CTO, DataFlow AI

"We zijn overgestapt van AWS Bedrock. De kosten zijn 40% lager en we hebben nu volledige controle over welk model we draaien."

SB
Sophie Bakker
Lead Developer, TechNL

"Voor ons onderzoek was GDPR-compliance essentieel. HostYourAI biedt dedicated instances in Amsterdam met volledige data-soevereiniteit."

JK
Dr. Jan Koster
AI Researcher, RUG
Prijzen

Simpel en transparant

GPU instances pay-as-you-go. BYOK is gratis.

Pay as you go
Credits voor GPU instances. BYOK zonder platformkosten
Vanaf €0,10 /uur
GPU prijs varieert per type • BYOK instances zijn gratis
  • GPU deploy of koppel je eigen API key
  • Alle modellen, agents & kennisbanken
  • Waardeer op met iDEAL of creditcard
  • Teams, workflows & templates inbegrepen
Account aanmaken

Enterprise nodig? Neem contact op

Klaar om je AI-pipeline te bouwen?

Koppel je data, deploy je model, en ga live. Binnen minuten operationeel.