Eén endpoint voor elk open model, afgerekend per token. Gebruik het via gewone HTTP, of met de OpenAI- of Anthropic-SDK die je al hebt. Eigen machine nodig? Start in een paar minuten een dedicated GPU. Elk model testen we zelf op onze eigen hardware, en alles draait in Europa.
from openai import OpenAI
client = OpenAI(
base_url="https://api.hostyour.ai/v1",
api_key="hyai_..."
)
response = client.chat.completions.create(
model="llama-3.2-70b",
messages=[{"role": "user", "content": "Hallo!"}]
)
Vertrouwd door teams bij
Van registratie tot een live AI pipeline in vier stappen.
Gratis registreren met je e-mail. Geen creditcard nodig.
Genereer in seconden een Router-key. Het is één drop-in endpoint voor elk model.
Gebruik een Router-model en betaal per token, laat hyai/auto kiezen, of deploy een dedicated GPU-instance.
Richt je bestaande OpenAI-SDK op onze base URL en je bent live. Verder hoef je niets te veranderen.
Een gedeelde Router die je OpenAI-SDK vervangt, plus dedicated GPU-instances. We tonen alleen modellen die we zelf hebben gedraaid en getest.
Eén endpoint die zo je OpenAI-SDK invult, afgerekend per token. Open-weight modellen draaien op vLLM in de EU, zonder afhankelijkheid van Amerikaanse clouds.
Een single-tenant vLLM-server op je eigen GPU. Geen gedeelde resources, geen rate limits van anderen, en binnen minuten klaar.
Houd de OpenAI- of Anthropic-SDK die je al gebruikt. Richt hem op onze base URL, wissel het model, en je bent klaar. Geen nieuwe client, geen herschrijving.
Elke week starten en testen we elk model op onze eigen hardware, zodat je alleen de modellen ziet die echt werken.
Europese datacenters, end-to-end encryptie en volledige data-soevereiniteit. Je data verlaat de EU nooit.
We trainen een soeverein Nederlands model in de EU, op schone publieke data, in het openbaar gebouwd.
De Router is een gedeelde inference-gateway die zo je OpenAI- of Anthropic-SDK vervangt. Richt hem op één base URL, kies een model (of laat hyai/auto voor je kiezen) en betaal alleen per token. Elk model draait open-weight op vLLM binnen de EU. Hij warmt op wanneer je hem nodig hebt en schaalt terug naar nul als het stil is.
Elke instance is een dedicated AI-model dat draait op een eigen GPU. Kies uit 100+ tekstmodellen of beeldgeneratiemodellen zoals FLUX en SDXL, selecteer je Europese regio, en deploy met één klik. Je kunt ook elk custom HuggingFace-model deployen. Je krijgt een privé OpenAI-compatible API endpoint zonder gedeelde resources en zonder rate limits van anderen.
Liever je eigen key van OpenAI, Groq of een andere provider gebruiken? Koppel hem in seconden en krijg hetzelfde OpenAI-compatibele endpoint, in de EU, zonder GPU om te beheren en zonder platformkosten.
Test onze OpenAI-compatible API direct in je browser. Zelfde interface, jouw eigen infrastructuur.
curl https://api.hostyour.ai/v1/chat/completions \
-H "Authorization: Bearer hyai_..." \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-r1-distill-llama-70b",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "What is the capital of the Netherlands?"}
],
"temperature": 0.7,
"max_tokens": 1024
}'
Van Llama tot FLUX. Deploy tekst- of beeldgeneratiemodellen met één klik, of breng je eigen HuggingFace-model mee.
Geen CUDA drivers, geen Docker, geen ML ops. Wij zorgen dat je model optimaal draait. Werkt voor tekst- en beeldmodellen.
Model niet in de lijst? Deploy elk HuggingFace-model direct. Vul het model ID en vereiste VRAM in.
Volledige data-soevereiniteit. Geen Amerikaanse cloud, geen CLOUD Act, geen zorgen.
Amsterdam, Frankfurt, Parijs, Helsinki
Volledige naleving van EU privacywetgeving
Buiten bereik van Amerikaanse wetgeving
Jouw model op eigen GPU, geen sharing
Geen vendor lock-in, geen onverwachte prijsverhogingen, geen content policies die jou beperken, geen data die gebruikt wordt voor training. Open-source modellen, Europese infrastructuur.
Teams in heel Europa bouwen met HostYourAI.
"Eindelijk een platform waar we niet zelf GPU's hoeven te beheren. Deploy in 10 minuten, OpenAI-compatible API, en alles draait in de EU."
"We zijn overgestapt van AWS Bedrock. De kosten zijn 40% lager en we hebben nu volledige controle over welk model we draaien."
"Voor ons onderzoek was GDPR-compliance essentieel. HostYourAI biedt dedicated instances in Amsterdam met volledige data-soevereiniteit."
Pay as you go. Per token op de Router, per uur voor een dedicated GPU. BYOK is gratis.
Eén OpenAI-compatibel endpoint, afgerekend per token. Schaalt naar nul als er niets draait.
Account aanmakenJe eigen vLLM-instance op een eigen GPU in de EU. Start, stop en schaal wanneer je wilt.
Account aanmakenBYOK (je eigen API-key) is gratis. Opwaarderen met iDEAL, creditcard of SEPA, geen abonnement.
Enterprise nodig? Neem contact op
Kies een model, wijs je code naar ons endpoint, en je bent live. In een paar minuten klaar.