Eén centrale LLM-router voor elk open model, afgerekend per token. Roep hem aan via gewone HTTP, of zet hem in de OpenAI- of Anthropic-SDK die je al gebruikt. Isolatie nodig? Start een dedicated GPU-instance. Elk model testen we op onze eigen hardware, en alles draait in Europa.
from openai import OpenAI
client = OpenAI(
base_url="https://api.hostyour.ai/v1",
api_key="hyai_..."
)
response = client.chat.completions.create(
model="llama-3.2-70b",
messages=[{"role": "user", "content": "Hallo!"}]
)
Vertrouwd door teams bij
Van registratie tot een live AI pipeline in vier stappen.
Gratis registreren met je e-mail. Geen creditcard nodig.
Genereer in seconden een Router-key. Het is één drop-in endpoint voor elk model.
Gebruik een Router-model en betaal per token, laat hyai/auto kiezen, of deploy een dedicated GPU-instance.
Richt je bestaande OpenAI-SDK op onze base URL en je bent live. Verder hoef je niets te veranderen.
Een gedeelde Router die je OpenAI-SDK vervangt, plus dedicated GPU-instances. We tonen alleen modellen die we zelf hebben gedraaid en getest.
Eén endpoint die zo je OpenAI-SDK invult, afgerekend per token. Open-weight modellen draaien op vLLM in de EU, zonder afhankelijkheid van Amerikaanse clouds.
Een single-tenant vLLM-server op je eigen GPU. Geen gedeelde resources, geen rate limits van anderen, en binnen minuten klaar.
Houd de OpenAI- of Anthropic-SDK die je al gebruikt. Richt hem op onze base URL, wissel het model, en je bent klaar. Geen nieuwe client, geen herschrijving.
Elke week starten en testen we elk model op onze eigen hardware, zodat je alleen de modellen ziet die echt werken.
Europese datacenters, end-to-end encryptie en volledige data-soevereiniteit. Je data verlaat de EU nooit.
Probeer elk model direct in je browser en neem daarna je team mee met rolgebaseerde toegang.
De Router is een gedeelde inference-gateway die zo je OpenAI- of Anthropic-SDK vervangt. Richt hem op één base URL, kies een model (of laat hyai/auto voor je kiezen) en betaal alleen per token. Elk model draait open-weight op vLLM binnen de EU. Hij warmt op wanneer je hem nodig hebt en schaalt terug naar nul als het stil is.
Elke instance is een dedicated AI-model dat draait op een eigen GPU. Kies uit 100+ tekstmodellen of beeldgeneratiemodellen zoals FLUX en SDXL, selecteer je Europese regio, en deploy met één klik. Je kunt ook elk custom HuggingFace-model deployen. Je krijgt een privé OpenAI-compatible API endpoint zonder gedeelde resources en zonder rate limits van anderen.
Liever je eigen key van OpenAI, Groq of een andere provider gebruiken? Koppel hem in seconden en krijg hetzelfde proxy endpoint, kennisbank, chatbots en alle andere features. Geen GPU nodig.
Nodig collega's uit in je workspace en werk samen aan AI-projecten. Deel instances, kennisbanken en bots met je team. Elk lid krijgt een rol (admin of member) zodat je bepaalt wie kan deployen, bewerken, of alleen bekijken.
Test onze OpenAI-compatible API direct in je browser. Zelfde interface, jouw eigen infrastructuur.
curl https://api.hostyour.ai/v1/chat/completions \
-H "Authorization: Bearer hyai_..." \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-r1-distill-llama-70b",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "What is the capital of the Netherlands?"}
],
"temperature": 0.7,
"max_tokens": 1024
}'
Van Llama tot FLUX. Deploy tekst- of beeldgeneratiemodellen met één klik, of breng je eigen HuggingFace-model mee.
Geen CUDA drivers, geen Docker, geen ML ops. Wij zorgen dat je model optimaal draait. Werkt voor tekst- en beeldmodellen.
Model niet in de lijst? Deploy elk HuggingFace-model direct. Vul het model ID en vereiste VRAM in.
Volledige data-soevereiniteit. Geen Amerikaanse cloud, geen CLOUD Act, geen zorgen.
Amsterdam, Frankfurt, Parijs, Helsinki
Volledige naleving van EU privacywetgeving
Buiten bereik van Amerikaanse wetgeving
Jouw model op eigen GPU, geen sharing
Geen vendor lock-in, geen onverwachte prijsverhogingen, geen content policies die jou beperken, geen data die gebruikt wordt voor training. Open-source modellen, Europese infrastructuur.
Teams in heel Europa bouwen met HostYourAI.
"Eindelijk een platform waar we niet zelf GPU's hoeven te beheren. Deploy in 10 minuten, OpenAI-compatible API, en alles draait in de EU."
"We zijn overgestapt van AWS Bedrock. De kosten zijn 40% lager en we hebben nu volledige controle over welk model we draaien."
"Voor ons onderzoek was GDPR-compliance essentieel. HostYourAI biedt dedicated instances in Amsterdam met volledige data-soevereiniteit."
GPU instances pay-as-you-go. BYOK is gratis.
Enterprise nodig? Neem contact op
Koppel je data, deploy je model, en ga live. Binnen minuten operationeel.