NL EN Demo boeken Inloggen Aan de slag

Product

EU Router OpenAI-compatible API Anthropic-compatible API Model Garden Dedicated Instances Playground Fine-tuning (Loes)

Oplossingen

Use cases

LLM Inference RAG pipelines Chatbots AI agents Fine-tuning

Sectoren

Overheid Zorg Finance Juridisch

Modellen

Llama 3.3 70B Mistral DeepSeek R1 Qwen 2.5 72B Gemma 2 27B Codestral 22B Alle modellen →

Vergelijk

Azure OpenAI AWS Bedrock Claude API ChatGPT OpenAI

Resources

Documentatie Gids: migreren naar de EU Router Gids: eigen LLM deployen (vLLM)Gids: RAG bouwen op EU-GPUs Modelcatalogus

Bedrijf

Over ons Beveiliging Verwerkersovereenkomst Privacybeleid Voorwaarden Contact

Prijzen

Inloggen Aan de slag

GPU & infra

Dedicated GPU Instances

Je eigen GPU, je eigen model: deploy open modellen op dedicated Europese GPUs.

Gratis starten Model Garden

qwen3-8b vLLM ready

NVIDIA A100 · 40GB · Vast.ai · eu-central

VRAM19.2 / 40 GB

GPU utilisation71%

42 ms

time-to-first-token

128

tokens / sec

62°C

temperature

POST /api/v1/chat/completions200 OK

Je eigen GPU, je eigen model

Met dedicated instances draai je een open model op een GPU die alleen voor jou is. We deployen vLLM, draaien readiness-probes en geven je een OpenAI- en Anthropic-compatibele URL. Ideaal als je voorspelbare performance of volledige isolatie wilt.

pythoncurljs

from openai import OpenAI
client = OpenAI(
    base_url="https://api.hostyour.ai/v1",
    api_key="hyai_...")
client.chat.completions.create(
    model="llama-3.3-70b",
    messages=[{"role":"user","content":"Hallo!"}])

Hoe het werkt

Kies een model uit de Model Garden of een HuggingFace-ID
Stel de VRAM in en kies een Europese GPU
Wij deployen vLLM en draaien automatische readiness-probes
Je krijgt een warm endpoint plus API-key

Nieuwe instances draaien vLLM met een eigen, versleutelde upstream-key, zodat je endpoint privé is.

One-click deployment

OpenAI-compatible API

4 EU datacenters

End-to-end encryptie

Dedicated GPU instances

Audit logging

Betaal alleen voor wat je draait

Instances blijven warm terwijl iemand online is en idlen wanneer niemand ze gebruikt, zodat je niet voor een ongebruikte GPU betaalt. Reken af per uur via één prepaid creditsaldo.

je vraag

doc-4f2a0.94

doc-9c1e0.91

doc-2b770.88

Alles wat je nodig hebt voor AI

Van model-hosting tot een klantgerichte API, gebouwd voor developers en bedrijven die hun AI op infrastructuur willen draaien die ze echt beheren, binnen de EU.

100%

EU-gehost

Je data en je modellen blijven op Europese GPUs. GDPR-vriendelijk vanaf de basis.

200+

Geverifieerde modellen, klaar om te serveren

Llama, Qwen, DeepSeek, Mistral, FLUX en nog veel meer. Kies er een en hij is binnen minuten warm, zonder DevOps aan jouw kant.

2 SDK

OpenAI- en Anthropic-compatibel

Richt je bestaande client op de Router en behoud je tools. Geen herschrijven, geen lock-in.

Van nul naar een warm endpoint in minuten

Geen infra om te beheren. Kies een model, krijg een OpenAI-compatibele URL, ship.

Kies een model

Kies uit de Model Garden of plak een willekeurig HuggingFace-ID. Stel de VRAM in en kies een EU-GPU.

Krijg je endpoint

Wij deployen vLLM, draaien readiness-probes en geven je een warme OpenAI- en Anthropic-compatibele URL plus een API-key.

Route en ship

Richt je client op de Router. Die routeert automatisch naar een warme instance, zet GPUs idle als niemand online is en logt elk verzoek.

Werkt met de tools die je al gebruikt

De Router spreekt de OpenAI- en Anthropic-API, dus hij past direct in de clients en SDKs die je team al draait. Verander alleen de base-URL.

Probeer HostYourAI gratis

Gebouwd voor teams die data niet mogen wegsturen

Als een Amerikaanse cloud geen optie is, geeft HostYourAI je dezelfde developer-ervaring op Europese infrastructuur.

Overheid & publieke sector

Burgerdata die wettelijk in de EU moet blijven, volledig auditeerbaar.

Gereguleerde enterprise

Finance-, zorg- en juridische teams onder GDPR, DORA en de AI Act.

EU SaaS & scale-ups

Lever AI-functies waar je klanten op vertrouwen, zonder Amerikaanse sub-processor.

Agencies & integrators

Lever privé-AI voor klanten op infrastructuur waar je achter kunt staan.

Veelgestelde vragen

Kan ik dit in de EU draaien?

Ja. HostYourAI draait open modellen op GPU's in Europese datacenters via vLLM. Je prompts en outputs verlaten de EU niet en er zit geen Amerikaanse cloudprovider in de keten.

Is het AVG/GDPR-compliant?

Ja. Alle verwerking gebeurt binnen de EU, er is een verwerkersovereenkomst (DPA) beschikbaar en de subprocessor-lijst is openbaar. Open gewichten betekenen ook: geen training op jouw data.

Is de API compatibel met OpenAI?

Ja. Je richt je bestaande OpenAI- of Anthropic-client op onze Router (https://hostyourai.com/api/v1) — alleen de base-URL en API-key wijzigen. Geen rewrite, geen lock-in.

Wat kost het?

Pay-as-you-go met één prepaid creditsaldo: de gedeelde router per token of een dedicated GPU per uur. Gratis te starten, geen minimum, geen vaste maandkosten.

Model garden

Werkt met 100+ open modellen

Tekst- en beeldmodellen op dedicated EU GPU's. Elk model getest op onze eigen hardware.

Llama 3.3 70B DeepSeek R1 Qwen 2.5 72B Mistral 7B Mixtral 8x22B Gemma 2 27B DeepSeek Coder Qwen Coder 32B CodeLlama 34B Command R+ Alle modellen bekijken →

Host. Route. Ship.

Geen creditcard nodig. Betaal naar gebruik, stop wanneer je wilt.

Begin vandaag gratis met hosten