4 simpele stappen

Hoe het werkt

Van registratie tot een live AI pipeline in vier stappen.

1

Maak een account

Gratis registreren met je e-mail. Geen creditcard nodig.

2

Maak een API key

Genereer in seconden een Router-key. Het is één drop-in endpoint voor elk model.

3

Kies een model

Gebruik een Router-model en betaal per token, laat hyai/auto kiezen, of deploy een dedicated GPU-instance.

Ga live

Richt je bestaande OpenAI-SDK op onze base URL en je bent live. Verder hoef je niets te veranderen.

zsh · python

$ pip install openai

Successfully installed openai-1.x

$ python

>>> from openai import OpenAI

>>> client = OpenAI(

... base_url="https://api.hostyour.ai/v1"

... )

>>> response = client.chat.completions.create(

... model="llama-3.3-70b",

... messages=[{"role": "user", "content": "Hi!"}]

... )

>>> print(response.choices[0].message.content)

"Hallo! Waar kan ik je mee helpen?"

Features

Open-weight LLM's, gehost in Europa

Een gedeelde Router die je OpenAI-SDK vervangt, plus dedicated GPU-instances. We tonen alleen modellen die we zelf hebben gedraaid en getest.

EU Inference Router

Eén endpoint die zo je OpenAI-SDK invult, afgerekend per token. Open-weight modellen draaien op vLLM in de EU, zonder afhankelijkheid van Amerikaanse clouds.

Dedicated GPU-instances

Een single-tenant vLLM-server op je eigen GPU. Geen gedeelde resources, geen rate limits van anderen, en binnen minuten klaar.

Drop-in voor OpenAI & Anthropic

Houd de OpenAI- of Anthropic-SDK die je al gebruikt. Richt hem op onze base URL, wissel het model, en je bent klaar. Geen nieuwe client, geen herschrijving.

Geverifieerde Model Garden

Elke week starten en testen we elk model op onze eigen hardware, zodat je alleen de modellen ziet die echt werken.

EU gehost & GDPR

Europese datacenters, end-to-end encryptie en volledige data-soevereiniteit. Je data verlaat de EU nooit.

Playground & teams

Probeer elk model direct in je browser en neem daarna je team mee met rolgebaseerde toegang.

Router

Eén endpoint voor elk open model

De Router is een gedeelde inference-gateway die zo je OpenAI- of Anthropic-SDK vervangt. Richt hem op één base URL, kies een model (of laat hyai/auto voor je kiezen) en betaal alleen per token. Elk model draait open-weight op vLLM binnen de EU. Hij warmt op wanneer je hem nodig hebt en schaalt terug naar nul als het stil is.

Een echte drop-in voor de OpenAI- en Anthropic-SDK: wijzig één base URL en je bent live
hyai/auto kiest het best beschikbare model voor elk verzoek
Betaal per token, zonder idle GPU-kosten. Schaalt naar nul als er niets draait
Open-weight modellen op vLLM, allemaal gehost in de EU

POST /v1/chat/completions

{ "model": "hyai/auto",

"messages": [ … ] }

Doorgestuurd naar

llama-3.3-70b warmEU

qwen-2.5-72b warmEU

mistral-small opwarmenEU

Instances

Je eigen AI-instance

Elke instance is een dedicated AI-model dat draait op een eigen GPU. Kies uit 100+ tekstmodellen of beeldgeneratiemodellen zoals FLUX en SDXL, selecteer je Europese regio, en deploy met één klik. Je kunt ook elk custom HuggingFace-model deployen. Je krijgt een privé OpenAI-compatible API endpoint zonder gedeelde resources en zonder rate limits van anderen.

Tekstgeneratie (Llama, Qwen, DeepSeek) en beeldgeneratie (FLUX, SDXL) op dedicated GPU's
Deploy elk custom HuggingFace-model of kies uit onze gecureerde lijst
OpenAI-compatible API endpoint klaar in ~10 minuten, werkt met elke SDK
Start, stop en schaal on demand. Betaal alleen wanneer het draait

Al een API key?

Liever je eigen key van OpenAI, Groq of een andere provider gebruiken? Koppel hem in seconden en krijg hetzelfde proxy endpoint, kennisbank, chatbots en alle andere features. Geen GPU nodig.

OpenAI Groq Mistral DeepSeek Together Custom

Instances

DeepSeek R1 70B

A100 80GB · Amsterdam

running

Llama 3.3 70B

A100 80GB · Frankfurt

running

FLUX.1 Schnell IMAGE

RTX 4090 · Amsterdam

running

gpt-4o-mini BYOK

OpenAI · eigen key

running

Qwen 2.5 72B

H100 80GB · Helsinki

stopped

3 actief · 1 gestopt

+ Nieuwe instance

Team: Engineering

MV

Martijn de Vries

martijn@company.com

admin

SB

Sophie Bakker

sophie@company.com

member

JK

Jan Koster

jan@company.com

member

3 instances

2 kennisbanken

+ Uitnodigen

Teams

Werk samen met je team

Nodig collega's uit in je workspace en werk samen aan AI-projecten. Deel instances, kennisbanken en bots met je team. Elk lid krijgt een rol (admin of member) zodat je bepaalt wie kan deployen, bewerken, of alleen bekijken.

Nodig teamleden uit per e-mail. Ze doen direct mee met één klik
Deel instances, kennisbanken en bots binnen het team
Rolgebaseerde toegang: admin (volledige controle) of member (gebruik & bekijk)

Probeer het live

API Playground

Test onze OpenAI-compatible API direct in je browser. Zelfde interface, jouw eigen infrastructuur.

curl https://api.hostyour.ai/v1/chat/completions \
  -H "Authorization: Bearer hyai_..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-r1-distill-llama-70b",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "What is the capital of the Netherlands?"}
    ],
    "temperature": 0.7,
    "max_tokens": 1024
  }'

from openai import OpenAI

client = OpenAI(
    base_url="https://api.hostyour.ai/v1",
    api_key="hyai_..."
)

response = client.chat.completions.create(
    model="deepseek-r1-distill-llama-70b",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "What is the capital of the Netherlands?"}
    ],
    temperature=0.7,
    max_tokens=1024
)

print(response.choices[0].message.content)

import OpenAI from 'openai';

const client = new OpenAI({
    baseURL: "https://api.hostyour.ai/v1",
    apiKey: "hyai_..."
});

const response = await client.chat.completions.create({
    model: "deepseek-r1-distill-llama-70b",
    messages: [
        { role: "system", content: "You are a helpful assistant." },
        { role: "user", content: "What is the capital of the Netherlands?" }
    ],
    temperature: 0.7,
    max_tokens: 1024
});

console.log(response.choices[0].message.content);

<?php

$client = new GuzzleHttp\Client();

$response = $client->post('https://api.hostyour.ai/v1/chat/completions', [
    'headers' => [
        'Authorization' => 'Bearer hyai_...',
        'Content-Type' => 'application/json',
    ],
    'json' => [
        'model' => 'deepseek-r1-distill-llama-70b',
        'messages' => [
            ['role' => 'system', 'content' => 'You are a helpful assistant.'],
            ['role' => 'user', 'content' => 'What is the capital of the Netherlands?'],
        ],
        'temperature' => 0.7,
        'max_tokens' => 1024,
    ]
]);

$data = json_decode($response->getBody(), true);
echo $data['choices'][0]['message']['content'];

Playground

U

User

What is the capital of the Netherlands?

AI

DeepSeek R1 127 tokens · 342ms

The capital of the Netherlands is Amsterdam. However, The Hague (Den Haag) is the seat of government where the parliament is located.

Type your message...

Aan de slag

100%

OpenAI Compatible

<100ms

Time to first token

0

Code changes nodig

100+ modellen

Tekst & Beeldmodellen

Van Llama tot FLUX. Deploy tekst- of beeldgeneratiemodellen met één klik, of breng je eigen HuggingFace-model mee.

DeepSeek R1 32B

DeepSeek R1 70B

DeepSeek R1 7B

DeepSeek Coder V2

Qwen 2.5 72B

Qwen 2.5 32B

Qwen Coder 32B

Llama 3.3 70B

Llama 3.1 70B

Llama 3.1 8B

Mixtral 8x22B

Mixtral 8x7B

Mistral Small 22B

Mistral Nemo 12B

Mistral 7B

Codestral 22B

Gemma 2 27B

Gemma 2 9B

Phi 3.5 MoE

Phi 3 Medium

CodeLlama 70B

CodeLlama 34B

StarCoder2 15B

Command R+

Command R

Yi 1.5 34B

InternLM 2.5 20B

Vicuna 13B

FLUX.1 Schnell

SDXL 1.0

FLUX.1 Dev

SD 3.5 Medium

+ 50 meer

Bekijk alle modellen

Wij richten je GPU in

Geen CUDA drivers, geen Docker, geen ML ops. Wij zorgen dat je model optimaal draait. Werkt voor tekst- en beeldmodellen.

Custom HuggingFace Modellen

Model niet in de lijst? Deploy elk HuggingFace-model direct. Vul het model ID en vereiste VRAM in.

0

DevOps nodig

100+

AI modellen

6

Providers (BYOK)

4

EU datacenters

EU Soeverein

Jouw data, veilig in Europa

Volledige data-soevereiniteit. Geen Amerikaanse cloud, geen CLOUD Act, geen zorgen.

EU Datacenters

Amsterdam, Frankfurt, Parijs, Helsinki

GDPR Compliant

Volledige naleving van EU privacywetgeving

Geen CLOUD Act

Buiten bereik van Amerikaanse wetgeving

Dedicated Hardware

Jouw model op eigen GPU, geen sharing

GDPR

Geen vendor lock-in, geen onverwachte prijsverhogingen, geen content policies die jou beperken, geen data die gebruikt wordt voor training. Open-source modellen, Europese infrastructuur.

Testimonials

Wat onze klanten zeggen

Teams in heel Europa bouwen met HostYourAI.

"Eindelijk een platform waar we niet zelf GPU's hoeven te beheren. Deploy in 10 minuten, OpenAI-compatible API, en alles draait in de EU."

MV

Martijn de Vries

CTO, DataFlow AI

"We zijn overgestapt van AWS Bedrock. De kosten zijn 40% lager en we hebben nu volledige controle over welk model we draaien."

SB

Sophie Bakker

Lead Developer, TechNL

"Voor ons onderzoek was GDPR-compliance essentieel. HostYourAI biedt dedicated instances in Amsterdam met volledige data-soevereiniteit."

JK

Dr. Jan Koster

AI Researcher, RUG

Prijzen

Simpel en transparant

GPU instances pay-as-you-go. BYOK is gratis.

Pay as you go

Credits voor GPU instances. BYOK zonder platformkosten

Vanaf €0,10 /uur

GPU prijs varieert per type • BYOK instances zijn gratis

GPU deploy of koppel je eigen API key
Alle modellen, agents & kennisbanken
Waardeer op met iDEAL of creditcard
Teams, workflows & templates inbegrepen

Account aanmaken

Enterprise nodig? Neem contact op

Jouw AI. Jouw Infra. In Europa.

Hoe het werkt

Maak een account

Maak een API key

Kies een model

Ga live

Open-weight LLM's, gehost in Europa

EU Inference Router

Dedicated GPU-instances

Drop-in voor OpenAI & Anthropic

Geverifieerde Model Garden

EU gehost & GDPR

Playground & teams

Eén endpoint voor elk open model

Je eigen AI-instance

Werk samen met je team

API Playground

Tekst & Beeldmodellen

Wij richten je GPU in

Custom HuggingFace Modellen

Jouw data, veilig in Europa

EU Datacenters

GDPR Compliant

Geen CLOUD Act

Dedicated Hardware

Wat onze klanten zeggen

Simpel en transparant

Klaar om je AI-pipeline te bouwen?