Inloggen Demo plannen Aan de slag

Product

EU Router HostYourAI Code OpenAI-compatible API Anthropic-compatible API Model Garden Dedicated Instances Playground Fine-tuning (Loes)Connect je GPU-pool

Oplossingen

Use cases

HostYourAI Code LLM Inference RAG pipelines Chatbots AI agents Fine-tuning

Sectoren

Overheid Zorg Finance Juridisch

Modellen

DeepSeek V4 Pro DeepSeek V4 Flash GLM 5.2 Llama 3.1 405B Qwen3.5 397B Llama 3.3 70B Mistral DeepSeek R1 Alle modellen →

Vergelijk

Azure OpenAI AWS Bedrock Claude API ChatGPT OpenAI

Resources

Documentatie Gids: migreren naar de EU Router Gids: eigen LLM deployen (vLLM)Gids: RAG bouwen op EU-GPUs Modelcatalogus

Prijzen

NL EN

Inloggen Demo plannen Aan de slag

Model hosting

Llama 3 Hosting

Deploy Meta's Llama 3.3 70B en andere Llama modellen met één klik op Europese infrastructuur.

Gratis starten Model Garden

qwen3-8b vLLM ready

NVIDIA A100 · 40GB · EU marketplace · eu-central

VRAM19.2 / 40 GB

GPU utilisation71%

42 ms

time-to-first-token

128

tokens / sec

62°C

temperature

POST /api/v1/chat/completions200 OK

Llama 3: Meta's Revolutionaire Open-Source LLM

Llama 3, ontwikkeld door Meta AI, is een van de meest capabele open-source Large Language Models ter wereld. De nieuwste versie, Llama 3.3 70B, presteert op het niveau van GPT-4 op veel benchmarks, maar is volledig open-source en kan op je eigen infrastructuur draaien.

Bij HostYourAI kun je Llama 3 deployen met één klik, gehost op Europese GPU infrastructuur. Geen DevOps kennis nodig, geen weken wachten op GPU procurement - binnen 10 minuten heb je een werkende API.

python

from openai import OpenAI
client = OpenAI(
    base_url="https://hostyourai.com/api/v1",
    api_key="hyai-...")
client.chat.completions.create(
    model="llama-3.3-70b",
    messages=[{"role":"user","content":"Hallo!"}])

Beschikbare Llama Modellen

Llama 3.3 70B - De Nieuwe Standaard

De nieuwste release van Meta, uitgebracht in december 2024. Dit model combineert de kracht van 70 miljard parameters met verbeterde instructie-following en reasoning.

Parameters: 70 miljard
Context window: 128K tokens
Beste voor: Algemene taken, chat, code, analyse
GPU requirement: A100 40GB of hoger
Performance: Vergelijkbaar met GPT-4 Turbo

Llama 3.2 90B Vision - Multimodaal

Een multimodaal model dat zowel tekst als afbeeldingen kan verwerken. Perfect voor use cases die visual understanding vereisen.

Parameters: 90 miljard
Modalities: Tekst + Afbeeldingen
Beste voor: Image captioning, visual Q&A, document analyse
GPU requirement: A100 80GB of H100

Llama 3.1 405B - Maximum Scale

Het grootste Llama model ooit. Met 405 miljard parameters is dit het meest capabele open-source model beschikbaar.

Parameters: 405 miljard
Context window: 128K tokens
Beste voor: Complexe reasoning, research, cutting-edge applicaties
GPU requirement: 8x H100 (multi-GPU setup)

Llama 3.1 8B - Snel en Efficient

Een compact maar krachtig model voor high-throughput applicaties.

Parameters: 8 miljard
Context window: 128K tokens
Beste voor: Chatbots, eenvoudige taken, hoog volume
GPU requirement: A10 of hoger

qwen3-8b vLLM ready

NVIDIA A100 · 40GB · EU marketplace · eu-central

VRAM19.2 / 40 GB

GPU utilisation71%

42 ms

time-to-first-token

128

tokens / sec

62°C

temperature

POST /api/v1/chat/completions200 OK

Waarom Llama 3 bij HostYourAI?

One-Click Deployment

Geen Docker, geen Kubernetes, geen GPU drivers configureren. Selecteer Llama 3, kies je GPU, en klik op deploy. Wij regelen de rest.

OpenAI-Compatible API

Onze Llama 3 deployment levert een API die 100% compatible is met de OpenAI SDK:

from openai import OpenAI

client = OpenAI(
    base_url="https://api.hostyour.ai/v1",
    api_key="hyai_..."
)

response = client.chat.completions.create(
    model="llama-3.3-70b",
    messages=[
        {"role": "system", "content": "Je bent een behulpzame assistent."},
        {"role": "user", "content": "Leg quantumcomputing uit in eenvoudige termen."}
    ],
    temperature=0.7,
    max_tokens=1000
)

Europese Hosting

Je Llama 3 instance draait in Europese datacenters. Data blijft in de EU, volledig GDPR compliant.

Dedicated Hardware

Geen shared instances. Jouw model draait op dedicated GPU hardware voor consistente performance en maximale privacy.

EU Inference Router

98.7% ↗ 12%

4,931 of 5,000 requests served warm

EU-hostedModels run on European GPUs

Drop-inOpenAI and Anthropic compatible

Scale to zeroGPUs idle when nobody is online

Llama 3 vs GPT-4: Eerlijke Vergelijking

Aspect	Llama 3.3 70B	GPT-4 Turbo
MMLU Score	86.0%	86.4%
HumanEval (Code)	72.6%	67.0%
GSM8K (Wiskunde)	93.0%	92.0%
Open-source	Ja	Nee
Self-hostable	Ja	Nee
EU hosting mogelijk	Ja	Beperkt
Data privacy	Volledig in controle	Via OpenAI
Prijs	Pay-as-you-go per token, zie prijzen	Per token via OpenAI

One-click deployment

OpenAI-compatible API

4 EU datacenters

End-to-end encryptie

Dedicated GPU instances

Audit logging

Use Cases voor Llama 3

Klantenservice Chatbots

Bouw intelligente chatbots die klantvragen beantwoorden, problemen oplossen, en tickets routeren. Llama 3.3 70B begrijpt context en nuance uitstekend.

Content Generatie

Genereer marketing content, productbeschrijvingen, of social media posts. Llama 3 produceert natuurlijke, overtuigende tekst.

Code Assistentie

Help developers met code generatie, debugging, en code review. Llama 3 scoort hoger dan GPT-4 op HumanEval.

Document Analyse

Analyseer contracten, rapporten, en andere documenten. Vat samen, extraheer key points, of beantwoord vragen over de inhoud.

Interne Kennisbank

Combineer Llama 3 met RAG (Retrieval Augmented Generation) om een AI te bouwen die vragen beantwoordt over je interne documentatie.

EU Inference Router

98.7% ↗ 12%

4,931 of 5,000 requests served warm

EU-hostedModels run on European GPUs

Drop-inOpenAI and Anthropic compatible

Scale to zeroGPUs idle when nobody is online

Alles wat je nodig hebt voor AI

Van model-hosting tot een klantgerichte API, gebouwd voor developers en bedrijven die hun AI op infrastructuur willen draaien die ze echt beheren, binnen de EU.

100%

EU-gehost

Je data en je modellen blijven op Europese GPUs. GDPR-vriendelijk vanaf de basis.

200+

Geverifieerde modellen, klaar om te serveren

Llama, Qwen, DeepSeek, Mistral, FLUX en nog veel meer. Kies er een en hij is binnen minuten warm, zonder DevOps aan jouw kant.

2 SDK

OpenAI- en Anthropic-compatibel

Richt je bestaande client op de Router en behoud je tools. Geen herschrijven, geen lock-in.

Van nul naar een warm endpoint in minuten

Geen infra om te beheren. Kies een model, krijg een OpenAI-compatibele URL, ship.

Kies een model

Kies uit de Model Garden of plak een willekeurig HuggingFace-ID. Stel de VRAM in en kies een EU-GPU.

Krijg je endpoint

Wij deployen vLLM, draaien readiness-probes en geven je een warme OpenAI- en Anthropic-compatibele URL plus een API-key.

Route en ship

Richt je client op de Router. Die routeert automatisch naar een warme instance, zet GPUs idle als niemand online is en logt elk verzoek.

Privé vanaf de basis

HostYourAI houdt je modellen, prompts en data op Europese GPUs. Gebouwd voor teams die geven om compliance, betrouwbaarheid en echte controle.

EU-gehostAVG-vriendelijkOpenAI-compatibelvLLMGeen lock-in

Volledige datasoevereiniteit

GPU's en data binnen Europa. Je prompts verlaten de EU nooit.

Open

Modellen die je kunt auditen

Draai open-weight modellen zonder black boxes of verborgen telemetrie.

€0

Scale-to-zero

GPU's idlen als niemand online is, dus je betaalt alleen voor wat je draait.

Jouw

Geen vendor lock-in

Jouw infra, jouw keys, jouw modellen. Vertrek wanneer je wilt.

Werkt met de tools die je al gebruikt

De Router spreekt de OpenAI- en Anthropic-API, dus hij past direct in de clients en SDKs die je team al draait. Verander alleen de base-URL.

Probeer HostYourAI gratis

Veelgestelde vragen

Kan ik dit in de EU draaien?

Ja. HostYourAI draait open modellen op GPU's in Europese datacenters via vLLM. Je prompts en outputs verlaten de EU niet en er zit geen Amerikaanse cloudprovider in de keten.

Is het AVG/GDPR-compliant?

Ja. Alle verwerking gebeurt binnen de EU, er is een verwerkersovereenkomst (DPA) beschikbaar en de subprocessor-lijst is openbaar. Open gewichten betekenen ook: geen training op jouw data.

Is de API compatibel met OpenAI?

Ja. Je richt je bestaande OpenAI- of Anthropic-client op onze Router (https://hostyourai.com/api/v1), alleen de base-URL en API-key wijzigen. Geen rewrite, geen lock-in.

Wat kost het?

Pay-as-you-go met één prepaid creditsaldo: de gedeelde router per token of een dedicated GPU per uur. Gratis te starten, geen minimum, geen vaste maandkosten.

Model garden

Werkt met 390+ open modellen

Tekst- en beeldmodellen op dedicated EU GPU's. Elk model getest op onze eigen hardware.

Llama 3.3 70B DeepSeek R1 Qwen 2.5 72B Mistral 7B Mixtral 8x22B Gemma 2 27B DeepSeek Coder Qwen Coder 32B CodeLlama 34B Command R+ Alle modellen bekijken →

Ook interessant

Verken meer over EU-gehoste AI op HostYourAI.

Qwen 2.5 32B Hosting Nederland

Host Qwen 2.5 32B op dedicated NVIDIA A100 40GB in Nederlandse datacenters. GDPR compliant, pay-as-you-go, OpenAI-compatible API.

Lees meer →

RunPod Alternatief in Europa

Op zoek naar een RunPod alternatief in Europa? HostYourAI levert managed vLLM op EU GPU's onder Europees recht, een API in plaats van kale GPU's.

Lees meer →

Vicuna 13B Hosting Nederland

Host Vicuna 13B op dedicated NVIDIA A10 in Nederlandse datacenters. GDPR compliant, pay-as-you-go, OpenAI-compatible API.

Lees meer →

AWS Bedrock alternatief

Een AWS Bedrock alternatief dat volledig in de EU draait. Open modellen op Europese GPUs, OpenAI- en Anthropic-compatibel, zonder Amerikaanse cloud.

Lees meer →

LLM API en de EU AI Act

De EU AI Act geldt volledig vanaf 2 augustus 2026. Wat betekent dat voor teams die LLM's gebruiken, en hoe helpt een EU-gehoste API met logging en DPA?

Lees meer →

DeepInfra Alternatief in Europa

DeepInfra is goedkoop maar draait in Amerikaanse datacenters. HostYourAI draait open modellen op EU GPU's onder Europees recht, met DPA en SLA.

Lees meer →

Host. Route. Ship.

Geen creditcard nodig. Betaal naar gebruik, stop wanneer je wilt.

Begin vandaag gratis met hosten