✓ Werkend geverifieerd op 10-06-2026 — respons in 1519 ms op onze EU-infrastructuur.
If you are using the weights from this repository, please update to
Specificaties
| Parameters | 9.4B |
|---|---|
| Contextvenster | 131,072 tokens |
| Minimale VRAM | 22 GB |
| Architectuur | GlmForCausalLM (vLLM) |
| Licentie | other |
| Modaliteit | text->text |
| Uitgebracht | October 2024 |
| Uitgever | zai-org (Hugging Face) |
Prijzen
| Input (per 1M tokens) | € 0.10 |
|---|---|
| Output (per 1M tokens) | € 0.18 |
Gedeelde EU-router, pay-per-token, scale-to-zero. Dedicated GPU-deployments worden per uur afgerekend — zie prijzen.
Direct aanroepen
Drop-in vervanger voor OpenAI: wijzig alleen de base-URL en de API-key. Ook het Anthropic-formaat (/v1/messages) wordt ondersteund.
curl https://hostyourai.com/api/v1/chat/completions \
-H "Authorization: Bearer hyai-..." \
-H "Content-Type: application/json" \
-d '{
"model": "zai-org/glm-4-9b-chat-hf",
"messages": [{"role": "user", "content": "Hello!"}]
}'
Veelgestelde vragen
Kan ik glm 4 9b chat hf in de EU draaien?
Ja. HostYourAI draait glm 4 9b chat hf op GPU's in Europese datacenters via vLLM. Prompts en outputs verlaten de EU niet en er is geen Amerikaanse cloudprovider in de keten.
Is glm 4 9b chat hf hosten AVG/GDPR-compliant?
Ja. Alle verwerking vindt plaats binnen de EU, er is een verwerkersovereenkomst (DPA) beschikbaar en de subprocessor-lijst is openbaar. Open-source gewichten betekenen ook: geen training op jouw data.
Wat kost glm 4 9b chat hf?
Via de gedeelde EU-router betaal je €0.10 per miljoen input-tokens en €0.18 per miljoen output-tokens, zonder vaste kosten. Voor hoge volumes of isolatie kun je glm 4 9b chat hf ook als dedicated GPU-instance per uur draaien.
Is de API compatibel met OpenAI?
Ja. Je gebruikt de standaard OpenAI-SDK's met een aangepaste base-URL (https://hostyourai.com/api/v1). Ook de Anthropic Messages API wordt ondersteund als drop-in.
Account aanmaken duurt een minuut. Test glm 4 9b chat hf direct in de playground.
Start gratis