App macOS · Apple Silicon · Mac App Store

Serveur LLM local
natif Apple Silicon.

MLX-Launcher transforme votre Mac Apple Silicon en serveur LLM local performant. API OpenAI-compatible, multi-modèles simultanés, zéro cloud, optimisé MLX framework natif d'Apple.

Télécharger sur le Mac App Store · 29,99 € Installation pro custom

— MLX framework · OpenAI API · Menu bar macOS —

Capacités natives

Tout ce qu'il faut, rien de plus.

Un seul outil pour faire tourner vos modèles LLM préférés localement, exposer une API OpenAI-compatible, et monitorer la mémoire et les performances en temps réel — directement depuis la barre de menus macOS.

◆

Multi-modèles simultanés

Lancez plusieurs modèles MLX en parallèle, chacun sur son propre port. Bascule rapide entre Qwen, Llama, Mistral, DeepSeek selon votre besoin.

Modèles MLX (4-bit, 8-bit, BF16)
Téléchargement direct depuis Hugging Face
Bascule à chaud sans redémarrage
Monitoring RAM intégré

▣

API OpenAI-compatible

Endpoints HTTP standards (/v1/models, /v1/chat/completions). Plug-and-play avec vos clients préférés sans configuration particulière.

Continue.dev, Cursor, Aider, Cline
Open WebUI, LangChain, LlamaIndex
Curl, Python OpenAI SDK
URLs locale + LAN affichées

◐

Apple Silicon natif

Construit sur le framework MLX d'Apple. Pas de Python, pas de Docker, pas de bricolage. Performances maximales sur M1, M2, M3, M4, M5.

Zéro dépendance externe
Mémoire unifiée GPU/CPU exploitée
Lancement instantané
Sandbox Mac App Store conforme
Réseau local uniquement — aucune exposition Internet

Démo & Quick Start

De zéro à inférence locale en 60 secondes.

Installez, choisissez un modèle, copiez la commande dans votre éditeur favori. C'est tout.

▶

Vidéo démo · 60 secondes

Disponible au lancement officiel

Menu bar — Sélection du modèle

Choix du modèle MLX en un clic depuis la barre de menus.

Monitoring RAM — Modèles chargés

Suivi temps réel de la mémoire occupée par chaque modèle.

API OpenAI — Endpoint actif

URLs locales et LAN affichées, prêtes à coller dans Continue / Aider.

Quick Start — connectez votre IDE

Continue.dev / Cursor / Aider

export OPENAI_API_BASE=http://localhost:8080/v1
export OPENAI_API_KEY=dummy

cd ~/Mon-Projet
aider

curl (test rapide)

curl http://localhost:8080/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-coder-4bit",
    "messages": [{"role":"user","content":"Hello"}]
  }'

Python OpenAI SDK

from openai import OpenAI

client = OpenAI(
  base_url="http://localhost:8080/v1",
  api_key="dummy"
)
client.chat.completions.create(
  model="hermes-3-3b",
  messages=[{"role":"user","content":"Hi"}]
)

Pour qui

100 % offline, 100 % à vous.

Pour tous ceux qui veulent l'IA locale sans compromis sur la confidentialité, la performance ou le coût d'usage.

⌨️

Développeurs

Branchez Cursor, Continue.dev, Aider sur votre LLM local. Zéro latence, zéro quota, zéro fuite de code propriétaire.

🎨

Studios créatifs

Génération de prompts, brainstorming, analyse de scripts — tout reste sur votre Mac, scénarios confidentiels protégés.

🏢

Entreprises RGPD

Aucune donnée envoyée à un cloud externe. Conformité RGPD facile, données clients préservées, audit trivial.

🎓

Étudiants & chercheurs

Tester les derniers modèles open-source sans budget cloud. Comparer Qwen, Llama, Mistral en local, sur votre Mac.

Tarif

Achat unique, sans abonnement.

Une licence à vie. Pas de SaaS, pas de carte bancaire récurrente. Mises à jour incluses pendant toute la durée de support de l'app.

Prix de lancement

29,99 €

Achat unique sur le Mac App Store · TVA incluse

Modèles MLX multi-instances
API OpenAI-compatible (local + LAN)
Monitoring RAM temps réel
Téléchargement direct Hugging Face
Mises à jour macOS incluses
Support par email

Acheter sur le Mac App Store

Tarif applicable pendant les 3 premiers mois — jusqu'au 26 juillet 2026. Le tarif standard sera appliqué ensuite.

FAQ

Les questions qu'on nous pose.

Une réponse manque ? Écrivez-nous — on ajoute la réponse ici.

Quelle configuration Mac est nécessaire ?

Apple Silicon (M1, M2, M3, M4 ou M5), macOS 14 Sonoma ou supérieur, 16 Go de RAM minimum. Pour les modèles 30 B+ (Llama 3.3 70 B, Qwen3-Coder), 64 Go de RAM unifiée recommandés. Sur M5 Max 128 Go, vous pouvez charger 4-5 modèles 7-15 B en parallèle.

Quels modèles puis-je faire tourner ?

Tous les modèles disponibles au format MLX sur Hugging Face : Qwen 2.5 / 3, Llama 3.x, Mistral, DeepSeek-Coder, Phi-3.5, Hermes-3, Qwen2.5-VL (vision), et beaucoup d'autres. Téléchargement direct depuis l'app via le catalogue mlx-community. Les modèles GGUF / Ollama ne sont pas supportés (différent format).

Mes prompts ou conversations sont-ils envoyés quelque part ?

Non. Rien ne quitte votre Mac. Pas de télémétrie, pas de cloud, pas de logs envoyés à DepannOnline. Le seul trafic réseau initié par MLX-Launcher est le téléchargement des poids depuis Hugging Face (CDN public, lors du premier chargement d'un modèle). L'API exposée par l'app reste accessible uniquement sur localhost ou votre réseau local (LAN), jamais sur Internet. Voir notre politique de confidentialité.

Compatible avec Continue.dev / Cursor / Aider / Cline ?

Oui — l'API MLX-Launcher est strictement OpenAI-compatible (endpoints /v1/models, /v1/chat/completions, streaming SSE). Dans votre IDE, configurez simplement OPENAI_API_BASE=http://localhost:8080/v1 et OPENAI_API_KEY=dummy. Voir la section Quick Start ci-dessus.

L'app fonctionne-t-elle sur Intel Mac ?

Non. MLX est un framework natif Apple Silicon qui exploite la mémoire unifiée GPU/CPU. Les Mac Intel ne disposent pas de cette architecture et ne sont pas pris en charge.

Et Ollama ? Quelle différence ?

Ollama est un excellent outil multi-plateforme basé sur llama.cpp. MLX-Launcher est plus restreint (Apple Silicon uniquement) mais utilise le framework MLX d'Apple directement, ce qui donne des performances supérieures sur Mac. De plus, MLX-Launcher est une vraie app Mac App Store (sandboxed, signée Apple), avec menu bar intégré et aucun daemon externe à gérer. Les deux peuvent coexister sans problème.

Pourquoi 29,99 € en lancement puis 49,99 € ?

L'offre de lancement à 29,99 € s'applique pendant les 3 premiers mois (jusqu'au 26 juillet 2026) pour récompenser les early adopters. Le tarif de référence est ensuite 49,99 €. Achat unique, pas d'abonnement, mises à jour incluses. Si vous achetez pendant la période lancement, vous gardez le bénéfice à vie.

Combien de modèles puis-je charger en même temps ?

Sur la version actuelle, un modèle à la fois. Le multi-modèles simultanés (plusieurs LLM dans la mémoire unifiée Apple Silicon) arrive dans une mise à jour future. À titre indicatif pour le dimensionnement : un modèle 7B 4-bit fait ~4 Go, un 30B 4-bit ~17 Go, un 70B 4-bit ~40 Go. Le monitoring RAM intégré vous évite l'OOM.

Y a-t-il une version Windows ou Linux ?

Non, et il n'y en aura pas — MLX est exclusif Apple Silicon. Pour Windows / Linux, utilisez Ollama, vLLM, ou llama.cpp directement.

Comment exposer l'API à mon LAN (autres Macs / iPad) ?

Par défaut, MLX-Launcher écoute sur localhost uniquement (sécurité). L'option "Exposer au LAN" dans les préférences active le binding sur l'IP locale de votre Mac (ex: 192.168.1.x:8080) — restreint au réseau local exclusivement. Aucune exposition Internet n'est possible avec la version App Store : pas de tunnel, pas de proxy, pas de VPN intégré. Pour un accès distant sécurisé entre sites, c'est la version professionnelle sur mesure.

Puis-je avoir un remboursement si l'app ne convient pas ?

Les achats Mac App Store sont gérés par Apple. Vous pouvez demander un remboursement directement via reportaproblem.apple.com dans les 14 jours suivant l'achat (politique standard Apple).

Y a-t-il une démo / version d'essai ?

Pas de version d'essai gratuite (politique Mac App Store). En revanche : la vidéo démo ci-dessus couvre 100 % des fonctionnalités, et notre politique de confidentialité détaille exactement ce que l'app fait. Pour les besoins entreprise, contactez-nous : on monte une démo live avec votre équipe.

Version professionnelle sur mesure.

Pour les workflows entreprise nécessitant l'accès distant via maillage privé self-hosted (Headscale), VPN, le déploiement multi-postes, l'intégration sur infrastructure existante, ou la formation équipes — notre équipe propose une version personnalisée et un accompagnement complet. La version Mac App Store reste volontairement limitée au réseau local pour garantir la conformité sandbox Apple et la simplicité d'usage.

Demander un devis pro