Quelle configuration Mac est nécessaire ?
Apple Silicon (M1, M2, M3, M4 ou M5), macOS 14 Sonoma ou supérieur, 16 Go de RAM minimum. Pour les modèles 30 B+ (Llama 3.3 70 B, Qwen3-Coder), 64 Go de RAM unifiée recommandés. Sur M5 Max 128 Go, vous pouvez charger 4-5 modèles 7-15 B en parallèle.
Quels modèles puis-je faire tourner ?
Tous les modèles disponibles au format MLX sur Hugging Face : Qwen 2.5 / 3, Llama 3.x, Mistral, DeepSeek-Coder, Phi-3.5, Hermes-3, Qwen2.5-VL (vision), et beaucoup d'autres. Téléchargement direct depuis l'app via le catalogue mlx-community. Les modèles GGUF / Ollama ne sont pas supportés (différent format).
Mes prompts ou conversations sont-ils envoyés quelque part ?
Non. Rien ne quitte votre Mac. Pas de télémétrie, pas de cloud, pas de logs envoyés à DepannOnline. Le seul trafic réseau initié par MLX-Launcher est le téléchargement des poids depuis Hugging Face (CDN public, lors du premier chargement d'un modèle). L'API exposée par l'app reste accessible uniquement sur localhost ou votre réseau local (LAN), jamais sur Internet. Voir notre politique de confidentialité.
Compatible avec Continue.dev / Cursor / Aider / Cline ?
Oui — l'API MLX-Launcher est strictement OpenAI-compatible (endpoints /v1/models, /v1/chat/completions, streaming SSE). Dans votre IDE, configurez simplement OPENAI_API_BASE=http://localhost:8080/v1 et OPENAI_API_KEY=dummy. Voir la section Quick Start ci-dessus.
L'app fonctionne-t-elle sur Intel Mac ?
Non. MLX est un framework natif Apple Silicon qui exploite la mémoire unifiée GPU/CPU. Les Mac Intel ne disposent pas de cette architecture et ne sont pas pris en charge.
Et Ollama ? Quelle différence ?
Ollama est un excellent outil multi-plateforme basé sur llama.cpp. MLX-Launcher est plus restreint (Apple Silicon uniquement) mais utilise le framework MLX d'Apple directement, ce qui donne des performances supérieures sur Mac. De plus, MLX-Launcher est une vraie app Mac App Store (sandboxed, signée Apple), avec menu bar intégré et aucun daemon externe à gérer. Les deux peuvent coexister sans problème.
Pourquoi 29,99 € en lancement puis 49,99 € ?
L'offre de lancement à 29,99 € s'applique pendant les 3 premiers mois (jusqu'au 26 juillet 2026) pour récompenser les early adopters. Le tarif de référence est ensuite 49,99 €. Achat unique, pas d'abonnement, mises à jour incluses. Si vous achetez pendant la période lancement, vous gardez le bénéfice à vie.
Combien de modèles puis-je charger en même temps ?
Sur la version actuelle, un modèle à la fois. Le multi-modèles simultanés (plusieurs LLM dans la mémoire unifiée Apple Silicon) arrive dans une mise à jour future. À titre indicatif pour le dimensionnement : un modèle 7B 4-bit fait ~4 Go, un 30B 4-bit ~17 Go, un 70B 4-bit ~40 Go. Le monitoring RAM intégré vous évite l'OOM.
Y a-t-il une version Windows ou Linux ?
Non, et il n'y en aura pas — MLX est exclusif Apple Silicon. Pour Windows / Linux, utilisez Ollama, vLLM, ou llama.cpp directement.
Comment exposer l'API à mon LAN (autres Macs / iPad) ?
Par défaut, MLX-Launcher écoute sur localhost uniquement (sécurité). L'option "Exposer au LAN" dans les préférences active le binding sur l'IP locale de votre Mac (ex: 192.168.1.x:8080) — restreint au réseau local exclusivement. Aucune exposition Internet n'est possible avec la version App Store : pas de tunnel, pas de proxy, pas de VPN intégré. Pour un accès distant sécurisé entre sites, c'est la version professionnelle sur mesure.
Puis-je avoir un remboursement si l'app ne convient pas ?
Les achats Mac App Store sont gérés par Apple. Vous pouvez demander un remboursement directement via reportaproblem.apple.com dans les 14 jours suivant l'achat (politique standard Apple).
Y a-t-il une démo / version d'essai ?
Pas de version d'essai gratuite (politique Mac App Store). En revanche : la vidéo démo ci-dessus couvre 100 % des fonctionnalités, et notre politique de confidentialité détaille exactement ce que l'app fait. Pour les besoins entreprise, contactez-nous : on monte une démo live avec votre équipe.