Sem internet para inferência. Sem coleta de dados. Sem conta. Modelos de IA rodando direto no chip, com aceleração Metal GPU.
Tudo roda no dispositivo. Tudo é local.
Conversas multi-turno com streaming em tempo real. Gerenciamento automático de contexto com resumos rotativos e fatos fixados. System prompts personalizados, estilos de resposta configuráveis, renderização Markdown completa.
Pipeline completo: fala, inferência, síntese. Reconhecimento em português brasileiro (pt-BR) com envio automático por detecção de silêncio. TTS neural opcional via Qwen3-TTS ou vozes nativas Apple.
20+ modelos curados com avaliação de desempenho em português. Download com retomada, explorador Hugging Face integrado, adição de modelos customizados por ID. De 1B a 32B+ parâmetros.
Modelos multimodais para análise de imagens. Anexe fotos nas conversas para análise visual, OCR de documentos, processamento de PDF, CSV e arquivos de código.
Nenhum dado sai do dispositivo durante a inferência. Sem analytics, sem crash reporting, sem conta necessária.
4 camadas com separação clara de responsabilidades.
Curados para desempenho em português.
| Modelo | Parâmetros | Download | Avaliação PT | Visão | Reasoning |
|---|---|---|---|---|---|
| Llama 3.2 | 1B / 3B | ~750MB–2GB | Razoável–Bom | — | — |
| Qwen 3 | 4B / 8B / 14B | ~2.5–8.5GB | Bom–Excelente | — | — |
| DeepSeek R1 | 7B | ~4GB | Bom | — | Sim |
| Gemma 4 | 12B–26B MoE | ~7–15GB | Excelente | Sim | Sim |
| Qwen VL | 2B | ~1.5GB | Bom | Sim | — |
Qualquer modelo da comunidade mlx-community no Hugging Face pode ser adicionado manualmente por ID. O explorador integrado permite buscar, filtrar e baixar modelos diretamente do app.
Como configurar o acesso ao Hugging Face e baixar modelos no app.
Alguns modelos no Hugging Face são "gated" — exigem que você aceite os termos de uso e tenha um token de acesso. Para baixar esses modelos no RodaAi, você precisa configurar seu token.
Do clone ao primeiro prompt no dispositivo.
git clone https://github.com/bmtec-us/roda.ai.git cd roda.ai open Package.swift
Selecione o scheme RodaAi e o dispositivo físico (simulador x86 não suporta MLX). Para iPhone, conecte via cabo ou Wi-Fi.
Em Signing & Capabilities, selecione seu Team de desenvolvimento. O entitlement "Increased Memory Limit" já está configurado para modelos 8B+.
Cmd+R no Xcode para compilar e instalar no dispositivo. O primeiro build baixa as dependências SPM (~2 min).
# Ou via linha de comando swift build