O DeepSeek-R1 foi lançado oficialmente sob a licença MIT, permitindo não apenas o uso comercial, mas também a destilação para o treinamento de outros modelos. Esta arquitetura introduz capacidades avançadas de raciocínio (Chain of Thought) e pode ser acessada tanto via API oficial quanto através de execução local para garantir privacidade e customização.
Execução com Ollama
O Ollama é a ferramenta mais eficiente para rodar o DeepSeek-R1 em ambientes locais. Ele gerencia o ciclo de vida do modelo e oferece uma interface CLI simples. Para instalar no Linux, utilize o script automatizado: ``` curl -fsSL https://ollama.com/install.sh | sh
Após a instalação, você pode inicializar diferentes variantes do modelo dependendo do seu hardware. Recomenda-se 7B ou 8B para hardware doméstico comum e 1.5B para dispositivos leves: ```
# Executando a versão destilada de 7B
ollama run deepseek-r1:7b
# Executando a versão leve de 1.5B
ollama run deepseek-r1:1.5b
Configuração do Open WebUI
Para uma experiência visual similar ao ChatGPT, o Open WebUI é a escolha ideal. Ele pode ser instalado via Python (Pip) ou Docker. #### Instalação via Pip
pip install open-webui
# Caso necessite de proxy para download de dependências
set http_proxy=http://127.0.0.1:7890
set https_proxy=http://127.0.0.1:7890
# Inicializar o serviço
open-webui serve
Instalação via Docker
Para isolar o ambiente, utilize o Docker com suporte à rede do host para facilitar a comunicação com o Ollama: ```
docker run -d --network=host
-v dados_webui:/app/backend/data
-e OLLAMA_BASE_URL=http://127.0.0.1:11434
--name deepseek-ui
--restart always
ghcr.io/open-webui/open-webui:main
### Otimização de Download no LM Studio
O LM Studio é uma alternativa robusta para Windows e Mac. Caso encontre lentidão no download de modelos do Hugging Face, é possível alterar o endpoint para um mirror: 1. Navegue até a pasta de instalação do LM Studio. 2. Utilize um editor (como VS Code) para localizar a string `huggingface.co` em arquivos de configuração (exceto executáveiss). 3. Substitua por um mirror confiável, como `hf-mirror.com`. ### Execução em Dispositivos Android (Termux)
É possível rodar o DeepSeek-R1 em smartphones Android utilizando o Termux para compilar o Ollama nativamente: ```
# Atualizar repositórios e instalar dependências
pkg install git cmake golang
# Clonar e compilar
git clone --depth 1 https://github.com/ollama/ollama.git
cd ollama
go generate ./...
go build .
# Iniciar o servidor em background
./ollama serve &
# Executar o modelo (recomenda-se 1.5B para dispositivos móveis)
./ollama run deepseek-r1:1.5b
Ecossistema de Ferramentas Adicionais
Existem outras interfaces que oferecem funcionalidades específicas para diferentes fluxos de trabalho: - AnythingLLM: Focado em RAG (Geração Aumentada de Recuperação), ideal para processar documentos locais e bases de conhecimento.
- Chatbox: Aplicativo multiplataforma com suporte a diversos backends e sincronização de dados.
- Cherry Studio: Interface moderna com suporte a múltiplos provedores de modelos simultâneos.
- RKNN-LLM: Para usuários avançados que utilizam hardware específico como o RK3588, permitindo aceleração via NPU.