Guia Técnico: Implantação Local do DeepSeek-R1 com Ollama e Interfaces Web

O DeepSeek-R1 foi lançado oficialmente sob a licença MIT, permitindo não apenas o uso comercial, mas também a destilação para o treinamento de outros modelos. Esta arquitetura introduz capacidades avançadas de raciocínio (Chain of Thought) e pode ser acessada tanto via API oficial quanto através de execução local para garantir privacidade e customização.

Execução com Ollama

O Ollama é a ferramenta mais eficiente para rodar o DeepSeek-R1 em ambientes locais. Ele gerencia o ciclo de vida do modelo e oferece uma interface CLI simples. Para instalar no Linux, utilize o script automatizado: ``` curl -fsSL https://ollama.com/install.sh | sh


Após a instalação, você pode inicializar diferentes variantes do modelo dependendo do seu hardware. Recomenda-se 7B ou 8B para hardware doméstico comum e 1.5B para dispositivos leves: ```
# Executando a versão destilada de 7B
ollama run deepseek-r1:7b

# Executando a versão leve de 1.5B
ollama run deepseek-r1:1.5b

Configuração do Open WebUI

Para uma experiência visual similar ao ChatGPT, o Open WebUI é a escolha ideal. Ele pode ser instalado via Python (Pip) ou Docker. #### Instalação via Pip

pip install open-webui

# Caso necessite de proxy para download de dependências
set http_proxy=http://127.0.0.1:7890
set https_proxy=http://127.0.0.1:7890

# Inicializar o serviço
open-webui serve

Instalação via Docker

Para isolar o ambiente, utilize o Docker com suporte à rede do host para facilitar a comunicação com o Ollama: ``` docker run -d --network=host
-v dados_webui:/app/backend/data
-e OLLAMA_BASE_URL=http://127.0.0.1:11434
--name deepseek-ui
--restart always
ghcr.io/open-webui/open-webui:main


### Otimização de Download no LM Studio

O LM Studio é uma alternativa robusta para Windows e Mac. Caso encontre lentidão no download de modelos do Hugging Face, é possível alterar o endpoint para um mirror: 1. Navegue até a pasta de instalação do LM Studio. 2. Utilize um editor (como VS Code) para localizar a string `huggingface.co` em arquivos de configuração (exceto executáveiss). 3. Substitua por um mirror confiável, como `hf-mirror.com`. ### Execução em Dispositivos Android (Termux)

É possível rodar o DeepSeek-R1 em smartphones Android utilizando o Termux para compilar o Ollama nativamente: ```
# Atualizar repositórios e instalar dependências
pkg install git cmake golang

# Clonar e compilar
git clone --depth 1 https://github.com/ollama/ollama.git
cd ollama
go generate ./...
go build .

# Iniciar o servidor em background
./ollama serve &

# Executar o modelo (recomenda-se 1.5B para dispositivos móveis)
./ollama run deepseek-r1:1.5b

Ecossistema de Ferramentas Adicionais

Existem outras interfaces que oferecem funcionalidades específicas para diferentes fluxos de trabalho: - AnythingLLM: Focado em RAG (Geração Aumentada de Recuperação), ideal para processar documentos locais e bases de conhecimento.

  • Chatbox: Aplicativo multiplataforma com suporte a diversos backends e sincronização de dados.
  • Cherry Studio: Interface moderna com suporte a múltiplos provedores de modelos simultâneos.
  • RKNN-LLM: Para usuários avançados que utilizam hardware específico como o RK3588, permitindo aceleração via NPU.

Tags: DeepSeek-R1 Ollama Open-WebUI Docker LLM

Publicado em 6-22 22:28