Deepseek-r1 combinando a IA e a computação de borda para IoT industrial

Introdução

Os modelos destilados de pequeno porte de Deepseek-R1 são ajustados usando dados de cadeia de pensamentos gerados por Deepseek-R1, marcados com...Tags, herdando os recursos de raciocínio de R1. Esses conjuntos de dados ajustados incluem explicitamente processos de raciocínio, como decomposição de problemas e deduções intermediárias. A aprendizagem de reforço alinhou os padrões de comportamento do modelo destilado com as etapas de raciocínio geradas por R1. Esse mecanismo de destilação permite que pequenos modelos mantenham a eficiência computacional e obtenha habilidades complexas de raciocínio próximas às de modelos maiores, o que é de valor significativo de aplicação em cenários com restos de recursos. Por exemplo, a versão 14B alcança 92% da conclusão do código do modelo Deepseek-R1 original. Este artigo apresenta o modelo Deepseek-R1 destilado e suas principais aplicações na computação industrial de borda, resumidas nas quatro direções a seguir, juntamente com casos específicos de implementação:

DC3C637C5BEAD8B62ED51B6D83AC0B4

Manutenção preditiva do equipamento

Implementação técnica

Fusão de sensores:

Integre a vibração, a temperatura e os dados de corrente dos PLCs através do protocolo Modbus (taxa de amostragem 1 kHz).

Extração de recursos:

Execute o impulso da borda no Jetson Orin NX para extrair recursos de série temporal 128-dimensional.

Inferência do modelo:

Implante o modelo DeepSeek-R1-Distill-14b, inserindo vetores de recursos para gerar valores de probabilidade de falha.

Ajuste dinâmico:

Acionar ordens de manutenção de manutenção quando confiança> 85%e iniciar um processo de verificação secundária quando <60%.

Caso relevante

A Schneider Electric implantou essa solução em máquinas de mineração, reduzindo as taxas falsas positivas em 63% e os custos de manutenção em 41%.

1

Running Deepseek R1 Modelo destilado em computadores Ai Edge

Inspeção visual aprimorada

Arquitetura de saída

Oleoduto típico de implantação:

câmera = gige_vision_camera (500fps) # Câmera industrial Gigabit
quadro = câmera.capture () # Capture Image
pré -processado = OpenCV.DenOise (Frame) # Denoising Pré -processamento
Defect_type = Deepseek_R1_7b.infer (pré -processado) # Classificação de defeitos
Se Defect_type! = 'Normal':
PLC.Trigger_Reject () # Mecanismo de classificação de gatilho

Métricas de desempenho

Atraso no processamento:

82 ms (Jetson Agx Orin)

Precisão:

A detecção de defeitos moldados por injeção atinge 98,7%.

2

Implicações do Deepseek R1: vencedores e perdedores na cadeia de valor generativa da IA

Otimização do fluxo de processo

Tecnologias -chave

Interação da linguagem natural:

Os operadores descrevem anomalias de equipamentos por voz (por exemplo, "flutuação da pressão da extrusora ± 0,3 MPa").

Raciocínio multimodal:

O modelo gera sugestões de otimização com base nos dados históricos do equipamento (por exemplo, ajustando a velocidade do parafuso em 2,5%).

Verificação Digital Twin:

Validação de simulação de parâmetros na plataforma de fundição Edgex.

Efeito de implementação

A planta química da BASF adotou esse esquema, alcançando uma redução de 17% no consumo de energia e um aumento de 9% na taxa de qualidade do produto.

3

Edge AI e o futuro dos negócios: OpenAi O1 vs. Deepseek R1 para assistência médica, automotiva e iiot

Recuperação instantânea da base de conhecimento

Design de arquitetura

Banco de dados vetorial local:

Use Chromadb para armazenar manuais de equipamentos e especificações de processo (Dimension de incorporação 768).

Recuperação híbrida:

Combine o algoritmo BM25 + similaridade de cosseno para consulta.

Geração de resultados:

O modelo R1-7B resume e refina os resultados de recuperação.

Caso típico

Os engenheiros da Siemens resolveram falhas no inversor por meio de consultas de linguagem natural, reduzindo o tempo médio de processamento em 58%.

Desafios e soluções de implantação

Limitações de memória:

Tecnologia de quantização de cache KV utilizada, reduzindo o uso da memória do modelo 14B de 32 GB para 9 GB.

Garantindo o desempenho em tempo real:

Latência de inferência única estabilizada para ± 15 ms através da otimização de gráficos CUDA.

Drift de modelo:

Atualizações incrementais semanais (transmitindo apenas 2% dos parâmetros).

Ambientes extremos:

Projetado para amplas faixas de temperatura de -40 ° C a 85 ° C com nível de proteção IP67.

5
微信图片 _20240614024031.jpg1

Conclusão

Os custos atuais de implantação agora diminuíram para US $ 599/nó (Jetson Orin NX), com aplicações escaláveis ​​formando em setores como fabricação 3C, montagem automotiva e química energética. A otimização contínua da tecnologia de arquitetura e quantização de MOE deve permitir que o modelo 70B seja executado em dispositivos de borda até o final de 2025.

Encontre a solução de cabo ELV

Cabos de controle

Para BMS, ônibus, Industrial, Cabo de instrumentação.

Sistema de cabeamento estruturado

Rede e dados, cabo de fibra óptica, cordão de remendo, módulos, painel frontal

2024 Revisão de Exposições e Eventos

16 de abril a 18 de anos, 2024 Ensino do Oriente Médio em Dubai

16 de abril a 18 de ano, 2024 Securika em Moscou

9 de maio, 2024 Novos produtos de lançamento de produtos e tecnologias em Xangai

22 de outubro a 25 de outubro de 2024 Security China em Pequim

9 de novembro a 20 de novembro, 2024 Conecte World KSA


Hora de postagem: Feb-07-2025