DeepSeek-R1, комбиниращ изкуствен интелект и периферни изчисления за индустриален интернет на нещата (IoT).

Въведение

Малкоразмерните дестилирани модели на DeepSeek-R1 са фино настроени с помощта на данни от веригата на мисълта, генерирани от DeepSeek-R1, маркирани с...тагове, наследяващи възможностите за разсъждение на R1. Тези фино настроени набори от данни изрично включват процеси на разсъждение, като например декомпозиция на проблеми и междинни дедукции. Обучението с подсилване е привело моделите на поведение на дестилирания модел в съответствие със стъпките на разсъждение, генерирани от R1. Този механизъм за дестилация позволява на малките модели да поддържат изчислителна ефективност, като същевременно получават сложни способности за разсъждение, близки до тези на по-големите модели, което е от значителна приложна стойност в сценарии с ограничени ресурси. Например, версията 14B постига 92% от завършването на кода на оригиналния модел DeepSeek-R1. Тази статия представя дестилирания модел DeepSeek-R1 и неговите основни приложения в индустриалните периферни изчисления, обобщени в следните четири насоки, заедно със специфични случаи на внедряване:

dc3c637c5bead8b62ed51b6d83ac0b4

Прогнозна поддръжка на оборудване

Техническо изпълнение

Сливане на сензори:

Интегрирайте данни за вибрации, температура и ток от PLC чрез протокола Modbus (честота на дискретизация 1 kHz).

Извличане на характеристики:

Изпълнете Edge Impulse на Jetson Orin NX, за да извлечете 128-мерни характеристики на времеви серии.

Извод за модела:

Разгръщане на модела DeepSeek-R1-Distill-14B, въвеждане на вектори на характеристики за генериране на стойности на вероятността за грешки.

Динамична корекция:

Задействайте работни поръчки за поддръжка, когато доверието е > 85%, и инициирайте процес на вторична проверка, когато е < 60%.

Съответен случай

Schneider Electric внедри това решение в минни машини, намалявайки процента на фалшиво положителни резултати с 63% и разходите за поддръжка с 41%.

1

Изпълнение на дестилиран модел DeepSeek R1 на InHand AI Edge компютри

Подобрена визуална инспекция

Изходна архитектура

Типичен конвейер за внедряване:

камера = GigE_Vision_Camera(500fps) # Гигабитова индустриална камера
frame = camera.capture() # Заснемане на изображение
preprocessed = OpenCV.denoise(frame) # Предварителна обработка на премахване на шум
defect_type = DeepSeek_R1_7B.infer(preprocessed) # Класификация на дефекта
ако defect_type != 'нормален':
PLC.trigger_reject() # Механизъм за сортиране на тригери

Показатели за ефективност

Забавяне на обработката:

82 мс (Джетсън AGX Орин)

Точност:

Откриването на дефекти при шприцване достига 98,7%.

2

Последици от DeepSeek R1: Печеливши и губещи във веригата за създаване на стойност на генеративния изкуствен интелект

Оптимизация на технологичния поток

Ключови технологии

Взаимодействие с естествен език:

Операторите описват аномалиите в оборудването чрез глас (напр. „Колебание на налягането в екструдера ±0,3 MPa“).

Мултимодално разсъждение:

Моделът генерира предложения за оптимизация въз основа на исторически данни за оборудването (напр. коригиране на скоростта на шнека с 2,5%).

Проверка на цифровия близнак:

Валидиране на симулация на параметри на платформата EdgeX Foundry.

Ефект от внедряването

Химическият завод на BASF възприе тази схема, постигайки 17% намаление на потреблението на енергия и 9% повишаване на качеството на продукта.

3

Edge AI и бъдещето на бизнеса: OpenAI o1 срещу DeepSeek R1 за здравеопазване, автомобилостроене и IIoT

Незабавно извличане на базата знания

Архитектурен дизайн

Локална векторна база данни:

Използвайте ChromaDB за съхраняване на ръководства за оборудване и спецификации на процесите (вграждане на измерение 768).

Хибридно извличане:

Комбинирайте алгоритъма BM25 + косинусно сходство за заявка.

Генериране на резултати:

Моделът R1-7B обобщава и прецизира резултатите от извличането.

Типичен случай

Инженерите на Siemens отстраняваха повреди в инверторите чрез заявки на естествен език, намалявайки средното време за обработка с 58%.

Предизвикателства и решения при внедряването

Ограничения на паметта:

Използвана е технология за квантуване на KV кеша, намалявайки използването на памет от 14B модела от 32GB на 9GB.

Осигуряване на производителност в реално време:

Стабилизирана латентност на единичен инференциален извод до ±15 ms чрез CUDA Graph оптимизация.

Дрейф на модела:

Седмични постепенни актуализации (предаване само на 2% от параметрите).

Екстремни среди:

Проектиран за широк температурен диапазон от -40°C до 85°C с ниво на защита IP67.

5
微信图片_20240614024031.jpg1

Заключение

Текущите разходи за внедряване вече са намалели до $599/възел (Jetson Orin NX), като мащабируеми приложения се формират в сектори като 3C производство, автомобилен монтаж и енергийна химия. Очаква се непрекъснатата оптимизация на MoE архитектурата и технологията за квантуване да позволи на модела 70B да работи на периферни устройства до края на 2025 г.

Намерете решение за кабели за ELV

Контролни кабели

За BMS, BUS, индустриален, инструментален кабел.

Структурна кабелна система

Мрежа и данни, оптичен кабел, пач корд, модули, лицева плоча

Преглед на изложби и събития за 2024 г.

16-18 април 2024 г. Енергетично изложение за Близкия изток в Дубай

16-18 април 2024 г. Securika в Москва

9 май 2024 г. СЪБИТИЕ ЗА ПРЕДСТАВЯНЕ НА НОВИ ПРОДУКТИ И ТЕХНОЛОГИИ в Шанхай

22-25 октомври 2024 г. СИГУРНОСТ КИТАЙ в Пекин

19-20 ноември 2024 г. CONNECTED WORLD KSA


Време на публикуване: 07 февруари 2025 г.