DeepSeek-R1 apvieno mākslīgo intelektu un Edge Computing rūpnieciskajam lietu internetam (IoT)

Ievads

DeepSeek-R1 mazie destilētie modeļi tiek precīzi noregulēti, izmantojot DeepSeek-R1 ģenerētos domu ķēdes datus, kas apzīmēti ar...tagi, kas manto R1 spriešanas iespējas. Šīs precīzi pielāgotās datu kopas skaidri ietver spriešanas procesus, piemēram, problēmu dekompozīcijas un starpposma dedukciju. Pastiprināšanas mācīšanās ir saskaņojusi destilētā modeļa uzvedības modeļus ar R1 ģenerētajiem spriešanas soļiem. Šis destilācijas mehānisms ļauj maziem modeļiem saglabāt skaitļošanas efektivitāti, vienlaikus iegūstot sarežģītas spriešanas spējas, kas ir tuvu lielāku modeļu spējām, kas ir būtiska pielietojuma vērtība resursu ierobežotos scenārijos. Piemēram, 14B versija sasniedz 92% no sākotnējā DeepSeek-R1 modeļa koda pabeigšanas. Šajā rakstā ir iepazīstināts ar DeepSeek-R1 destilēto modeli un tā galvenajiem pielietojumiem rūpnieciskajā perifērijas skaitļošanā, kas apkopoti šādos četros virzienos, kā arī ar konkrētiem ieviešanas gadījumiem:

dc3c637c5bead8b62ed51b6d83ac0b4

Iekārtu paredzamā apkope

Tehniskā ieviešana

Sensoru sapludināšana:

Integrējiet vibrācijas, temperatūras un strāvas datus no PLC, izmantojot Modbus protokolu (paraugu ņemšanas frekvence 1 kHz).

Funkciju ieguve:

Palaidiet Edge Impulse uz Jetson Orin NX, lai iegūtu 128 dimensiju laika rindu pazīmes.

Modeļa secinājums:

Izvietojiet DeepSeek-R1-Distill-14B modeli, ievadot pazīmju vektorus, lai ģenerētu kļūmju varbūtības vērtības.

Dinamiskā regulēšana:

Aktivizēt apkopes darba uzdevumus, ja ticamības līmenis ir > 85%, un uzsākt sekundāro verifikācijas procesu, ja tas ir < 60%.

Attiecīgā lieta

Schneider Electric ieviesa šo risinājumu kalnrūpniecības iekārtās, samazinot kļūdaini pozitīvo rezultātu līmeni par 63 % un uzturēšanas izmaksas par 41 %.

1

DeepSeek R1 destilētā modeļa palaišana InHand AI Edge datoros

Uzlabota vizuālā pārbaude

Izvades arhitektūra

Tipisks izvietošanas process:

kamera = GigE_Vision_Camera(500 kadri/s) # Gigabitu industriālā kamera
kadrs = kamera.capture() # Uzņemt attēlu
priekšapstrāde = OpenCV.denoise(kadrs) # Trokšņu dzēšanas priekšapstrāde
defect_type = DeepSeek_R1_7B.infer(preprocessed) # Defektu klasifikācija
ja defekta_tips != 'normāls':
PLC.trigger_reject() # Trigeru kārtošanas mehānisms

Veiktspējas rādītāji

Apstrādes aizkave:

82 ms (Jetson AGX Orin)

Precizitāte:

Iesmidzināšanas formēšanas defektu noteikšana sasniedz 98,7%.

2

DeepSeek R1 ietekme: uzvarētāji un zaudētāji ģeneratīvajā mākslīgā intelekta vērtību ķēdē

Procesa plūsmas optimizācija

Galvenās tehnoloģijas

Dabiskās valodas mijiedarbība:

Operatori iekārtu anomālijas apraksta ar balsi (piemēram, "Ekstrūdera spiediena svārstības ±0,3 MPa").

Multimodālā spriešana:

Modelis ģenerē optimizācijas ieteikumus, pamatojoties uz iekārtu vēsturiskajiem datiem (piemēram, pielāgojot skrūves ātrumu par 2,5 %).

Digitālā dvīņa verifikācija:

Parametru simulācijas validācija EdgeX Foundry platformā.

Īstenošanas efekts

BASF ķīmiskā rūpnīca ieviesa šo shēmu, panākot enerģijas patēriņa samazinājumu par 17 % un produkta kvalitātes līmeņa pieaugumu par 9 %.

3

Edge AI un biznesa nākotne: OpenAI o1 salīdzinājumā ar DeepSeek R1 veselības aprūpei, autobūvei un rūpnieciskajam lietu internetam (IIoT)

Zināšanu bāzes tūlītēja izguve

Arhitektūras dizains

Lokālā vektoru datubāze:

Izmantojiet ChromaDB, lai uzglabātu iekārtu rokasgrāmatas un procesu specifikācijas (ieguldot dimensiju 768).

Hibrīda izguve:

Apvienojiet BM25 algoritmu + kosinusa līdzību vaicājumam.

Rezultātu ģenerēšana:

R1-7B modelis apkopo un precizē izguves rezultātus.

Tipisks gadījums

Siemens inženieri novērsa invertora kļūmes, izmantojot dabiskās valodas vaicājumus, samazinot vidējo apstrādes laiku par 58 %.

Izvietošanas izaicinājumi un risinājumi

Atmiņas ierobežojumi:

Izmantota KV kešatmiņas kvantizācijas tehnoloģija, samazinot 14B modeļa atmiņas izmantošanu no 32 GB līdz 9 GB.

Reāllaika veiktspējas nodrošināšana:

Stabilizēta viena secinājuma latentuma vērtība līdz ±15 ms, izmantojot CUDA Graph optimizāciju.

Modeļa dreifs:

Iknedēļas pakāpeniski atjauninājumi (pārraidot tikai 2% parametru).

Ekstrēmi apstākļi:

Paredzēts plašam temperatūras diapazonam no -40°C līdz 85°C ar IP67 aizsardzības līmeni.

5
微信图片_20240614024031.jpg1

Secinājums

Pašreizējās ieviešanas izmaksas tagad ir samazinājušās līdz 599 ASV dolāriem par mezglu (Jetson Orin NX), un mērogojamas lietojumprogrammas veidojas tādās nozarēs kā 3C ražošana, automobiļu montāža un enerģētikas ķīmija. Paredzams, ka nepārtraukta MoE arhitektūras un kvantizācijas tehnoloģijas optimizācija ļaus 70B modelim darboties perifērijas ierīcēs līdz 2025. gada beigām.

Atrodiet ELV kabeļu risinājumu

Vadības kabeļi

BMS, BUS, rūpnieciskajiem, instrumentācijas kabeļiem.

Strukturēta kabeļu sistēma

Tīkls un dati, optiskās šķiedras kabelis, plākstera vads, moduļi, priekšējā plāksne

2024. gada izstāžu un pasākumu apskats

2024. gada 16.–18. aprīlī Dubaijā notiks Tuvo Austrumu enerģētikas izstāde

2024. gada 16.–18. aprīlī Securika Maskavā

2024. gada 9. maijā Šanhajā notika JAUNU PRODUKTU UN TEHNOLOĢIJU ATKLĀŠANAS PASĀKUMS

2024. gada 22.–25. oktobrī Pekinā notiks ĶĪNAS DROŠĪBAS konference

2024. gada 19.–20. novembris, CONNECTED WORLD KSA


Publicēšanas laiks: 2025. gada 7. februāris