Nyheter

Neural nettverk akseleratorer for Lattice FPGAs

Begge er rettet mot å implementere nevrale nettverk i forbruker- og industrielle nettverksprodukter. De er ikke egnet for nettverksopplæring, noe som må gjøres andre steder.

'Binarisert neuralt nettverk (BNN) akselerator' støtter 1bit vekter, har 1bit aktivering kvantisering, og er designet for å bli brukt med firmaets iCE40 UltraPlus FPGAs.

Kombinasjonen av akselerator og FPGA er beregnet på alltid-på-applikasjoner, for eksempel verbal nøkkel setning deteksjon, ansiktsgjenkjenning og objektdeteksjon.

Lattice-BNN-acceleratorForutsatte BNN + iCE40 UltraPlus applikasjonsparametere er:

  • 1bit neuralt nettverk
  • 1-10mW aktivt forbruk
  • 5,5 mm2 fotavtrykk
  • ~ $ 1 bom

Det andre produktet, "CNN-akselerator", støtter et utvalg av 1, 8 og 16bit-data for både vekt og aktivering, er rettet mot ECP5 FPGA-er - som generelt er beregnet på videobruk.

For å lagre FPGA-ressurser kan forskjellige ordbredder (1, 8 eller 16bit) blandes og matches i forskjellige lag av nevrale nettet.

Denne kombinasjonen av akselerator og FPGA er beregnet for applikasjoner, inkludert ansiktssporing, objektsporing, registrering av fartskilt og objekttelling.

Lattice-CNN-accelerator

Forutsatte CNN + ECP5 applikasjonsparametere er:

  • 1, 8 eller 16bit nettverk
  • <1W active consumption
  • 100mm2 fotavtrykk
  • ~ $ 10 bom

For programvareutvikling, er firmaet introduserer en nettverkscompiler kompatibel med både Caffe og TensorFlow nettverksutviklingssystemer.

Ifølge Lattice markedsføringsdirektør Deepak Boppana krever kompilatoren ingen tidligere RTL-opplevelse, og vil også analysere og simulere design.

Planen er, sier Boppana, at kompilatoren vil bli brukt sammen med firmaets Radiant utviklingsmiljø for BNN + iCE40 UltraPlus-kombinasjonen, eller dens Diamond utviklingsmiljø for CNN + EC5P.

For kunder er usikker på hvordan man utvikler en nettbasert applikasjon, har firmaet samarbeidet med designtjenester, inkludert Colorado Engineering, Wipro, Softnautincs og VectorBlox.

Maskinvareutviklingstavler er allerede tilgjengelige for iCE40 UltraPlus og ECP5.

Grensesnittbrudd og dataaggregasjonsapplikasjoner forventes i høyvolum IoT-applikasjoner, inkludert smarte høyttalere, overvåkningskameraer, industriroboter og droner.

Referansedesigner blir gitt for: ansiktsgjenkjenning, nøkkelsettingsdetektering (iCE40 UltraPlus), og for EC5P: objekttelling, ansiktssporing og registrering av fartskilt.

Acceleratorene er merket 'Sensai‘.