適用於 FPGA 推斷的量化類神經網路

神經網路的低精度量化能以相同的佔用空間提供更高的輸送量,或減少資源使用量,從而支援 AI 應用程式規格。塊浮點(BFP)在這種情況下特別有用,因為它的高動態範圍允許在保持精度的同時降低精度。任何準確度的下降都可以通過使用我們的開源軟體進行重新訓練來彌補。