AI计算IP核 IP Core
Mobilenet-SSD
计算存储资源可分配
内部存储支持
支持
深度:可调(32bit MAX)
宽度:自适应调节(128~512bit)
MAC阵列尺寸
INT8
INT16
FP16
FP32
位宽可调节
≥ 64x64
支持数据类型
Conv
Pooling
ReLU
Concat
支持算子类型
Max pooling
Pooling类型
2^N (512bit MAX)
对应模型典型Latency
@200MHz
1.71ms
Inception-v2
ResNet50
BERT
高精度量化能力
支持
支持
深度:可调(32bit MAX)
宽度:自适应调节(128~512bit)
INT8
INT16
FP16
FP32
Max,Ave /3x3 5x5 7x7 9x9
2^N (512bit MAX)
≥ 64x64
Conv
Pooling
ReLU
Concat
BatchNorm
15.52ms
支持
支持
深度:可调(32bit MAX)
宽度:自适应调节(128~512bit)
INT8
INT16
FP16
FP32
Max,Ave /3x3 5x5 7x7 9x9
2^N (512bit MAX)
≥ 64x64
Conv
Pooling
ReLU
Concat
Scale
支持
深度:可调(32bit MAX)
宽度:自适应调节(128~512bit)
INT8
INT16
FP16
FP32
2^N (512bit MAX)
≥ 64x64
Matrix
Embedding
Linear
LayerNorm
17.1ms
支持
32.79ms
支持
▪ Fully-connected layers
▪ Dilated convolutions
▪ Max pooling, Average Pooling
▪ ReLU, GeLU
▪ Matrix Multiplications
产品参数
参数可调节,部署更灵活
▪ 位宽可调节
▪ 计算MAC资源可调节
▪ 存储资源可调节
支持多种数据类型,量化精度高
▪ INT8, INT16, FP16, FP3
▪ 单模型支持各层不同精度量化
存算一体,低延时,高能效比
▪ 单模型支持各层不同精度量化
▪ 高算力密度,高能效比
▪ 低外存访问,低延时
可重构架构,支持算子种类多,模型兼容性强