无论是在云端、边缘还是在端点,AI应用都有广泛的需求,包括不同的延迟、计算或功耗需求。