苹果ML工程师Awni Hannun实测,Llama 4 Maverick在单台M3 Ultra-512GB上使用MLX推理框架时速度极快,达到了50 token/秒! 这些模型拥有极其庞大的参数量,但每次只有少量参数(专家)被激活。由于事先无法预测哪些参数会被激活,因此必须把所有参数同时存放在高速的GPU显存中。
苹果中国官网上新动作,近日推出了搭载M4芯片的MacBook Pro与Mac mini翻新机型,为消费者带来了不小的优惠。与全新机型相比,这些翻新机型普遍享有85折的折扣,起售价仅需3799元。 具体来看,Mac mini的翻新机型起售价为3799元 ...