Mindbeam AI发布开源框架Litespark-Inference：让CPU在AI推理中大放异彩-电脑硬件-智能日报

初创公司Mindbeam AI近日推出一款名为Litespark-Inference的开源人工智能推理框架，通过算法优化使大型语言模型能够在消费级CPU上高效运行，显著减少对GPU的依赖。这一创新旨在解决当前AI推理过程中硬件成本高昂、资源分配不均的问题，为行业提供更具性价比的解决方案。

该框架的核心技术是对“三元模型”的支持。这类神经网络将权重参数限制为-1、0和+1三个值，从而大幅减少推理过程中的乘法运算需求。尽管这种设计会略微降低模型精度，但换来了性能的显著提升和内存占用的大幅下降。官方测试数据显示，在特定硬件配置下，Litespark-Inference的吞吐量较标准PyTorch实现提升17至96倍，内存需求降低超过80%。

Mindbeam创始人Nii Osae指出，现有AI推理流程中，CPU通常仅作为数据中转站，负责将用户输入传递给GPU处理。随着模型规模扩大和硬件成本上升，这种模式在边缘计算等内存受限场景中显得尤为低效。公司认为，广泛存在于各类设备中的CPU是尚未被充分开发的计算资源，通过优化算法可以释放其潜力。

Litespark-Inference提供两种部署模式：开发者可在无GPU的本地硬件上运行语言模型；云服务提供商则能通过非聚合架构实现CPU与GPU的协同工作。这种设计既保持了GPU处理复杂任务的优势，又让CPU承担部分推理负载，从而提升整体系统效率。例如，在处理大量Token时，GPU可专注于核心计算，而CPU负责预处理等辅助任务。

实际测试中，该框架展现了强大的硬件适配能力。在Apple M5处理器上，每秒可处理近40个Token，而PyTorch仅能处理约2.3个；在支持英特尔AVX-512指令的系统上，吞吐量提升96倍，内存消耗从4.6GB降至不足800MB。这些数据表明，Litespark-Inference能有效利用现代处理器的SIMD指令集，包括Arm的NEON SDOT和英特尔/AMD的矢量神经网络指令。

Mindbeam开发的自定义内核可自动检测处理器特性并优化执行路径，目前支持Apple Silicon、Intel和AMD处理器。公司计划未来针对AWS Inferentia等专用云硬件进行进一步优化。源代码已在GitHub公开，社区可进行独立测试和改进。Mindbeam透露将在年内推出云端商业化版本，并将技术扩展至机器人和边缘计算等低功耗领域。

这一框架的推出标志着AI推理领域的一次重要尝试，通过重新分配计算资源，为降低行业成本提供了新思路。其开源特性也鼓励更多开发者参与优化，推动技术生态的完善。随着硬件技术的不断进步，类似方案有望在更多场景中发挥作用，改变传统AI部署模式。

手机里未剪辑的4K样片、掌机中刚下载的3A大作、平板上积攒半年的网课资料——当设备一次次弹出存储空间不足，你才意识到：容量不是数字游戏，而是真实生活的底线。长寿命，不是虚言，是千次擦写后的性能如初；大容…

6月16日消息，小米 REDMI 旗下首款头戴降噪耳机官宣本月发布，现已开启预约，可前往小米之家进店体验。小米今年 5 月已在海外市场推出一款REDMI Headphones Neo 头戴式耳机，该产品支持…

规模方面，截止6月15日，科创人工智能ETF易方达（588730）最新份额为6.67亿份，最新规模为11.00亿元。回顾2025年12月31日，科创人工智能ETF易方达（588730）份额为10.52亿份，…

IT之家 6 月 16 日消息，博主 @数码闲聊站今天在微博透露，某厂的 α 迭代机型已经立项，拥有“2nm 骁龙旗舰芯片 + 顶级影像定义+ 花活儿”。博主补充道，荣耀MagicOS11 已开启超前尝…

A：苹果上个月推送的iOS 26.5主要带来了三项更新：一是RCS消息的端对端加密功能，提升了用户通信安全性；二是新增了一款Pride Luminance主题壁纸；三是在苹果地图中加入了全新的"建议地点"功…

IT之家6月16日消息，据外媒electrek今天报道，百度旗下出行平台“萝卜快跑”（ApolloGo）已在瑞士获得L4级自动驾驶出租车运营许可。IT之家从报道获悉，萝卜快跑获得的许可覆盖瑞士东部80平方公里…

当开发者获得可持续收益、用户享受更优质体验、广告主实现确定性增长，三方共赢的飞轮正在鸿蒙生态中加速转动。正如会上鲸鸿动能商业增长业务负责人所表示的：“我们做变现和商业化服务，不是简单地帮开发者把流量卖出去。…

【CNMO科技消息】近期，有消息称，苹果原计划在2026年秋季发布会上推出其筹备多年的首款折叠屏手机（暂名为iPhoneUltra或iPhone Fold），因铰链设计和PCB工艺等技术难题，这款备受期待的…

其核心轴体为派世自主研发的Gravity-S01磁轴，出厂预设触发压力为四十克力，允许误差正负五克力；总行程为四毫米，允许误差正负零点三毫米；初始磁通量为六十高斯，允许误差正负二十高斯；触底磁通量为七百高斯…

安蒙在接受CNBC《科技快报》(The Tech Download)节目采访时谈及了多个话题，包括他对智能手机和应用角色变化的看法、智能眼镜为何可能成为下一个主流消费设备、即将上市的新型电子产品类型，以及芯…

综合来看，如果你想要一部在影像、续航、屏幕护眼和综合防护上都达到顶配的手机，荣耀600系列凭借其“无短板”的全能表现，无疑是当前最值得蹲守的“好看好用”之选。市场上其他机型如OPPO Reno16标准版和i…

证券之星消息，截至2026年6月15日收盘，石头科技(688169)报收于102.6元，上涨0.6%，换手率3.06%，成交量7.92万手，成交额8.1亿元。 6月15日的资金流向数据方面，主力资金净流入82…

PCDaliy智能日报 - 每日更新世界智能科技的最新进展、产品评测和行业动态，为您提供全面而深入的视角，让您在这个日新月异的智能时代始终领先一步。
PC Daily（www.pcd.com.cn）所有稿件免费开放转载，转载请务必保留版权，并注明来源网址。
合作微信：netspread（注明:智能日报）
Copyright © PCD 2012-2023 www.pcd.com.cn All rights reserved. 鲁ICP备2022032383号-10 鲁公网安备37010202700527号