腾讯混元开源“极小”模型,实际存储仅占用600MB
创始人
2026-02-10 21:40:27
0

新京报贝壳财经讯(记者罗亦丹)2月10日,腾讯混元开源面向消费级硬件场景的“极小”模型HY-1.8B-2Bit,该模型基于1.8B参数的小尺寸模型,通过2Bit量化技术,等效参数量约为0.3B,实际存储占用仅约600MB,比常用的一些手机应用还小,实现了端侧部署的新突破。

该模型基于混元团队首创的产业级2Bit端侧量化方案,通过对HY-1.8B-Instruct模型进行2比特量化感知训练(QAT)产出,模型大小减少至原始精度模型的1/6,同时在真实端侧设备上生成速度提升2-3倍,可大幅提升使用体验。能力上,模型还保留了原版的思维链,可以为不同复杂度的任务提供相应深度的推理过程。这是业界首个实现2bit产业级量化的端侧模型实践。

随着大语言模型普及,如何将模型在手机、耳机或智能家居等设备上应用,成为业界难题,尤其是不少应用对模型的离线部署、私密性等都有更高的需求,这就需要更多能够在端侧运行的又小又强的模型。目前,模型已在开源模型社区Huggingface和Github上线。

编辑 杨娟娟

校对 柳宝庆

相关内容

热门资讯

拿水莲灾损当笑话?美浓青农爆气... 中国台湾网6月27日讯 据台媒“中时新闻网”报道,高雄连日强降雨造成美浓地区水莲产业严重受灾。中国国...
马斯克质疑IBM“0.7纳米芯... IT之家 6 月 27 日消息,据科技媒体 Wccftech 昨天报道,亿万富翁埃隆 · 马斯克认为...
【科技资讯】自主研制!卫星互联... 记者从银河航天获悉,在日前举行的2026上海世界移动通信大会上,该公司首次公开展示自主研制的第二代手...
产教融合创新发展论坛暨华为院校... 央广网长春6月27日消息(记者张学龙)26日,由华为技术有限公司主办、吉林建筑科技学院承办的“数智赋...
原创 去... 都知道新能源车好,价格便宜,配置高,够智能,一度电几毛钱,百公里才花七八块钱,一年省下大几千油钱,怎...
山东曲阜一牌坊顶部脱落致1死6... 6月27日,有网友发布视频称,山东曲阜一牌坊倒塌,有人员受伤。网上多段视频显示,一个写有“南辛古集”...
智能马桶冲水无力怎么办 随着科技的进步和人们生活水平的提高,智能马桶作为一种高科技家居产品,逐渐走进了人们的生活。它采用了先...
洗衣机的开关拆除方法 洗衣机的开关拆除方法有以下几个步骤: 步骤一:准备工具和备件 首先需要准备拆卸和安装所需要的工具...
刷乳胶漆注意事项及通风时间 刷完乳胶漆后需要等待3-7天才能开窗通风,以避免灰尘和杂质附着在油漆表面上。刷乳胶漆的施工工序包括地...
一方混凝土能打多少平方?混凝土... 一方混凝土能够浇筑10个平方10厘米厚的面积。在混凝土施工过程中,要注意浇筑高度、使用时间、振捣搅动...