元象大模型开源30款量化版本可更低成本部署

2024-03-28 14:08 · 稿源：站长之家

站长之家(ChinaZ.com) 3月28日消息:元象大模型开源了30款量化版本，支持 vLLM 和 llama.cpp 等主流框架的量化推理，无条件免费商用。

对量化前后的模型能力、推理性能进行评估，以 XVERSE-13B-GPTQ-Int4量化版本为例，量化后模型权重压缩了72%，总吞吐提高了1.5倍，同时保留了95% 的能力。

微信截图_20240328140935.png

开发者可以根据技能、软硬件配置和具体需求选择不同推理框架和数据精度的模型。如果本地资源有限，可以直接调用元象大模型的 API 服务（chat.xverse.cn）。

总体来说，元象大模型的开源量化版本提供了方便快捷的部署方式，可以根据需求选择不同的框架和精度模型进行部署和推理。

元象大模型下载：

Hugging Face:https://huggingface.co/xverse
ModelScope魔搭:https://modelscope.cn/organization/xverse
Github:https://github.com/xverse-ai

（举报）

相关推荐

关键词：

联想直营体系赋能技术平权！来酷科技首发大模型极简部署方案

近日，联想集团旗下智慧零售与智能制造企业来酷科技，运营的全国联想直营店正式推出“DeepSeek R1 模型本地部署服务”。作为联想集团面向终端消费者的直营零售与直营服务窗口，来酷科技以 129 元普惠价面向全网开售该服务，通过“智能识别PC配置+一键轻松安装”的极简方式，将前沿AI大语言模型轻量化部署至本地计算机，实现从“云端依赖”到“端侧自主”的跨越。这不�

联想 AI技术大语言模型

8天前
提升大模型自动修Bug能力豆包正式开源首个多语言类SWE数据集

今日，字节跳动豆包大模型团队宣布，正式开源首个多语言类SWE数据集Multi-SWE-bench，可用于评估和提升大模型自动修Bug”能力。在SWE-bench基础上，Multi-SWE-bench首次覆盖Python之外的7种主流编程语言，是真正面向全栈工程”的评测基准。相比于以往聚焦Python的单语言任务，Multi-SWE-bench更贴近现实中的多语言开发场景，也更能反映当前模型在自动化软件工程”方向上的实际能力边界。

字节跳动多语言数据集大模型自动修复

17天前
阿丘科技李嘉悦：大模型驱动的AI检测范式变革——大模型、小模型、智能体的协同进化

3月28日，由机器视觉产业联盟主办、慕尼黑展览有限公司承办的VisionChina2025机器视觉展在上海新国际博览中心圆满落幕。阿丘科技产品总监李嘉悦在机器视觉及工业应用研讨会现场，围绕“大模型驱动的AI检测范式变革:大模型、小模型与智能体的协同进化”的主题，发表了精彩演讲。”今年，在这个快速变化的时代，我要补充一句:“AI工业视觉的格局正在加速变革，不会用大模型的将会被善用大模型的人淘汰。

机器视觉 AI检测工业应用

19天前
荐1000万上下文！新开源多模态大模型，单个GPU就能运行

今年2月初，谷歌发布的Gemini2.0Pro支持200万上下文，震惊了整个大模型领域。仅过了2个月，Meta最新开源的Llama4Scout就将上下文扩展至1000万，整整提升了5倍开启千万级时代。根据实验数据显示，Llama4Behemoth在MMLUPro、GPQA、MATH-500等测试的数据比GPT-4.5、ClaudeSonnet3.7、Gemini2.0Pro更好。

Gemini2.0Pro Llama4Scout 上下文扩展

20天前
AI 大模型的困境：数据才是真正的“燃料”

一旦掉入AI坟场，幻觉将永远存在，噩梦才刚开始。最近有许多客户在考虑上AI大模型一体机、AI私有化、AI大模型部署等项目，但小心进入AI大模型的坟场，在光鲜亮丽的背后，AI大模型也面临着诸多困境，其中最为核心的问题便是数据。只有拥有高质量、多样化、易于管理的数据，AI大模型才能发挥出其真正的潜力，为企业带来更大的价值。

AI 大模型数据质量

25天前
DeepSeek领航大模型普惠化浪潮，xAI/微美全息加速开源AI布局打造新格局

DeepSeek 作为当前最受关注的大模型之一，凭借其技术创新正在加速 AI 普惠化进程。根据机构新报告显示，DeepSeek已经成为全球增长最快的AI工具，其每月新增网站访问量已经超过OpenAI的ChatGPT。DeepSeek市场份额全球第三目前，DeepSeek市场份额6.58%，仅次于ChatGPT和Canva。DeepSeek是继ChatGPT之后的又一现象级AI产品，它的市场份额从2.34%快速增长至6.58%，展现出强劲的增长态势。全球著名�

DeepSeek AI工具技术创新

13天前
苦等一年 Meta终于放大招正式发布开源大模型Llama 4

美国科技巨擘Meta重磅推出其迄今最为强大的开源AI模型Llama4，恰逢Llama3上市一周年之际。Llama4系列采用了先进的混合专家架构，这一架构在模型训练及用户查询回答过程中展现出更高效率，通过将模型划分为多个专注于特定任务的专家”子模型，实现精准高效的处理。Meta首席执行官扎克伯格表示：他们的目标是建立世界领先的人工智能，将其开源，并使其普遍可用，以便世界上每个人都能受益。

Meta Llama 4

21天前
Llama 4大模型跌落神坛：作弊刷榜、代码能力极差、和DeepSeek比就是伪开源

被寄予厚望的美国Meta公司的最新开源大模型Llama4发布不到2天时间，口碑急转直下，被质疑为刷榜作弊实际效果差、开源条件多部署门槛高是伪开源等。大模型评测平台LMArena亲自下场发文，打脸Meta提供给平台的Llama4是“特供版”。Meta若继续在商业控制与技术开放之间摇摆，恐将在AI竞赛中进一步失去开发者支持。

Meta Llama 4

19天前
合合信息发布“大模型加速器 2.0”，助力大模型跨越“幻觉”障碍

近日，上海合合信息科技股份有限公司（简称“合合信息”）TextIn“大模型加速器 2.0”版本正式上线，凭借其多维度升级，为降低大模型“幻觉”风险、推动大模型精准应用提供了强大助力。训练数据是影响大模型“认知能力”的关键，合合信息“大模型加速器 2.0”基于领先的智能文档处理技术，从数据源头入手，对复杂文档的版式、布局和元素进行精准解析及结构化处理，

大模型加速器合合信息智能文档处理

6天前
奔驰新款CLA接入豆包大模型

4月22日，奔驰与火山引擎合作的首款国产纯电车型CLA全球首发亮相。该车搭载奔驰自研MB.OS架构，接入火山引擎大模型，支持个性化智能交互体验。智能系统可识别4种情绪并给予反馈，交互效率提升50%，唤醒仅需0.2秒。虚拟助手能解答百科问题并协助车辆功能设置。这是双方继2024年8月达成AI战略合作后落地的首款量产车型，结合生成式AI和大数据技术，为中国用户打造更智能的用车体验。

梅赛德斯-奔驰全新纯电长轴距 CLA

3天前

热文

3 天
7天

元象大模型开源30款量化版本可更低成本部署

联想直营体系赋能技术平权！来酷科技首发大模型极简部署方案

提升大模型自动修Bug能力豆包正式开源首个多语言类SWE数据集

阿丘科技李嘉悦：大模型驱动的AI检测范式变革——大模型、小模型、智能体的协同进化

荐1000万上下文！新开源多模态大模型，单个GPU就能运行

AI 大模型的困境：数据才是真正的“燃料”

DeepSeek领航大模型普惠化浪潮，xAI/微美全息加速开源AI布局打造新格局

苦等一年 Meta终于放大招正式发布开源大模型Llama 4

Llama 4大模型跌落神坛：作弊刷榜、代码能力极差、和DeepSeek比就是伪开源

合合信息发布“大模型加速器 2.0”，助力大模型跨越“幻觉”障碍

奔驰新款CLA接入豆包大模型

热文

“AI教父”杰弗里·辛顿再次发出警告：AI可能正在“失控”！2.29万热度

美国网购市场动荡，希音、Temu 率先在美开启“涨价潮”！0.70万热度

印度将中国电子投资压股至 10%，且要求“技术转让”0.60万热度

反垄断案中，谷歌披露 Gemini 月活达3.5亿，日流量为3500万2.89万热度

Anthropic警告：距离无人干涉的 “AI员工” 时代，只剩一年了！2.84万热度

“你可能患了血癌……” 医生诊断错误，而 ChatGPT 是对的！2.79万热度

Meta AI眼镜“实时翻译”功能全面开放，不联网也能用！2.73万热度

“AI教父”杰弗里·辛顿再次发出警告：AI可能正在“失控”！2.30万热度

郭明錤：iPhone17有望全系配12GB内存！但，有个前提……1.81万热度

4chan 之“死”：互联网最狂野的角落逐渐消逝！1.51万热度

Adobe 发布 Firefly 系列产品，涵盖图片、视频、矢量等1.30万热度

英特尔本周宣布裁员超20%计划，陈立武上任后的首次重大重组0.95万热度

马斯克回归消息传出后，特斯拉股价飙升10%87.10万热度

站长商机

元象大模型开源30款量化版本 可更低成本部署

热文

站长商机

元象大模型开源30款量化版本可更低成本部署