Arthur推出首个开源实时 AI 评估引擎Arthur Engine

2025-04-02 14:47 · 来源： AIbase基地

随着人工智能（AI）技术的迅速发展，如何在大规模环境下有效应用这些技术成为了一大挑战。近日，Arthur正式推出了Arthur Engine，这是一款首个开源的实时 AI 评估引擎，旨在帮助团队监控、调试和改进生成式 AI 及传统机器学习(ML)模型。其最大的特点是无需依赖第三方工具，确保数据隐私安全，同时也完全免费。

在2025年，实时 AI 评估的重要性愈加凸显。随着 AI 技术的广泛应用，相关风险也在不断增加。例如，调查显示，8.5% 的员工提示中包含敏感数据，模型在没有持续监控的情况下会发生退化，慢速的迭代周期则可能导致模型性能下降。Arthur Engine通过提供即时的可见性、实时的保护措施以及在线模型优化，来解决这些问题，确保 AI 技术的健康发展。

Arthur Engine与传统的 AI 监控工具相比，具有显著的优势。该引擎在本地运行，保障了数据的主权，并消除了合规风险。其核心功能包括实时 AI 评估，能够即时检测故障;主动保护措施，可以实时干预，防止模型产生错误输出;可定制的评估指标，允许用户根据特定的 AI 应用场景进行调整;同时，它支持所有模型，包括 GPT、Claude、Gemini 等开放权重模型，以及传统的机器学习模型。

Arthur公司技术负责人徐媛（Cherie Xu）表示:“通过开源Arthur Engine，我们让所有开发者都能够轻松访问 AI 信任与安全的工具，使他们能够用高度可定制的高性能监控工具来保护 AI 系统。” Arthur Engine也是阿瑟公司更广泛的 AI 性能监控套件的一部分，旨在帮助组织实时验证 AI 输出，及时发现性能波动，确保合规性和可解释性。

此次开源发布标志着 AI 透明度、安全性和性能监控的新标准。有关Arthur Engine的更多信息可以在 GitHub 上找到，用户还可以加入Arthur 平台的等待名单。AI 正不断改变世界，我们的目标是确保其良好运行。

入口：https://top.aibase.com/tool/arthur-engine

划重点:
🔍 Arthur 推出开源实时 AI 评估引擎，帮助团队监控和改进 AI 模型。
🔒 Arthur Engine在本地运行，保障数据隐私和合规性，消除第三方依赖。
⚙️ 该引擎支持多种模型，并提供实时检测和定制化评估功能。

相关推荐

荐AI日报：腾讯混元推出5个开源3D模型；Anthropic发布MCP传输机制重大升级；Mistral最新开源模型Mistral Small 3.1

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、腾讯混元推出5个开源3D模型:30秒生成，兼容多平台腾讯混元宣布推出五个全新开源3D生成模型，基于Hunyuan3D-2.0，具备更快的生成速度和更丰富的细节。通过精细的训练过程，OLMo232B在多项基准测试中超越了GPT-3.5Turbo和GPT-4omini，展现出卓越的性能和更高的训练效率。

AI日报人工智能 3D模型

18天前
荐见过开源模型，没见过直接开源AI应用的，这把火山引擎玩大了

源神启动!大模型开源潮从模型卷向了应用，这一次下场的超级玩家是火山引擎。3月3日，火山引擎正式上线“大模型应用实验室”平台，一口气开源了手机助手、DeepSeek联网版、实时视频理解、互动双语视频生成器等AI应用，涵盖移动终端、内容创作以及教育娱乐等多个领域。火山引擎“大模型应用实验室”的开源应用代码托管在GitHub上，开发者可以通过以下链接访问:https://gith

开源模型

29天前
深耕智能生态：三星SmartThings meets AI Home让家更懂你

3月21日，2025三星家电新品发布会成功举行，推出2025款AI电视、AI神系列生活家电、显示器旗舰新品等全系生态产品。三星进一步拓展“AIforAll”的愿景，通过AI赋能将尖端显示科技、艺术化设计及智能生态深度融合，打造出了解用户以及用户家庭的创新解决方案，并依托SmartThings智能家居平台，推出SmartThingsmeetsAIHome生活方式，以便捷、安全的AIHome体验，赋予“家”新的意义。三星将在智能家居领域持续深耕，让每个家庭都能在科技赋能下，成为承载幸福的港湾。

三星家电新品发布会 AI电视

14天前
Anthropic“AI侵权战”首胜，法院驳回环球等公司的禁令申请

人工智能公司Anthropic在一场具有里程碑意义的法庭较量中初次战胜了知名音乐出版商，该案件一直处于人工智能与知识产权争议的前沿。2025年3月25日，美国地方法院法官李佑美做出了一项具有里程碑意义的裁决，驳回了环球音乐集团、康科德音乐集团和ABKCO公司提出的暂停Anthropic使用歌曲歌词来训练其人工智能聊天机器人Claude的请求。内容所有者和技术创作者之间的“法律战”仍在继续，并将继续影响知识产权领域的格局、平衡创新与合理报酬之间的关系。

人工智能知识产权合理使用

9天前
Voice Agent 开源框架 TEN，让你的 AI Agent 能听能说！

搭建VoiceAgent就像是把大象装进冰箱，看上去只有三步很简单:1）选择LLM/STT/TTS大模型2）接入WebRTC或WebSockets进行实时传输3）调整参数封装但在实际使用过程中，却困难重重:“😫回声太大、噪音太多”、“人声太杂听不清👂”“人工智能如智障，说话都不能打断🤐”“延迟太高反应慢🐢”、“又有新模型了又要重新接😞”“三段式看着简单实现的工程太难💻”“多模态数据�

Voice Agent LLM

10天前
荐英伟达全力发展AI Agent！开源专属大模型，最强AI工厂

全球AI领导者英伟达在美国圣何塞举办了“GTC2025”全球产品、开发者大会，涵盖大模型、AIAgent、实体机器人、AI专用芯片、量子计算等技术分享。LlamaNemotron一共有Nano、Super和Ultra三种模型，每种都针对不同的部署需求进行了优化。Nano模型适用于个人电脑和边缘设备，例如，手机、平板、笔记本等;Super模型在单个GPU上提供最佳的准确性和吞吐量;Ultra模型在多GPU服务器上提供最大的Agent准确性。

英伟达

17天前
荐氛围编程师崛起！年薪87万一天15小时，Karpathy用400行AI代码点燃硅谷

【新智元导读】氛围编程彻底火了。没有任何Swift编程经验的Karpathy亲自代言，通过与ChatGPT多轮对话，仅用400行代码构建出自己的首个iOS应用。一句话总结就是，「氛围编程」值得所有「段位」的开发者亲身投入体验。

氛围编程 AI编程 iOS应用

12天前
AI长眼睛了！谷歌推出Gemini实时视频功能

谷歌发言人亚历克斯约瑟夫通过电子邮件证实，谷歌已正式在GeminiLive平台推出崭新的AI功能。此功能赋予AI视觉”，能直接查看用户设备屏幕或手机摄像头的画面，并即刻回应用户的查询。未来数月内，谷歌计划推动更多用户升级至Gemini，逐步取代之前的GoogleAssistant。

谷歌AI Gemini Live

13天前
SHOPLINE推出全新 “Buy with Prime应用” 助力中国商家拓展电商业务

2025年3月18日，全球零售解决方案商和全球零售系统服务商SHOPLINE正式发布BuywithPrime应用。这个应用将支持SHOPLINE商家在其美国SHOPLINE商店上添加BuywithPrime服务。”亚马逊全球副总裁、BuywithPrime和亚马逊多渠道配送业务负责人PeterLarsen表示，“通过帮助商家管理他们在美国的库存，并扩大他们对Prime会员的触达，这个应用将为SHOPLINE商家开辟跨境增长新机遇。

全球零售 SHOPLINE发布 Buy

18天前
荐OpenAI要Open了，奥特曼开源首个推理模型，ChatGPT一小时暴增百万用户

OpenAI终于要OpenAI了!一大早，奥特曼郑重官宣，「未来几个月，将开源一款强大的推理模型」。这是自GPT-2以来，OpenAI首个开源的模型。无疑为OpenAI下一步增添了更多的戏剧性。

OpenAI 开源模型推理模型

4天前

今日大家都在搜的词：

热文

3 天
7天

Arthur推出首个开源实时 AI 评估引擎Arthur Engine

荐AI日报：腾讯混元推出5个开源3D模型；Anthropic发布MCP传输机制重大升级；Mistral最新开源模型Mistral Small 3.1

荐见过开源模型，没见过直接开源AI应用的，这把火山引擎玩大了

深耕智能生态：三星SmartThings meets AI Home让家更懂你

Anthropic“AI侵权战”首胜，法院驳回环球等公司的禁令申请

Voice Agent 开源框架 TEN，让你的 AI Agent 能听能说！

荐英伟达全力发展AI Agent！开源专属大模型，最强AI工厂

荐氛围编程师崛起！年薪87万一天15小时，Karpathy用400行AI代码点燃硅谷

AI长眼睛了！谷歌推出Gemini实时视频功能

SHOPLINE推出全新 “Buy with Prime应用” 助力中国商家拓展电商业务

荐OpenAI要Open了，奥特曼开源首个推理模型，ChatGPT一小时暴增百万用户

今日大家都在搜的词：

热文

全球市场遭遇黑色星期五！美股三大指数大跌油价重挫0.49万热度

特朗普关税重创全球前500名富豪：马斯克最惨身家暴跌千亿0.48万热度

微软Windows 11开始菜单大改版！全部应用一页显示、推荐项可彻0.36万热度

今日愚人节 B站绿色像素风年度小会员上线4.68万热度

2025福布斯全球亿万富豪榜发布：马斯克3420亿美元身家再成世界2.63万热度

WordPress.com母公司大调整:裁员281人，多个核心业务受影响2.62万热度

微信：聊天引用现在可以回语音和表情包了2.11万热度

周鸿祎许诺的大饼兑现了亲自给抽奖幸运用户交车1.99万热度

注意听语音提醒！美团、叮咚买菜等平台上线反诈提示1.63万热度

腾讯会议崩了上热搜官方回应：工程师正加速抢修1.58万热度

抖音回应张一鸣加入新加坡国籍传闻：系不实信息1.32万热度

美图云修7.0版本上线：修图效率提升79％1.22万热度

京东：达达员工逐步升级至20薪优秀员工还送股票119.10万热度

站长商机