首页 > AI头条  > 正文

Arthur推出首个开源实时 AI 评估引擎Arthur Engine

2025-04-02 14:47 · 来源: AIbase基地

随着人工智能(AI)技术的迅速发展,如何在大规模环境下有效应用这些技术成为了一大挑战。近日,Arthur正式推出了Arthur Engine,这是一款首个开源的实时 AI 评估引擎,旨在帮助团队监控、调试和改进生成式 AI 及传统机器学习(ML)模型。其最大的特点是无需依赖第三方工具,确保数据隐私安全,同时也完全免费。

QQ_1743576400312.png

在2025年,实时 AI 评估的重要性愈加凸显。随着 AI 技术的广泛应用,相关风险也在不断增加。例如,调查显示,8.5% 的员工提示中包含敏感数据,模型在没有持续监控的情况下会发生退化,慢速的迭代周期则可能导致模型性能下降。Arthur Engine通过提供即时的可见性、实时的保护措施以及在线模型优化,来解决这些问题,确保 AI 技术的健康发展。

Arthur Engine与传统的 AI 监控工具相比,具有显著的优势。该引擎在本地运行,保障了数据的主权,并消除了合规风险。其核心功能包括实时 AI 评估,能够即时检测故障;主动保护措施,可以实时干预,防止模型产生错误输出;可定制的评估指标,允许用户根据特定的 AI 应用场景进行调整;同时,它支持所有模型,包括 GPT、Claude、Gemini 等开放权重模型,以及传统的机器学习模型。

Arthur公司技术负责人徐媛(Cherie Xu)表示:“通过开源Arthur Engine,我们让所有开发者都能够轻松访问 AI 信任与安全的工具,使他们能够用高度可定制的高性能监控工具来保护 AI 系统。” Arthur Engine也是阿瑟公司更广泛的 AI 性能监控套件的一部分,旨在帮助组织实时验证 AI 输出,及时发现性能波动,确保合规性和可解释性。

此次开源发布标志着 AI 透明度、安全性和性能监控的新标准。有关Arthur Engine的更多信息可以在 GitHub 上找到,用户还可以加入Arthur 平台的等待名单。AI 正不断改变世界,我们的目标是确保其良好运行。

入口:https://top.aibase.com/tool/arthur-engine

划重点:  

🔍 Arthur 推出开源实时 AI 评估引擎,帮助团队监控和改进 AI 模型。  

🔒 Arthur Engine在本地运行,保障数据隐私和合规性,消除第三方依赖。  

⚙️ 该引擎支持多种模型,并提供实时检测和定制化评估功能。

  • 相关推荐
  • AI日报:腾讯混元推出5个开源3D模型;Anthropic发布MCP传输机制重大升级;Mistral最新开源模型Mistral Small 3.1

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、腾讯混元推出5个开源3D模型:30秒生成,兼容多平台腾讯混元宣布推出五个全新开源3D生成模型,基于Hunyuan3D-2.0,具备更快的生成速度和更丰富的细节。通过精细的训练过程,OLMo232B在多项基准测试中超越了GPT-3.5Turbo和GPT-4omini,展现出卓越的性能和更高的训练效率。

  • 见过开源模型,没见过直接开源AI应用的,这把火山引擎玩大了

    源神启动!大模型开源潮从模型卷向了应用,这一次下场的超级玩家是火山引擎。3月3日,火山引擎正式上线“大模型应用实验室”平台,一口气开源了手机助手、DeepSeek联网版、实时视频理解、互动双语视频生成器等AI应用,涵盖移动终端、内容创作以及教育娱乐等多个领域。火山引擎“大模型应用实验室”的开源应用代码托管在GitHub上,开发者可以通过以下链接访问:https://gith

    29天前
  • 深耕智能生态:三星SmartThings meets AI Home让家更懂你

    3月21日,2025三星家电新品发布会成功举行,推出2025款AI电视、AI神系列生活家电、显示器旗舰新品等全系生态产品。三星进一步拓展“AIforAll”的愿景,通过AI赋能将尖端显示科技、艺术化设计及智能生态深度融合,打造出了解用户以及用户家庭的创新解决方案,并依托SmartThings智能家居平台,推出SmartThingsmeetsAIHome生活方式,以便捷、安全的AIHome体验,赋予“家”新的意义。三星将在智能家居领域持续深耕,让每个家庭都能在科技赋能下,成为承载幸福的港湾。

  • Anthropic“AI侵权战”首胜,法院驳回环球等公司的禁令申请

    人工智能公司Anthropic在一场具有里程碑意义的法庭较量中初次战胜了知名音乐出版商,该案件一直处于人工智能与知识产权争议的前沿。2025年3月25日,美国地方法院法官李佑美做出了一项具有里程碑意义的裁决,驳回了环球音乐集团、康科德音乐集团和ABKCO公司提出的暂停Anthropic使用歌曲歌词来训练其人工智能聊天机器人Claude的请求。内容所有者和技术创作者之间的“法律战”仍在继续,并将继续影响知识产权领域的格局、平衡创新与合理报酬之间的关系。

  • Voice Agent 开源框架 TEN,让你的 AI Agent 能听能说!

    搭建VoiceAgent就像是把大象装进冰箱,看上去只有三步很简单:1)选择LLM/STT/TTS大模型2)接入WebRTC或WebSockets进行实时传输3)调整参数封装但在实际使用过程中,却困难重重:“😫回声太大、噪音太多”、“人声太杂听不清👂”“人工智能如智障,说话都不能打断🤐”“延迟太高反应慢🐢”、“又有新模型了又要重新接😞”“三段式看着简单实现的工程太难💻”“多模态数据�

  • 英伟达全力发展AI Agent开源专属大模型,最强AI工厂

    全球AI领导者英伟达在美国圣何塞举办了“GTC2025”全球产品、开发者大会,涵盖大模型、AIAgent、实体机器人、AI专用芯片、量子计算等技术分享。LlamaNemotron一共有Nano、Super和Ultra三种模型,每种都针对不同的部署需求进行了优化。Nano模型适用于个人电脑和边缘设备,例如,手机、平板、笔记本等;Super模型在单个GPU上提供最佳的准确性和吞吐量;Ultra模型在多GPU服务器上提供最大的Agent准确性。

    17天前
  • 氛围编程师崛起!年薪87万一天15小时,Karpathy用400行AI代码点燃硅谷

    【新智元导读】氛围编程彻底火了。没有任何Swift编程经验的Karpathy亲自代言,通过与ChatGPT多轮对话,仅用400行代码构建出自己的首个iOS应用。一句话总结就是,「氛围编程」值得所有「段位」的开发者亲身投入体验。

  • AI长眼睛了!谷歌推出Gemini实时视频功能

    谷歌发言人亚历克斯约瑟夫通过电子邮件证实,谷歌已正式在GeminiLive平台推出崭新的AI功能。此功能赋予AI视觉”,能直接查看用户设备屏幕或手机摄像头的画面,并即刻回应用户的查询。未来数月内,谷歌计划推动更多用户升级至Gemini,逐步取代之前的GoogleAssistant。

  • SHOPLINE推出全新 “Buy with Prime应用” 助力中国商家拓展电商业务

    2025年3月18日,全球零售解决方案商和全球零售系统服务商SHOPLINE正式发布BuywithPrime应用。这个应用将支持SHOPLINE商家在其美国SHOPLINE商店上添加BuywithPrime服务。”亚马逊全球副总裁、BuywithPrime和亚马逊多渠道配送业务负责人PeterLarsen表示,“通过帮助商家管理他们在美国的库存,并扩大他们对Prime会员的触达,这个应用将为SHOPLINE商家开辟跨境增长新机遇。

  • OpenAI要Open了,奥特曼开源首个推理模型,ChatGPT一小时暴增百万用户

    OpenAI终于要OpenAI了!一大早,奥特曼郑重官宣,「未来几个月,将开源一款强大的推理模型」。这是自GPT-2以来,OpenAI首个开源的模型。无疑为OpenAI下一步增添了更多的戏剧性。

今日大家都在搜的词: