确保 AI 按预期运行且成本合理
开箱即用的质量评估
实时评估模型和代理的性能、质量和行为
通过评分跟踪和衡量输出质量,这些评分可以检测幻觉、偏差、相关性、毒性、情绪等问题,以及其他开箱即用的评估工具。
令牌使用情况和成本
控制成本并优化整个 AI 堆栈的资源
跟踪特定请求、模型、代理、工作流和其他 AI 基础设施组件的令牌使用情况、运营费用、GPU 和内存利用率以及其他令牌经济学和 GPU 相关指标随时间的变化。
内置防护措施和控制
实时定位并缓解 AI 安全风险
通过针对 PII、PHI 和 PCI 泄露、工具滥用和提示注入的安全、隐私和安全防护措施来保护和改进模型。遵守 AI 安全标准,从而自信地构建和部署值得信赖的 AI 应用程序和系统。
代理性能分析
观察代理表现
跟踪各个代理在一段时间内的请求、错误、延迟、令牌使用情况和质量分数,以建立基准、检测异常值并做出数据驱动的决策。
代理工作流分析
可视化步骤顺序、依赖关系和交接
查看代理工作流(从请求到响应)的相关工具调用、模型和检索步骤,以调查故障。
以交互为中心的跟踪视图
通过 AI 详情、标签和跨度详情获取跟踪级别的可见性
查看与代理工作流每个步骤相关的输入、输出和系统提示以及质量指标,以实现端到端的根本原因分析。