模型输出责任

本文不构成法律意见。所有合同结构与责任分配应由合格律师审核。下述内容仅作为产品决策与合同谈判的入门理解。

问题的本质

传统 SaaS 工具不替用户做决策——Notion 不会自动写错合同条款，Excel 不会自动算错数字。用户用工具做错了事，责任在用户。

Agent 产品换了这个结构。Agent 可以：

自主决定调用哪个工具
自主决定输入什么数据
自主决定何时完成 vs 重试
自主与外部系统交互（发邮件、写文件、调用 API）

每一步都可能产生不可逆的外部影响。如果 agent 帮用户发了错误邮件给客户、写错了合同条款、操作了错误的数据库记录——这个责任在谁？

这个问题没有简单答案。法律先例少，监管框架未成熟。但产品方必须在合同里明确条款，否则争议出现时被动。

三方责任结构

涉及四方：

最终用户——提出任务请求的个人
客户企业——付费方，部署 agent 的组织
产品方——agent 产品的供应商（即你）
上游模型方——Anthropic / OpenAI / 自有部署模型来源

理想情况下责任按以下原则分配：

错误来源	主要责任方
用户提了错误的需求	用户 / 客户企业
用户提了正确需求，agent 误解了	产品方
用户提了正确需求，agent 理解对了但输出错了	产品方（背后可追溯到模型方）
产品方提供的工具本身设计缺陷	产品方
上游模型方系统性偏差 / 错误	产品方（向上游追责，但首位责任）
用户绕过 HITL 直接放行	用户 / 客户企业

关键原则：产品方在面向客户的合同里承担首位责任，但内部应保留向上游模型方追责的权利。

HITL 的法律意义

HITL（Human-in-the-Loop）不仅是质量控制机制，更是责任转移机制。

设想两种合同条款：

A. 全自主 agent：

“agent 自主完成所有任务步骤；产品方对 agent 决策与输出承担首位责任。”

B. HITL 模式：

“高风险动作（发送对外邮件、付款执行、数据修改等）需要用户人工确认。用户确认后产生的影响由用户承担责任。”

B 条款的法律意义：

把”不可逆动作”的最终决定权交给人；技术上 agent 仍可执行，但法律上由人按下”确认”
即使 agent 推荐错了，人按了确认，责任归人
法律上类似”自动驾驶 L2”vs”L4”——L2 司机仍负责，L4 厂商负责

产品方的实际选择：除明确需求与法律团队认可外，默认采用 HITL 模式。全自主 agent 对产品方风险敞口巨大，且当前法律框架未提供充分保护。

合同条款示例

面向企业客户的服务协议中，应包含以下条款（示例文字，需律师审核）：

14. Agent 自主行为与责任

14.1 客户承认 agent 产品的输出由概率模型生成，可能存在错误、不准确、
    或不适合特定场景的内容。客户负责审查 agent 输出并独立验证其
    适用性。

14.2 对于通过 HITL 流程要求用户确认的动作，用户在确认后产生的所有
    影响由客户承担责任。产品方不对用户确认后的动作结果承担责任。

14.3 对于未经 HITL 确认而由 agent 自主执行的动作，产品方承担合理
    范围内的责任。该范围以合同其他条款（责任上限、不可抗力等）为准。

14.4 客户应配置 agent 不得自主执行的动作清单（"high-risk 动作清单"），
    例如：对外邮件发送、付款操作、合同签署、数据库结构修改等。
    清单内动作必须经 HITL 确认；清单外动作 agent 可自主执行。

14.5 产品方对上游模型供应商（Anthropic、OpenAI 等）系统性故障或
    输出偏差的责任以本服务协议为限。客户理解上游模型方的服务条款
    适用于其与产品方间的关系，产品方将合理转移可获得的保障。

保险产品的现状

E&O（Errors & Omissions）保险传统上覆盖软件错误造成的客户损失。Agent 产品的保险情况：

大多数 E&O 保险默认不明确覆盖 AI 自主决策——保单语言通常预设软件是”被动工具”
部分保险公司（AXA、Munich Re 等）开始提供 AI-specific 附加险，覆盖”agent 自主决策导致的损失”
保费明显高于传统 E&O——agent 风险敞口未充分历史化，承保方风险定价保守
HITL 条款健全的产品方在投保时通常能获得更低保费

实操建议：

早期阶段（< $5M ARR）：传统 E&O + 明确披露 AI 使用，与保险方沟通保单条款
中期（$5M-50M ARR）：考虑 AI-specific 附加险
大型企业合同前：让客户自带保险条款进合同（许多企业客户要求供应方持有特定保额的 E&O）

监管走向

截至本文写作时，agent 产品监管的关键动向：

欧盟 AI Act（2024 生效，2025-2026 分阶段实施）——按风险分级；高风险用途（医疗、招聘、信用评估）有专门义务；agent 自主性高的系统倾向于”高风险”分类
美国白宫 AI 行政命令（2023-）——目前主要约束基础模型方而非应用方，但有外溢风险
中国《生成式 AI 服务管理暂行办法》（2023）——内容审核责任明确归服务提供方
行业自律——金融、医疗、法律等行业的专业协会正在制定 AI 自主决策的实操指南

合规策略：不要赌”监管会一直滞后”——产品架构上预留 HITL 边界与审计轨迹，监管落地时不必重做产品。

与其他章节的衔接

HITL 在成本-收益模型中的位置：economics/controls-and-roi
审计轨迹的技术实现：operations/overview
上游模型方数据条款：data-feedback