课题二十五:数据质量与遗留系统集成
优先级: 观察中
核心问题
95% 的 IT 负责人认为系统集成是 Agent 落地的首要障碍。企业数据和系统根本不是为了 Agent 实时访问而设计的。
关键问题
1. 数据质量
- 大部分企业数据在采集时没考虑质量,噪声严重
- 重复副本、过时版本、冲突信息
- 非结构化数据(文档、邮件、聊天记录)Agent 难以准确理解
2. 遗留系统
- 基于批处理的架构不支持 Agent 所需的实时反馈
- 数十年积累的 undocumented 业务规则,Agent 无法读取
- 身份管理缺失:系统之间没有统一的认证机制
3. 集成成本
- 遗留系统改造的代價(“技术债税”:全球预计 5.5 万亿美元损失)
- 安全顾虑阻碍跨系统数据共享
- 被迫依赖合成数据
个人关联
对于个人开发者,数据质量问题相对轻(数据量少、自己可控),但系统集成问题同样存在:不同工具之间的数据孤岛、格式不一致、手动同步。例如:本地笔记与项目管理工具之间缺乏双向同步、AI 聊天历史散落在多个平台无法统一检索、开发环境配置与生产环境不一致导致调试困难。这些问题虽不如企业级严重,但累积起来同样消耗大量精力。
关联课题
- agent-cross-context — 跨系统上下文共享的前置条件是数据可访问
- agent-memory-system — 记忆系统的输入质量取决于数据质量
- agent-dev-workflow — 开发流程中集成问题的应对策略