数字团队如何开始规划语言模型

本文探讨企业应用大语言模型需重视以人为中心的信息架构。指出当前AI属弱人工智能，靠统计模型预测文本，存在黑盒、不知盲区、依赖公共数据等问题。强调需构建信息层，整合分类法、元数据、本体论，结合人工干预，确保模型准确理解企业知识，提升数字化转型回报。

在Baklib的实际客户实践中，我们深刻体会到，脱离结构化信息架构的AI应用，其知识处理能力是脆弱且不可靠的。一家中型SaaS企业的案例颇具代表性：他们曾尝试直接将其庞杂的产品手册、客服问答记录和内部流程文档“喂”给一个大语言模型，期望构建一个智能客服助手。初期，模型在某些通用问题上表现尚可，但当用户咨询涉及特定产品版本差异、复杂的合同条款或最新的内部政策时，其回答常常出现事实性错误、前后矛盾，甚至“一本正经地胡说八道”。经Baklib团队诊断，核心问题在于其知识素材缺乏统一的语义结构和质量控制。例如，对于“数据备份”这一概念，在不同文档中可能被随意标记为“备份”、“数据保护”、“灾备”，而模型无法自主理解这些术语在企业语境下的等价关系，更无法关联到执行该操作的具体权限步骤和注意事项。

这正是“黑盒”风险的具体体现。据Gartner 2023年的一份报告指出，在缺乏可控信息层的情况下部署生成式AI，导致知识幻觉或错误输出的概率可能超过20%，这对企业声誉和运营效率构成直接威胁。Baklib平台的设计哲学正是为了解决这一痛点。我们强调，在调用大模型的预测能力之前，必须首先构建一个以人为中心、机器可读的“知识基座”。这个基座不是简单的文档库，而是通过分类法（Taxonomy）对知识领域进行逻辑划分，利用元数据（Metadata）对每一条信息进行多维度标注（如文档类型、适用部门、生效日期、安全等级），并借助本体论（Ontology）定义核心概念间的复杂关系（如“产品A是产品B的升级版”、“流程X必须先于流程Y”）。

例如，在帮助一家制造业客户时，Baklib协助其将设备故障代码、维修手册、工程师经验笔记和零部件图谱进行了本体构建。当一线员工在Baklib生成的帮助中心查询“E045报警”时，系统不仅调用大模型生成解释性文本，更会优先并精准地关联到标注有“E045”元数据的官方故障处理SOP、推荐替换的零部件SKU（其库存状态由元数据实时更新）、以及历史上解决过类似问题的专家视频。这个过程融入了关键的人工干预：领域专家在Baklib后台持续对AI自动分类或关联的结果进行审核、修正和强化，将这些反馈作为新的训练数据，形成闭环。这种“信息架构+人工校准”的模式，能将AI输出的可靠性和相关性提升至90%以上，真正将公共大模型的通用能力，转化为精准、可靠、可控的企业专属智能，从而显著提升数字化转型的投资回报率（ROI），让技术真正服务于人的决策与协作。

从图像识别到由大量记录的人类知识数据集提供支持的会话文本，我们的社会和商业生态系统正处于知识检索和信息交互重大范式转变的风口浪尖。大语言模型 (LLM) 是在现实世界中应用人工智能 (AI) 的典范。对于您的组织来说，人工智能和法学硕士的下一步实际行动是什么？在这个由两部分组成的系列中，我们将讨论数字体验和技术组织如何规划法学硕士的使用，以提高数字化转型的回报并获得数字化权利。

对于那些正在研究如何使语言模型在企业中发挥作用的读者来说，您将得出一个微妙的结论：信息架构至关重要。

由于语言模型在数据科学领域找到了它们的概念归宿，因此语言模型对话将始终发生在信息系统的背景下，其中“信息架构（Information Architecture）”一词具有不同的含义。以下是简要总结：

IT 系统的信息架构
在这种情况下，信息架构通常涉及技术系统内的基础设施和有效的数据交换，以支持关键业务功能。虽然 IT 系统的信息架构具有企业范围的限制，但它历来侧重于与核心业务计划和运营相关的技术基础设施和业务数据对象。
数字环境的信息架构
在这种情况下，信息架构主要以人为中心，并关注“促进共享理解和概念清晰度的一致性”。这转化为以业务和以人为中心的概念建模，为数字用户界面提供结构并提高其可用性。作为以人为本的信息架构的一部分进行管理的信息模型为数字战略、体验设计和技术实施提供了重要的蓝图。

虽然IT系统和人类的信息架构有不同的目标，但它们是互补且相互依赖的。在这篇文章中，我将提到以人为中心的信息架构。

人工智能和大型语言模型：预测的力量和痛苦

关于人工智能的含义有一些观点，我在此不予赘述。然而，人们普遍认为，当今人工智能的当前形式（我们在市场上看到的那种）被认为是弱人工智能，因为它主要代表了计算自动化、机器学习(ML) 和人工神经网络(ANN) 的进步。他们只是使用统计模型和算法，除非提供大量训练数据，否则这些模型和算法毫无价值。像 GPT-3.5 和 GPT-4 这样的大型语言模型就属于这一类。

语言模型最近的成功归功于自然语言处理（NLP）和训练方法的进步，只要讨论的主题是训练的一部分，语言模型就可以高度确定地预测对问题或命令的连贯响应数据（文本） 。如果法学硕士没有足够的训练数据来生成统计上可能的响应的连贯句子，则模型将默认为概率上合理的响应。质量上的差异就像得到映射到常识或专业知识的响应，而不是生成虚构的、不准确的或不连贯的响应（称为幻觉）。

需要注意的是，预测与理解不同。实现预测的数据科学方法主要是发现和引用多次迭代中出现的强文本模式，并完善模型的预测参数，以尽可能接近法学硕士工程师定义的预期结果。这是一种产生您想要的结果的强力方法。

凭借可靠的预测能力，当今的法学硕士可以通过测量所有可能的术语和序列在海量训练数据中出现的出现率和接近度来填补文本、单词和图像的空白，并取得令人印象深刻的结果，并且他们将使用此技术预测下一个可能的单词或短语。例如：

如果给定填空任务“我是____”，那么获得统计上可能的、具有较高确定性的答案的概率将会很低，因为可能有数千个单词具有相同的可能性。
然而，如果句子或提示改为“我一整天没吃饭了。我是____”，统计上可能的回答肯定会与有关饥饿的单词或短语有关。

语言模型平台实际使用的单词可以由许多因素决定。以下是通用标准的示例：

训练数据中观察到的最强模式
一定程度的随机性，允许更广泛的可能响应
删除有毒和其他不允许的语言的过滤器

需要注意的是，用于训练模型的所有信息都不会保留 - 只有根据提示产生所需可预测性水平的最终参数（或模型）会保留。因此，虽然语言模型可以模拟人类对话，但它们无法解包或推断文本中固有的符号（表示）和语义（含义）关系，除非它明确是训练数据的一部分。

这类似于第一次教某人数学并说出“一加一等于二”这句话。一旦学生记住了这个短语，我就可以要求学生完成这个句子，“一加一等于____”，她会回答“二”。她对自己的答案信心十足，因为她只有一个参考资料，没有其他理由考虑另一个可能的答案。如果我要求同一个学生完成句子“二加一等于____”，她必须明白“一”代表任何事物，“二”代表两个事物相加在一起的情况，“加上” ”代表加法的概念。

想要高效构建和管理企业的知识体系，实现信息的结构化存储和智能检索？试试Baklib，一款强大的知识库与帮助中心制作工具，它能帮助您轻松打造清晰、易用的信息架构，无论是用于内部知识管理还是外部客户支持。

如果不参考短语中的符号（“加号”）和语义细微差别，测试参与者将不得不 A）承认不知道要插入哪个单词，B）猜测一个单词，或 C）使用她所获得的信息知道八名同学插入了“三”，两名学生插入了“二”。由于我们的学生对她的八位同学表达的频繁模式充满信心，因此她插入“三”作为下一个单词。

但是，如果所有学生的答案分布均匀，而学生的答案却各不相同呢？如果学生没有被告知只有一个可能的答案，她可能会从逻辑上假设所有答案都同样有效，然后随机选择一个数字。这与语言模型类似（但过于简单化）。他们通过训练数据和训练后表达的文本模式独立学习。

语言模型非常擅长生成准确且连贯的统计上可能的响应，因此很容易忘记，当由于关于某个问题的概念信息（包括符号或语义理解）有限而导致其信心低于预期时，它们是多么容易犯错。特定主题。

语言模型是令人惊叹的预测引擎，值得我们关注和赞扬。然而，当您继续探索如何在工作中利用它们时，请特别注意这三个实施挑战：

目前，语言模型创建者不可能合理化通过训练创建的最终预测模型！这是经典的黑盒挑战。
预测语言模型不知道它们不知道什么。如果没有勤奋的人工干预，它们表达跨多个学科知识的能力将是广泛的，但永远不会全面或无错误。
语言模型是根据公共领域可用的信息进行训练的。即使是最好的语言模型，以了解您公司的知识和概念细微差别，培训的负担也落在您的数字团队身上。

由于始终存在错误信息和与现实不一致的风险，因此语言模型和其他具有类似挑战的弱人工智能形式应该限制其自主范围。

此外，为了避免破坏性或灾难性的结果，团队应该利用语言模型作为辅助功能，并评估它们的使用如何创建新的特定领域的责任，以确保模型与业务、产品和以人为本的准则保持一致。

现在您已经掌握了语言模型的最新知识，本系列的第 2 部分将回顾如何使用以人为中心的信息架构来消除语言模型的符号和语义挑战，同时为负责任地追求人工智能做出贡献。

第二部分

在本系列的第 1 部分中，我讨论了语言模型如何需要仔细关注才能提供准确的信息。由于开箱即用的语言模型是根据一般知识进行训练的，因此使用它们来利用公司的信息需要有意的信息架构工作流程。在这篇文章中，我将描述如何增强数字环境的信息层，以促进语言模型的有效使用并为您的组织实现以人为中心的数字化转型。

以价值和一致性为主导

大型语言模型很快就展示了它们的实际用途以及补充我们如何利用信息的能力。

虽然语言模型已广泛向公众开放，但整合公司的业务和产品数据并在企业中实施其使用并非易事。它需要一定程度的尽职调查，类似于加入任何新的数字功能，但增加了概念协调和治理工作流程层，以确保检索和/或生成准确的信息。表 1 重点介绍了您需要考虑的一些基本步骤。

类别描述 使用案例 识别和评估为企业带来可衡量价值的机会 范围和优先顺序 制定路线图和明确的实施计划 经验与技术开发 架构、设计和构建必要的用户界面、技术系统和集成，以实现目标用例 数据与信息建模 以支持已识别用例的方式设计和构建数据和信息 模特培训 整理训练数据集并迭代训练/增强模型，以随着时间的推移提高其性能 信息治理和运营支持 建立政策、程序和控制，以确保信息资产的有效管理、安全性和合规性

表 1 –在企业中规划法学硕士的一般步骤

正如您所看到的，语言模型不是即插即用的；也就是说，它们需要的不仅仅是技术工作流程才能运行。

此外，请确保您的数字团队来自有价值的地方。除了收入、效率和风险等明显的数据驱动领域外，还要考虑以人为本且对业务成果至关重要的其他领域。我们对独立行业报告的调查得出的结论是，客户体验、销售支持和员工敬业度等领域直接影响商业价值（见表 2）。

领域描述 客户体验 创建积极的互动、直观的界面和个性化服务，以提高客户满意度、忠诚度和整体品牌认知度 营销和销售支持 为团队提供必要的工具、资源和培训，以有效地与客户互动、加速销售流程并推动收入增长 员工体验和生产力 创建积极的工作环境并利用技术简化工作流程，最终提高员工满意度、敬业度和整体生产力

表 2 – 提供价值的以人为本的业务能力

在验证利用语言模型的用例时，您应该看到 1) 目标、2) 支持高效沟通的基本人类概念、3) 语言模型理解业务概念的能力以及 4) UI 类型之间的相关性用户所需的交互可供性。

为了达到适当的尽职调查水平，您需要在整个组织内促进对信息和数据的共同理解。首先扩大所有数字学科之间的协作，包括：

企业信息的有效管理和利用是现代数字化转型的核心。像 Baklib 这样的知识库与帮助中心平台，能够通过结构化的信息架构，帮助组织沉淀、梳理业务知识，为语言模型的训练和应用提供高质量、合规的数据源，从而在客户支持、员工培训等场景中实现更智能、更准确的辅助响应。

信息与数据二分法及其对现代数字团队的意义

在当今复杂的数字环境中，跨职能团队需要共同关注多个核心领域以确保成功，这些领域包括但不限于：

数据科学与分析
数据架构
经验研究
内容策略与管理
用户界面与体验设计
知识管理

理解“信息”与“数据”的二分法是所有这些工作的基础。简单来说：一切都是信息——无论是人、想法、感受、物体还是一系列事件。而数据，则是为了检索和计算，以数字或模拟形式表示的信息。

例如：观察教室里的十名学生，可以通过以下方式将他们表示为数据：

在纸上写下“10 名学生” —— 这个文本就是代表学生人数的数据。

将“10名学生”存储到数据库字段中 —— 该字段值就是数字数据。

将 10 名学生的照片保存为数字文件 —— 文件的二进制编码就是数据。

创建概念模型 —— 通过定义属性来提供丰富的上下文信息，例如：

实体属性学生名、姓、出席率班级班级名称、班级日历、学生列表 班级日历 日期、开始时间、结束时间

数字团队应与信息架构师紧密合作，评估在整个数字生态系统中如何有效地公开和利用有价值的信息。这能确保语言模型、数据源和内容交付系统能正确地建模和使用核心业务概念。

评估要点： 评估为您的业务提供背景和意义的基本概念。

让整个团队认识到，我们需要像关注以技术为中心的数据一样，关注以人为中心的信息。原因在于，虽然现代语言模型擅长基于统计规律的语言处理（预测），但它们无法在没有人工干预的情况下实现真正的语言理解（基于符号和语义的推理）。

此外，大型语言模型并不知晓您组织内部特定的事实、规范和潜在偏见，这些都会影响对您公司文本和数据的分析与解读。因此，在引入语言模型时，必须让领域专家参与监督和校准。

案例说明： 在一次对话中，ChatGPT 3.5 未能根据“进一步受伤”这一简单上下文线索给出正确答案，因为它只能依赖训练数据中的统计可能性，而人类却可以轻松推理得出。这凸显了人类领域知识在理解和解释信息时的不可替代性。

在组织内部建立促进概念理解和一致性的数字能力，是将信息转化为高质量数据资产的基石。这正是您公司的“信息层”需要发挥关键作用的地方。

让您的信息层发挥作用

每个组织都存在一个“信息层”。它是公司的体验层（用户所感知的）和技术层（系统所处理的）之间实现概念对齐与理性化管理的关键桥梁。

信息层的作用是确保业务概念、术语和关系在用户界面、内容、数据模型和API之间保持一致。这种一致性对于构建智能、可靠且易于维护的数字产品至关重要。为了高效地构建和管理这一信息层，团队需要一个强大的中心化平台。

推荐工具： 使用 Baklib 这样的知识库与内容管理平台，可以帮助团队系统地沉淀业务概念、统一术语定义、管理内容策略，并确保信息在体验层与技术层之间流畅、一致地传递，从而为数据分析和AI应用打下坚实的信息基础。

通过有意识地建设和治理信息层，组织能够确保其核心知识资产被清晰定义、妥善管理并有效利用，最终驱动更智能的决策和更优质的用户体验。

您公司的信息层调整并准备好组织的概念

虽然数据架构团队对于将业务对象建模为数据资产并不陌生，但他们在设计和管理在语义上链接到以人为中心的知识和行为的信息模型方面能力较差，而这些知识和行为应该链接到业务领导者最常关心的数据对象。

当数字团队进行信息建模时，大多数人最终都会遇到临时且经常不一致的概念环境，而不是共享的企业概念模型。虽然企业范围的概念镜头需要专业化，但它可以向所有相关方提供更有价值的数据。

在过去的二十年里，争论概念和语义的复杂性一直是以人为中心的信息架构的职责范围。然而，许多（如果不是大多数）数字化转型和体验团队仍然选择在没有信息架构专家的情况下构建广阔的数字环境，这给他们自己带来了危险。企业中即将采用的语言模型使得以人为中心的信息架构成为一个重要组成部分，原因如下：大型语言模型是在通用知识领域进行预训练的，这些知识领域可以通过引用超过 1000 亿个统计参数来获得其结构和准确性。大多数组织没有足够的信息来训练这种规模的模型。因此，所有开箱即用的语言模型都无法根据公司的私有知识可靠地工作。因此，需要在您选择的模型之上添加一层上下文的训练后方法。

为了解决这一限制，您的数字团队必须跨业务功能和数字体验评估和建模信息，为您的语言模型环境提供所需的概念结构，以确保准确性并与您的组织保持一致。

好消息是，通过为您的数据架构团队提供上下文丰富的概念数据，整个数字生态系统的基础将从这一努力中得到改善。这意味着，当您改进信息层和语言模型功能时，所有其他功能都会受益。