About

生成式AI:数据是否准备好支持AI?

Author Tanmer Tanmer
Tanmer · 2025-07-18发布 · 4 次浏览

本文探讨了生成式AI在组织中的应用,强调了数据基础设施的重要性以及如何解决数据增长和隔离等挑战,以支持AI实施和创新。

---

TL;DR:  
为构建一个AIenabled的组织,需要解决数据基础设施中的挑战,如处理数据增长和打破数据 silos。

关键要点
构建一个AIenabled的组织在大规模水平上,需要解决多个与数据基础设施相关的挑战。你的数据基础设施是否准备好支持AI?其中一个主要挑战是处理极端的数据增长,并管理来自不同位置、类型和云平台的数据。数据通常被隔离在_on-premises、多个云存储和边缘设备中,这使得将其转化为可被AI利用的数据非常困难。

要将AI引入数据,组织需要一套全面的数据管理策略和工具链,包括发现、收集、处理和数据的高性能或近实时能力。这包括打破数据 silos,并实施一个更 holistic的数据基础设施和IT战略,以支持AI。

另一个挑战是填补数据架构中的技术空白:
许多组织缺乏激活强大AI应用所需的技术基础。组织应推动技术创新,并与数据科学家和工程师合作,确保组织有支持AI的应用基础设施。通过解决这些挑战,组织可以构建一个AIenabled的组织,并利用AI来驱动创新和竞争优势。

---

大型语言模型(LLMs)如ChatGPT 3.5的采用情况:
企业可以通过自身数据增强生成式AI,并将其扩展到整个组织中。要实现这一点,组织需要确保其数据基础设施能够支持AI实施。这包括有足够的数据收集、存储和处理能力来处理AI算法所需的大量数据。此外,组织还需要投资云计算和先进分析工具,以充分利用AI能力。

数据可 Hadness:
生成式AI通过自主生成新的内容基于其理解的环境。只有少数组织已经成功实现了AI转型,但有12%的组织计划在未来两年内采用AI。这表明组织认识到AI的潜力,并积极将其纳入运营中。根据麦肯锡的一项研究,生成式AI正在重塑商业和创新者的方式,重新定义创意、问题解决和决策制定。

实施先进的数据操作技术和负责任的数据使用是实现生成式人工智能潜力的关键:
“生成式AI将 usher in an era of empowerment, particularly in sales enablement and revenue operations。想象一下作为销售代表能够无缝访问企业数据的情况,“表示Dana Therrien,安aplan的高级副总裁-收入运营和销售绩效管理(SPM)顾问。‘它不仅能让业务经理感到安心,还能彻底改变他们工作的方式。例如,作为销售代表,你可以在与客户交谈时实时访问其最重要的客户信息,这将提升工作效率并提高客户满意度。’”

---

生成式AI的广泛采用:
围绕生成式AI(GenAI)的 buzz 在过去几年中急剧增加。尽管如此,74%的首席技术决策者对如何管理和在多云环境中管理基于传统应用的数据表示担忧。麦肯锡的一项研究指出,生成式AI正在重塑商业和创新者的方式,重新定义创意、问题解决和决策制定。

生成式AI的重要性:
生成式AI通过创造新内容、想法或解决方案来超越传统AI模型。与传统的基于模式的学习不同,生成式AI能够根据其环境生成全新的内容。它就像一个AI协作员,理解现有数据并生成符合上下文的有创意输出。

---

  • 数据可 Hadness 对生成式AI在商业中的利用的重要性:  
    生成式AI的数据可 Hadness 涉及两方面:从各种来源自动、可靠、安全地移动和整合数据的能力,以及实施数据治理以确保数据保护和访问权限。一个成熟的数据战略和基础设施是实现生成式AI的原型化、部署和测试的关键。

---

通过数据可 Hadness 和负责任的数据使用最大化生成式AI的潜力:
生成式AI赋予企业自动化任务、增强交互、预测结果并推动创新的能力。为了利用其潜力,组织必须优先考虑数据。通过结合自身数据与预训练模型,生成式AI可以在企业中成为有根据的知识实体,为企业创造无数机会以实现创新和效率。

---

生成式AI的应用:
生成式AI可以增强企业能力、提升交互并推动创新。为了利用其潜力,组织必须重视数据。通过结合独特数据与行业大型学习模型(LLMs),生成式AI可以提高数据可 Hadness 并增强其应用效果。

---

整合生成式AI与企业数据以确保数据可 Hadness:  
准确或高质量的数据是训练AI模型的关键。大多数企业将生成式AI与现有商业数据结合的方式有两种:创建一个定制的基础语言模型(FM)或通用目的语言模型(LLM),并对其进行微调以适应特定业务需求;提供现有 LLM 与现有 proprietary 数据的访问权限,以便其输出中包含实时信息。

生成式AI的数据可 Hadness 检查清单:
为了确保生成式AI的成功实施,组织应关注以下 scalable因素,通过 master 数据管理或数据自动化实现:

1. 数据管理 
2. 数据发现 
3. 数据获取 
4. 数据清理 
5. 数据处理

---

数据管理:对有效利用生成式AI的应用的数据治理政策
生成式AI高度依赖高质量数据。数据治理是确保生成式AI成功应用的关键,因为它涉及数据的有效性、相关性和完整性。低质量数据可能导致令人失望或不准确的 AI 结果。实施数据治理政策可以简化流程并提高透明度。

---

数据获取与发现:
从各种来源收集和整合数据后,需要将其导入数据仓库以便分类和存储。这有助于组织更容易找到、理解并评估其拥有的数据资产。

---

数据清理与处理:
确保有一个过程来系统地整理、清洁和统一原始数据以使其更易使用、准确且可靠。这包括对数据进行转换、归一化、去重和集成,以便去除重复项、处理缺失值,并使数据符合标准化格式。

---

生成式AI的挑战与解决方案:
生成式AI需要大量的计算资源,尤其是大语言模型(LLMs)如ChatGPT 3.5。随着模型复杂性的增加,传统服务器可能无法满足需求,因为它们需要更高的计算能力来处理复杂的任务和大规模的数据。此外,组织需要投资云基础设施和先进分析工具以充分利用生成式AI的能力。

---

数据安全:
在生成式AI时代,数据安全至关重要。加强安全协议、加密技术和定期安全审计是保护敏感数据的关键步骤。

---

通过以上翻译,我们希望用户能够清晰理解原文内容,并从中获取关于构建AIenabled组织和利用生成式AI的实用信息。

提交反馈

博客 博客

「数字体验」相关的知识、文章、行业报告和技术创新