本课程由Chad Sanderson主讲,旨在教授构建和管理高质量的数据基础设施,以支持AI和机器学习项目。课程内容包括数据质量管理、现代数据治理和数据文化建设,持续4周,适合各类AI项目从业者。
“垃圾入 indeed,垃圾出”——这是任何从事AI项目工作都感到非常可怕的短语。
任何成功的人工智能项目的基石不仅在于算法本身,还在于支撑其运行的数据基础设施的质量。本课程将向您介绍一种可扩展、高质量且受良好治理的数据基础设施作为人工智能和机器学习课程的基础。
您将学习:
构建可扩展的数据基础设施
您将掌握设计并实现一个坚固可靠的数据基础设施,能够支持复杂的AI和ML应用。从数据湖到现代数据仓库,了解如何设计和管理能够促进联邦数据访问、分析以及当然——AI的基础设施。
掌握数据质量用于AI
学习如何管理适用于依赖AI/ML的应用的数据质量。了解确保数据管道可信赖、可扩展、易于维护和可观测的原则。我们将涵盖现代治理、可观测性和CI/CD原则。
实施现代数据管理实践
学习最新数据管理策略,以实现数据生产者与消费者在AI生态系统中 seamless集成。了解数据生产者和数据消费者如何合作以理解依赖关系、进行变更管理、制定数据合同以及避免后向不兼容问题。
构建数据文化的战略
发现战略来在您的组织中建立数据质量卓越的文化,创建一个数据完整性被视为共同使命的环境。
课程结束时:
您将拥有一个清晰的蓝图,以构建和管理能够推动AI项目的数据基础设施。您将能够检测并解决数据质量问题,设计可扩展且安全的数据系统,并促进支持AI驱动创新的文化。
本课程为期4周,包含4场在线Zoom课堂(方便您的回放),由Chad Sanderson领导,他是Gable.ai的首席执行官和联合创始人。他在Convey、微软、 Oracle 和 Sephora等公司担任数据平台负责人,拥有10年的学习经验,浓缩成5小时的课程。