首页 » Big Data and AI » 正文

打破数据孤岛:如何整合,清理和永久使用数据

要点:销毁数据孤岛是从数据中获得宝贵见解的第一步

盘点任何一家大中型企业的库存,您会发现大量数据:财务,营销详细信息,员工指标,销售数据,产品信息,客户支持电话,业务流程输出等等。无论这些数据是用于业务KPI,内部度量还是(完全可能)不使用,它们都位于单独的专有数据库中,并且每天都在增长。 (要了解有关管理数据库的更多信息,请参阅7个需要数据库管理系统的原因。)

事实是,隐藏在数据中是一些重要业务问题的答案。趋势,实验,方法和变化都在等待被发现。使用这些数据来阐明您的决策,并且您将成为优秀商业智能的核心所在。它推动了积极的行动。

只有一个问题。答案不仅在一个数据库中。您需要将来自许多不同来源的数据汇总在一起才能获得整个故事。正如业务数据仪表板公司Cyfe的首席执行官Ben Carpel在最近的博客文章中所说:“保持业务的销售,市场营销,财务,网络分析,客户服务,内部研发,IT等方面的脉动数据永远不会给您完整的画面。换句话说,如果您无法将大数据融合在一起,那么大数据就不会带来大见识。”

例如,想知道一种新产品是否适合您当前的营销策略和客户群吗?您需要深入了解CRM,营销统计,客户支持详细信息和产品开发信息,它们都位于单独的数据孤岛中。您需要对那些孤岛采取隐喻性的锤子,将其分解,将数据整合在一起,然后看它能告诉您什么。

以下是实施方法。

考虑一下您希望通过数据回答的问题

整合和清理数据以实现商业智能并非易事。 因此,整个过程都需要由您要回答的问题来决定。 考虑一下您需要的见解,以做出更好的业务决策,并将其变成可行的问题。

写下那些具体问题,然后深入研究细节。 这些问题将如何帮助您做出更好的业务决策? 根据您的数据创建需求列表,以帮助您以明智,可行的方式回答问题。

您需要执行什么分析才能将数据转换为可以推动行动的情报? Forrester报告称,只有29%的企业将分析付诸实践。 别占71%。

了解您需要获取的数据的类型和位置

现在您有问题了,现在该寻找可以提供这些见解的数据了。

进行数据库审核,以准确确定您的企业已经收集了哪些数据。 对于每个数据库,请了解以下内容:

  • 该数据库在哪里?
  • 该数据库的主要功能,输入和输出是什么?
  • 正在捕获什么数据?
  • 此处记录的哪些数据点可以回答您的业务问题?
  • 从数据库中获取此信息的最佳方法是什么?
  • 如何将这些数据与其他来源结合起来以创建更好的上下文和分析?

审核完成后,您应该全面了解企业正在捕获的各种数据,其位置以及可以为您的特定问题带来商业智能的数据的特定元素。

将您的数据集中到一处

现在该打破数据孤岛了。 您需要将可以回答问题的所有关键信息整合到一个中央存储库中。 创建数据流以收集数据并将其合并到数据仓库中。

将所有数据保存在中央位置后,您需要开始对其进行合并。 最有效的方法是使用数据集成工具。 正如技术转让部门的Mike Ferguson所言,此处的目的是“集成维护在多个操作系统中的不同主数据。”

这个想法是创建一个组合的数据集,在一个地方包含所有关键信息。 这意味着将单个数据字段映射在一起,了解每个数据字段的上下文,并开发单个数据元素以逻辑和内聚的方式显示该数据。

整合和清理您的数据

有了数据集后,您需要清理并验证它。您的数据很有可能会变得“嘈杂”。它可能具有虚假信息,离群值和其他特征,需要加以消除。该过程的这一部分对于数据完整性至关重要,因为如果要将其用于业务决策,则需要对数据充满信心。

运行一些初步分析和报告,以便您可以查看数据在告诉您什么。找出所有奇怪的输出,然后深入数据中查看它们的来源。您还需要将数据重复数据删除,以免重复报告。

不过,清理数据时请务必小心。您不希望如此平滑,以至于您错过重要的异常值和趋势,因为它们通常也可以提供有价值的见解。清理和合并数据的想法应该是不断改进的方法之一。进行调整,衡量,了解其内容,然后重复。对结果感到满意后,请停止。

将您的数据转变为可行的商业洞察

在这里,您可以将所有内容组合在一起并使用它来制定业务决策。 使用数据仓库中清洗后的集成数据为报表和商业智能工具提供支持。

但是,最重要的事情是行动。 当您努力打破孤岛,创建集成的,可验证的数据并得出明智的见解时,您将有信心做出更好的业务决策。 这意味着更高的效率,更少的浪费,更快乐的利益相关者和更高的底线。

本文共 1 个回复

  • Sting(高明) 2020/05/08 22:09

    clean data silo~

Comments are closed.