2020 年无疑是独特且复杂的一年。但无论世界如何变化,数据质量、处理速度与数据洞见仍然坚定地步入企业发展的最前沿。未来如何?我们将一同展望。
如果说 2021 年有什么与 2020 年保持一致,那就是难以捉摸的不确定性。我们不愿看到又一个 2020 年,但也得随时为各种意外做好准备。
2020 年可以说是意外频发、远超想象而且不断变化的一年。在这一年中,不少共通性的议题快速浮出水面。在技术方面,几年之前还代表着尖端、前沿的事物如今已经与空气和水一样普遍且重要。视频会议与远程办公让高质量无线网络成为一种必需,数据平台也成为支撑企业运营的前提性基础。回顾 2020 年员工与客户的实际需求,我们意识到数据的大规模收集与使用正成为新的常态。
在 Google Cloud,我们这一年中也经历了不少考验与突破,包括自年初新冠疫情爆发起建立的免费公共数据集,已经为抗疫工作对疫情的跟踪与了解提供重要助力。2020 年,每一个人都能获得不间断的数据洞察能力,数据优先策略也在几乎一切业务体系当中得到贯彻。数据质量,甚至足以决定一家企业的成败。零售商等各类组织必须适应瞬息万变的客户需求。根据 Gartner 发布的《2020 年数据质量解决方案魔力象限》报告,数据质量低下给企业造成的年均损失高达 1290 万美元。随着业务环境日益数字化与复杂化,损失额度很可能继续攀升。为此,我们咨询了多位 Google Cloud 数据负责人,希望了解他们眼中 2021 年最值得关注的数据发展趋势。
1. 实时数据分析——决胜未来的关键
Debanjan Saha, Google Cloud 副总裁
随着企业面向云环境的大规模迁移,其数据资产积累与数据分析能力也在同步提升。2020 年的一切再次证明了业务敏捷性的重要意义,而围绕数据分析构建起具有前瞻性的平台正是实现这种敏捷性的实际载体。实时分析已经成为过去一年中我们亲眼见证的重大飞跃,相信这项技术将在 2021 年实现全面普及。虽然跟踪过往数据足以提供重要参考,但仍有相当一部分用例、特别是对意外事件的响应场景,明显更依赖于即时数据。实时分析能力甚至会对运营业绩产生巨大影响。例如,基于实时数据对网络安全漏洞进行识别与阻断,有望彻底改变风险缓解措施的设计思路。
实时数据彻底颠覆了我们收集数据的速度,其中又以预测分析最令人惊喜、也最具实际影响力。在传统上,我们只能从现实世界中收集数据,意味着规划未来的唯一依据就是统筹现已存在的可测试内容。但借助预测模型及 AI/ML 工具(例如 BigQuery ML),组织完全能够根据实际场景及信息运行模拟,据此获得在实体环境中难以测试、成本过于高昂甚至根本不具备现实可行性的数据。
2. 2021 年,企业需要更多数据库类型
Andi Gutmans, Google Cloud 副总裁
在这充满挑战的一年中,数字化转型正全力加速。企业迈开大步,努力以数据变中心提升客户服务能力。四十多年以来,企业一直广泛采用本地数据库方案。但预计在未来 18 个月左右,我们将继续迎来云端数据库部署或迁移的整体趋势,且总体占比到 2022 年很可能达到 75%。除了迁移数据库本体以外,企业还需要认真思考转型期间的实际需求,例如以云原生数据库为基础转变开发范式、以及将分析与机器学习功能实现紧密集成。
长久以来,数据库一直是企业运营体系中的重要组成部分。但现在,数据库进一步成为创新与增长加速中的核心。分析数据与运营数据的融合将帮助企业满足实时业务需求、打破各团队与各系统之间的孤岛,帮助企业更快做出决策、发现新的收入机会、轻松满足不断变化的合规性要求,同时极大节约总体运营成本。
3. 分析不再由仪表板驱动,转而化为基于 AI 的数据分析体验
Colin Zima, Looker 产品管理总监
2020 年,我们正逐步告别静态仪表板。作为传统商务智能的常见体现形式,静态仪表板只能为业务团队提供一组特定数据,我们不仅需要从中做出权衡取舍、更难以据此为现代企业员工提供必要的智能与可视化支持。
新一年中,数据体验即将得到高度重视,员工可以从现有工作流中获取必要的数据。这种体验的关键,在于不再以千篇一律的方式呈现给每位员工,而是根据用户需求进行量身定制。因此对大多数企业而言,必须放弃为员工提供僵化仪表板及数据透视表的原有习惯,转而面向内部构建新的数据产品。2020 年,我亲眼见证了一系列惊人的实例,包括专为员工设计的触控界面,供其快速查看关于流式服务的相关指标。这种全新产品体验让员工在快速解决问题之余,极大提升了自身生产效率。
最终,这项技术将在更广泛的企业级市场上得以普及,面向整个团队(包括业务分析师、销售团队乃至不具备专业知识或培训的其他人员)提供强大的分析功能。数据易用性以及 AI/ML 解决方案也将与这种新型数据体验相结合,共同带来实时、数据驱动式的决策新方法。
4. “位置”对于数据至关重要:地理空间数据将成解锁企业转型的密钥
Jen Bennett, Google Cloud CTO
过去一年中,人们一直高度关注大规模数据在体量上的增长。而到 2021 年,数据多样性将逐步成为推动业务转型的关键动力。
数字化转型所强调的,是从全新的角度看待现有业务。除了逻辑层面的含义之外,这里的“角度”也可以对应实体场景。来自卫星及无人机的地理位置属性数据,有望成为我们理解自身业务的全新切入点。在供应链中,充分理解原材料、产品或资产的所处位置,特别是更好地预测全球物流中断事件的能力,将直接决定企业的业务弹性。而在销售与市场营销领域,带有地理标签的信息则可帮助您更好地理解需求信号,借此优化有限资源并高效拓展市场范围。纵观整个 2020 年,出行信息在管控 COVID-19 以及广泛阻止疫情传播中已经发挥出重要作用。
随着市政机构积极运用地理空间数据应对 COVID-19 疫情,我们也从中看到了需求增长与创新空间,特别是将地理空间数据与其他数据(例如零售数据)相结合带来的巨大可能。随着组织对于可持续性因素的日益重视,事实证明地理空间数据足以给采购等日常运营环节带来强大的可持续性支持。以往,地理空间数据只是少数专家的专属。但如今,地理空间数据及分析技术的大众化转型,配合云计算带来的全球基础设施资源一体化趋势,已经让这部分重要素材“飞入寻常百姓家”。
到 2021 年,谁能将地理空间数据与其他数据融合起来,借此在自身业务乃至整个价值链中建立起全球协作能力,谁就将在激烈的市场竞争中脱颖而出。
5. 智能化数据湖为开放及多云基础设施提供支持
Debanjan Saha, Google Cloud 副总裁
如今的数据源之多已然令人眼花缭乱,以往各种相互独立的数据类型现在可以在同一个位置进行存储与分析。业务数据也开始与日志数据逐步融合,结构化、半结构化与非结构化数据不再“水火不容”。数据源由此跨越长久以来的边界,甚至跨过不同云服务商的业务疆土。
云环境的庞大规模,让我们有可能对如此丰富、如此庞大的数据集合执行高级分析。随着开放及多云计算的进一步发展,数据湖或者数据仓库也必须有所升级。它们不再仅仅充当存储载体,还需要成为企业数据策略的绝对支柱。在云端,数据仓库(主要存储结构化数据,用以轻松搜索全部数据内容)与数据湖(将所有业务数据汇总起来,无论实际结构如何)的界线越来越模糊。未来的数据仓库必须能够集成这些非结构化数据,同时使用 AI/ML 解决方案简化数据湖内容的导航流程,最终带来更快的洞见提取与协作执行速度。
如果说 2021 年有什么与 2020 年保持一致,那就是难以捉摸的不确定性。我们不愿看到又一个 2020 年,但也得随时为各种意外做好准备。为此,我们需要充分运用实时数据、增强企业数据库,并保证组织内的每一位成员都能获得自己所需的数据洞见与报告。也许未来的新篇章,将伴随这五大趋势被缓缓翻开。