Hive优化

1. 概述 1.1 hive的特征: 可以通过SQL轻松访问数据的工具,从而实现数据仓库任务,如提取/转换/加载(ETL),报告和数据分析; 它可以使已经存储的数据结构化; 可以直接访问存储在Apache HDFS或其他数据存储系统(如Apache HBase)中的文件; Hive除了支持MapReduce计算引擎,还支持Spark和Tez这两种分布式计算引擎; ……

Apache Flink 是什么?

Apache Flink 是一个框架和分布式处理引擎,用于在无边界和有边界 数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。 接下来,我们来介绍一下 Flink 架构中的重要方面。 处理无界和有界数据 任何类型的数据都可以形成一种事件流。信用卡交易、传感器测量、机器日志、网站……

4 data tagging best practices

The more data you can apply to a business problem, the better its potential solutions. While there’s no shortage of data available to your enterprise today, it’s often difficult to know what data you have and how it can be used. This is why you should never overlook the important role metadata pla……

医疗健康行业的数字化及应用

医疗健康的未来发展令人兴奋,而这全都在于协作,教育和利用正确的数字生态系统,使患者的健康成为护理的核心。COVID-19扰乱了医疗健康行业,并迫使医疗健康专业人员适应新的“非接触式”数字实践环境。未来,这种趋势将继续发展和扩大,远程医疗,物联网,数据分析,人工智能,AR/VR,机器人及助理等技术将发挥越来越……

Qlik最佳实践:Qlik Sense中的分层解决方案结构

在实施Qlik Sense架构时,我们强烈建议您实施语义层( Semantic Layer),在Qlik中称为QVD层。 QVD层充当集中式数据库,其中包含从一个或多个数据源提取产生的一组受控数据快照。 Qlik数据库中的数据应当为“业务就绪”的,这意味着它应该是干净的,及时的,可访问的,格式化且易于关联的,使这些数据非常适合真正的自助服……

32-47岁,黄金15年你需要做的10件事

人的一生,从三十而立迈向四十不惑的一段路上会有很多新的感悟,不管怎样,这十门功课是少不了的。70、80后的亲们共勉! 1 学会放手 这个年龄已经不允许你不成熟,当你无力把握命运中的某种爱,某种缘,某种现实,学会放手。给自己身心一个全新的开始,只要信心在,勇气就在;努力在,成功就在。 2 储蓄友谊 真挚……