...也是 Apache Flink contributor。本文主要内容如下: OPPO 实时数仓的演进思路; 基于 Flink SQL 的扩展工作; 构建实时数仓的应用案例; 未来工作的思考和展望。 一.OPPO 实时数仓的演进思路 1.1.OPPO 业务与数据规模 大家都知道 OPPO 是...
...我们都在使用两种数据存储方式来架构数据:数据仓库:数仓这样的一种数据存储架构,它主要存储的是以关系型数据库组织起来的结构化数据。数据通过转换、整合以及清理,并导入到目标表中。在数仓中,数据存储的结构与...
...比文件系统更差除了实时数据载体的问题,还有引入实时数仓后,和离线数仓的统一的问题,比如实时数仓的数据治理、权限管理,是不是要单独做一套?如何统一实时数据和离线数据的计算口径?两套数据系统的资源浪费严重...
...,全球主要的四家云服务公司,得以超越Oracle、IBM等老牌数仓技术公司,成为一线CDW供应商的原因。 得益于阿里巴巴多年的数据利用经验沉淀,DataWorks在部署模式、数据集成、分析手段、数据安全等各方面都实现了与企业级需...
...,全球主要的四家云服务公司,得以超越Oracle、IBM等老牌数仓技术公司,成为一线CDW供应商的原因。 得益于阿里巴巴多年的数据利用经验沉淀,DataWorks在部署模式、数据集成、分析手段、数据安全等各方面都实现了与企业级需...
...式计算引擎FLUME1.9.0数据采集与转储服务HIVE2.3.6常用的HQL数仓工具IMPALA2.10.0分布式计算服务KYLIN3.1.0数仓维度建模服务LIVY0.7.0Spark的REST服务PHOENIX4.14.3HBaseSQL化查询分析工具PRESTO0.234分布式计算服务SPARK2.4.6分布式计算引擎SQOOP1.4.7数据...
...,全球主要的四家云服务公司,得以超越Oracle、IBM等老牌数仓技术公司,成为一线CDW供应商的原因。 得益于阿里巴巴多年的数据利用经验沉淀,DataWorks在部署模式、数据集成、分析手段、数据安全等各方面都实现了与企业级需...
...,全球主要的四家云服务公司,得以超越Oracle、IBM等老牌数仓技术公司,成为一线CDW供应商的原因。 得益于阿里巴巴多年的数据利用经验沉淀,DataWorks在部署模式、数据集成、分析手段、数据安全等各方面都实现了与企业级需...
ChatGPT和Sora等AI大模型应用,将AI大模型和算力需求的热度不断带上新的台阶。哪里可以获得...
大模型的训练用4090是不合适的,但推理(inference/serving)用4090不能说合适,...
图示为GPU性能排行榜,我们可以看到所有GPU的原始相关性能图表。同时根据训练、推理能力由高到低做了...