回答:这个太范化了吧。大数据架构选择的方案就有很多,海量数据的即席查询本省就是业内目前的痛点,暂时没有太好的解决方案,kylin等框架也只是一个折中方案,如果你不是要求海量数据分析的秒级响应的话sparkSql、presto等都是不错的方案,分钟级别可以返回。
回答:谢谢邀请!数据分析师通常分成两种,一种是应用级数据分析师,另一种是研发级数据分析师,区别就在于是否具备算法设计及实现的能力。应用级数据分析师通常需要掌握各种数据分析工具,把业务模型映射到数据分析工具上,从而得到数据分析的结果。数据分析工具比较多,比如Excel就是一个传统的数据分析工具,另外还有Minitab、LINGO、JMP等,要想全面掌握这些工具的使用需要具备一定的数学基础和统计学基础。通常...
回答:作为一个数据分析师来回答一下:我做这行两年多了,刚开始的时候用的多是MySQL数据库,当然,Oracle数据库也会用到,尤其是在金融行业或者国企都用Oracle,一般的公司使用MySQL数据库,可能是因为MySQL数据库免费吧。另外,在一家互联网公司,我遇到了mongodb,目前一些新兴的互联网公司使用nosql的也比较多,这个当时是现学现卖的。作为一个数据分析师,可能对数据库的使用一般是存取数据...
回答:一名合格的数据分析师应该掌握网页爬虫:Python或R数据存储:Excel或者Tableau、MangoDB等数据清洗:数据缺失处理等数据分析:线性回归等数据可视化:Python或R的可视化包进阶级数据分析师:统计知识运筹学知识机器学习知识掌握以上三个技能点便可称之为数据科学家至于面试要准备些啥?Simply按照上面技能点一一准备但是今天要说的是一项奇淫技巧那就是--写一篇数据分析的推文在这篇推文...
回答:大数据的技术大数据技术包括:1)数据采集: ETL工具负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。2)数据存取: 关系数据库、NOSQL、SQL等。3)基础架构: 云存储、分布式文件存储等。4)数据处理: 自然语言处理(NLP,Natural Language Processin...
...t分布)非对称型(卡方分布、F分布) 二、项目实战1 数据预处理2 样本容量检验3 假设检验3.1 提出零假设和备择假设3.2 确定检验方向3.3 选定统计方法3.3.1 方法一:公式计算3.3.2 方法二:Python函数计算3.3.3 方法三:蒙特卡洛法...
... 大数据概述 1.1 大数据时代00 简要介绍01 时代背景的支撑 1.2 大数据的概念和影响00 大数据的 `4V ` 特性⭐01 大数据的影响 1.3 大数据的应用00 影视剧的投拍01 谷歌预测流感03 ...
作者:xiaoyu 微信公众号:Python数据科学 知乎:python数据分析师 圣人曾说过:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。 再好的模型,如果没有好的数据和特征质量,那训练出来的效果也不...
...的技术要点大扫盲MySQL:意外宕机不难解决,但你真的懂数据恢复吗MySQL:每秒57万的写入,带你飞MySQL:三大知识点,索引、锁、事务,原理分析MySQL:查询速度慢与性能差的解决方案MySQL:事务ACID特性的实现原理MySQL:大佬是怎...
...的技术要点大扫盲MySQL:意外宕机不难解决,但你真的懂数据恢复吗MySQL:每秒57万的写入,带你飞MySQL:三大知识点,索引、锁、事务,原理分析MySQL:查询速度慢与性能差的解决方案MySQL:事务ACID特性的实现原理MySQL:大佬是怎...
...: 入选Gartner和Forrester报告的AnalyticDB作为阿里巴巴的整套数据分析平台的核心产品之一,承载了将数据探索实时化,在线化的关键任务。 前言 2018年3月13日,Forrester发布了最新的云化数据仓库分析报告( Now Tech: Cloud Data Warehouse, ...
...义,但围绕业务能力,自动化部署,网点智能以及语言和数据的分散控制等方面存在着某些共同特征。简而言之,微服务架构是一种将单应用程序作为一套小型服务开发的方法,每种应用程序都在其自己的进程中运行,并与轻量...
ChatGPT和Sora等AI大模型应用,将AI大模型和算力需求的热度不断带上新的台阶。哪里可以获得...
大模型的训练用4090是不合适的,但推理(inference/serving)用4090不能说合适,...
图示为GPU性能排行榜,我们可以看到所有GPU的原始相关性能图表。同时根据训练、推理能力由高到低做了...