摘要:李飞飞花名飞刀,阿里巴巴集团副总裁,高级研究员,达摩院首席数据库科学家,阿里云智能事业群数据库产品事业部负责人,杰出科学家。是阿里云的云原生数据库,目前已有非常深厚的技术积累。 阿里妹导读:云计算大潮来袭,传统数据库市场正面临重新洗...
摘要:类型说明根据中的说明,数据类型是用来存储数据的。它们几乎接受完全相同的值集合作为输入。该结构是非强制的,但是有一个可预测的结构会使集合的查询更容易。如中,表示在和这两个位置出现过,在中这些位置实际上就是元组的行号,包括数据块以及。 js...
摘要:我们通常会说我们要做一个分布式数据库,自动弹性伸缩,能解决分库分表的问题,你会用吗用户说那肯定啊,现在的分库分表太痛苦了。在软件开发领域有一条非常经典的哲学。作为一个分布式数据库,每一层的稳定性都非常重要。 本文根据我司 CEO 刘奇在第 ...
摘要:奇技指南现有的开源时序数据库只支持单机运行,在面临大量数据写入时,会出现查询慢,机器负载高,单机容量的限制。为了解决这一问题,基础架构团队在单机的基础上,开发了集群版简述是一个分布式时间序列数据库,用于处理海量数据写入与查询。 奇技指...
摘要:索引的原理与应用索引类型,存储结构与锁在数据结构与算法索引一节中,我们讨论了这样的文件索引以及全文索引的基础算法,本文则会针对文件索引在关系型数据库中的实际应用进行探讨。这个索引的是数据表的主键,因此表数据文件本身就是主索引。 showIm...
摘要:作者张学程本文为源码阅读系列文章的第六篇,在上篇文章中我们介绍了处理单元的实现,对在增量复制过程中的读取过滤路由转换以及执行等逻辑进行了分析。值得注意的是,由于我们近期正在对处理单元进行重构,因此源码中会同时包含重构前后的相关代码实现...
摘要:业务需求统计每小时的数数据采集数据清洗用来描述将数据从来源端经过抽取转换加载至目的端的过程字段过滤字段补全用户信息商品信息字段格式化数据分析将数据导出介绍由开源的用于解决海量结构化日志的数据统计的项目本质将转化为程序的其实时上的目录和...
摘要:微服务架构催生分布式数据库王涛认为,谈论数据库一定脱离不了应用。巨杉数据库,适合微服务的分布式数据库正如同巨杉对于分布式数据库的技术定位和目标,巨杉数据库本身就是以分布式存储底座与上层的数据库实例两层来进行构建的。 过去几年来,微服...
摘要:作者屈鹏本篇源码解析将为大家介绍的另一周边组件。这个函数会往完成队列中注册若干个,相当于用往一个中注册一些事件的关注。在函数返回之后,服务端的初始化及启动过程便结束了。 作者:屈鹏 本篇 TiKV 源码解析将为大家介绍 TiKV 的另一周边组件—...
摘要:基于部署数据库初始化数据库进入镜像配置用户密码导入数据进入容器检查导入结果创建数据库初始化进入容器 基于docker部署数据库 sudo docker pull influxdbsudo docker pull mongo sudo docker run -p 27017:27017 -v xxx:/xxx--name xxxx -d mongo:la...
摘要:行转列,列转行行列转换在做报表分析时还是经常会遇到的,今天就说一下如何实现行列转换吧。列转行假设我们有下表语文数学英语通过即可得到如下结果我们也可以使用下面方法得到同样结果语文语文数学数学英语英语 SQL 行转列,列转行 行列转换在做报表...
摘要:最近遇到一个在级别下的死锁问题,感觉有点意思,研究了一下,做个记录。比如等都会给涉及到的行加上行锁,防止其他事务的操作间隙锁在隔离级别下,为了防止幻读现象,除了给记录本身,还需要为记录两边的间隙加上间隙锁。至此,死锁过程分析完毕还没完...
摘要:在执行耗时命令如范围扫描类的超大下的等瞬时大量过期驱逐等情况下,会造成的下降,阻塞其他请求。 本文主要从实现角度分析了redis lazy free特性的使用方法和注意事项 有帮助的话就点个赞,关注专栏数据库,不跑路吧~~不定期更新数据库的小知识和实...
摘要:是基于开源的兼容协议的强一致性的数据库开源项目。这种架构类似于公司的第一代的系统,系统本身也是一个强一致性的高可用的分布式系统。由于篇幅所限,本文中关于强一致性线性一致性的很多技术细节的阐述未能详尽,拟另行成文讨论。 作者介绍:陈东明...
摘要:今天,,云原生计算基金会技术监督委员会宣布已经投票决议通过,正式将从沙箱项目晋级至孵化项目。晋级为孵化项目之后,将与其他项目一道,成为与其技术利益一致的中立的基金会的一部分,享有基金会为其提供的治理市场和社区推广等权益。 今天,CNCF(...
摘要:引导优化器按照哈希扫描的方式从表中读取数据。告诉优化器强制选择位图索引。这个提示会使优化器合并表上的多个位图索引,而不是选择其中最好的索引这是提示的用途。还可以使用指定单个索引对于指定位图索引,该提示优先于提示。 一、提示(Hint)概述...
摘要:组件用于收集的,并准实时同步给下游,如等。为方便用户和开发者更加深入理解和使用组件,以及基于组件做二次开发用于更多的业务场景,我们决定今天正式开源组件。近期我们将发布源码阅读指南,敬请期待。 TiDB Binlog 组件用于收集 TiDB 的 binlog,...
摘要:作者本文为源码阅读系列文章的第五篇。上篇文章介绍了和两个数据同步处理单元的设计实现,对核心实现数据导入并发模型数据导入暂停或中断的恢复进行了分析。根据库表路由规则对库表名进行转换,用于合库合表。遇到或者积累的数量超过配置的数量立即执行...
摘要:阿里妹导读近日,蚂蚁金服副胡喜应邀做了蚂蚁金服十五年技术架构演进之路的演讲,分享蚂蚁金服对金融科技未来的判断,并首次对外公开蚂蚁金服技术人才培训体系以及项目。 showImg("https://segmentfault.com/img/remote/1460000019158592"); 阿里妹导...
摘要:用动态规划决定连接的执行顺序,当参与连接的表数量不多于时启用。在逻辑优化阶段消除聚合函数时特殊处理,防止产生错误的执行结果。该特性通过对进行执行计划绑定,以确保执行稳定性。执行引擎支持对和算子进行内存追踪控制。 2019 年 5 月 10 日,Ti...
摘要:提升系统性能算子,进一步提升执行性能。采用存储结构减少内存分配及拷贝,的共享提升命中率等手段大幅提升性能。新增系统配置项合法性检查,优化系统监控项等,提升产品易用性。在此对各位贡献者表示由衷的感谢。 作者:段兵 2019 年 5 月 10 日,TiD...
摘要:正是存在问题,促使我们考虑引入数据库审核平台。的确,与很多互联网公司相比,数据库数十套的估摸并不是太大但与互联网类公司不同,类似宜信这类金融类公司对数据库的依赖性更大,大量的应用是重数据库类的,且其使用复杂程度也远比互联网类的复杂。 ...
ChatGPT和Sora等AI大模型应用,将AI大模型和算力需求的热度不断带上新的台阶。哪里可以获得...
大模型的训练用4090是不合适的,但推理(inference/serving)用4090不能说合适,...
图示为GPU性能排行榜,我们可以看到所有GPU的原始相关性能图表。同时根据训练、推理能力由高到低做了...