资讯专栏INFORMATION COLUMN

用 JavaScript 解释 JavaScript 虚拟机-内联缓存(inline caches)

mikyou / 1973人阅读

摘要:用解释虚拟机内联缓存本文转载自众成翻译译者链接原文我知道如何实现用语言或者语言的子集来实现运行该语言虚拟机。有时候我们用了错误的抽象层次来解释虚拟机的工作机制。这正是我们的内联缓存功能所需要的。

用JavaScript解释JavaScript虚拟机-内联缓存(inline caches)

</>复制代码

  1. 本文转载自:众成翻译
    译者:LexHuang
    链接:http://www.zcfy.cc/article/2959
    原文:http://mrale.ph/blog/2012/06/03/explaining-js-vms-in-js-inline-caches.html

我知道如何实现用语言(或者语言的子集)来实现运行该语言虚拟机。如果我在学校或者有更多的时间我肯定会用JavaScript实现一个JavaScript虚拟机。实际上这并不会变成一个独一无二的JavaScript项目,因为蒙特利尔大学的人所造的Tachyon已经在某种程度上达到了同样的目的,但是我也有些我自己想要追求的点子。

我则有另一个和自循环虚拟机紧密相关的梦想。我想要帮助JavaScript开发者理解JS引擎的工作方式。我认为理解你正在使用的工具是我们职业生涯中最重要的。越多人不在把JS VM看作是将JavaScript源码转为0-1神秘的黑盒越好。

我应该说我不是一个人在追求如何解释虚拟机的内部机制并且帮助人们编写性能更好的代码。全世界有许多人正在尝试做同样的事情。但是我认为又一个问题正在阻止知识有效地被开发者所吸收——我们正在用错误的形式来传授我们的知识。我对此深感愧疚:

有时候我把我对V8的了解包装成了很难消化的“做这个,别做那个”的教条化意见。这样的问题在于它对于解释起不到任何帮助并且很容易随着关注人的减少而消失。

有时候我们用了错误的抽象层次来解释虚拟机的工作机制。我喜欢一个想法:看见满是汇编代码的ppt演示可能会鼓励人们去学习汇编并且学会之后会去读ppt演示的内容。但我也害怕有时候这些ppt只会被人忽视和遗忘而对于实践毫无用处。

我一直在思考这些问题很长时间了并且我认为用JavaScript来解释JavaScript虚拟机是一个值得尝试的事情。我在WebRebels 2012发表的演讲“V8 Inside Out”追求的正是这一点[视频][演示]并且在本文中我像回顾我一直在奥斯陆所谈论的事情但是不同的是不会有任何音频的干扰。(我认为我写作的方式比我演讲的方式更加严肃些 ☺)。

用JavaScript来实现动态语言

想象你想要为了一个在语法上非常类似于JavaScript但是有着更简单的对象模型的语言——用表来映射key到任意类型的值来代替JavaScript对象——而来用JavaScript实现其虚拟机。简单起见,让我们想象Lua, 既像JavaScript但作为一个语言又很不一样。我最喜欢的“造出一个充满点的数组然后去计算向量合”的例子看起来大致如下:

</>复制代码

  1. function MakePoint(x, y)
  2. local point = {}
  3. point.x = x
  4. point.y = y
  5. return point
  6. end
  7. function MakeArrayOfPoints(N)
  8. local array = {}
  9. local m = -1
  10. for i = 0, N do
  11. m = m * -1
  12. array[i] = MakePoint(m * i, m * -i)
  13. end
  14. array.n = N
  15. return array
  16. end
  17. function SumArrayOfPoints(array)
  18. local sum = MakePoint(0, 0)
  19. for i = 0, array.n do
  20. sum.x = sum.x + array[i].x
  21. sum.y = sum.y + array[i].y
  22. end
  23. return sum
  24. end
  25. function CheckResult(sum)
  26. local x = sum.x
  27. local y = sum.y
  28. if x ~= 50000 or y ~= -50000 then
  29. error("failed: x = " .. x .. ", y = " .. y)
  30. end
  31. end
  32. local N = 100000
  33. local array = MakeArrayOfPoints(N)
  34. local start_ms = os.clock() * 1000;
  35. for i = 0, 5 do
  36. local sum = SumArrayOfPoints(array)
  37. CheckResult(sum)
  38. end
  39. local end_ms = os.clock() * 1000;
  40. print(end_ms - start_ms)

注意我有一个至少检查某些最终结果的微型基准测试的习惯。这有助于当有人发现我的革命性的jsperf测试用例只不过是我自己的bug时,让我不会太尴尬。

如果你拿上面的例子放入一个Lua编译器你会得到类似于下面的东西:

</>复制代码

  1. lua points.lua
  2. 150.2

很好,但是对于了解虚拟机的工作过程起不到任何帮助。所以让我们想想如果我们有用JavaScript编写的类Lua虚拟机会长什么样。“类”是因为我不想实现完全类似于Lua的语法,我更喜欢只关注于用表来实现对象这一点上。原生编译器应该会将我们的代码编译成下面的JavaScript:

</>复制代码

  1. function MakePoint(x, y) {
  2. var point = new Table();
  3. STORE(point, "x", x);
  4. STORE(point, "y", y);
  5. return point;
  6. }
  7. function MakeArrayOfPoints(N) {
  8. var array = new Table();
  9. var m = -1;
  10. for (var i = 0; i <= N; i++) {
  11. m = m * -1;
  12. STORE(array, i, MakePoint(m * i, m * -i));
  13. }
  14. STORE(array, "n", N);
  15. return array;
  16. }
  17. function SumArrayOfPoints(array) {
  18. var sum = MakePoint(0, 0);
  19. for (var i = 0; i <= LOAD(array, "n"); i++) {
  20. STORE(sum, "x", LOAD(sum, "x") + LOAD(LOAD(array, i), "x"));
  21. STORE(sum, "y", LOAD(sum, "y") + LOAD(LOAD(array, i), "y"));
  22. }
  23. return sum;
  24. }
  25. function CheckResult(sum) {
  26. var x = LOAD(sum, "x");
  27. var y = LOAD(sum, "y");
  28. if (x !== 50000 || y !== -50000) {
  29. throw new Error("failed: x = " + x + ", y = " + y);
  30. }
  31. }
  32. var N = 100000;
  33. var array = MakeArrayOfPoints(N);
  34. var start = LOAD(os, "clock")() * 1000;
  35. for (var i = 0; i <= 5; i++) {
  36. var sum = SumArrayOfPoints(array);
  37. CheckResult(sum);
  38. }
  39. var end = LOAD(os, "clock")() * 1000;
  40. print(end - start);

但是如果你尝试用d8(V8的独立shell)去运行编译后的代码,它会很礼貌的拒绝:

</>复制代码

  1. d8 points.js
  2. points.js:9: ReferenceError: Table is not defined
  3. var array = new Table();
  4. ^
  5. ReferenceError: Table is not defined
  6. at MakeArrayOfPoints (points.js:9:19)
  7. at points.js:37:13

失败的原因很简单:我们还缺少负责实现对象模型和存取语法的运行时系统代码。这可能看起来很明显,但是我想要强调的是:虚拟机从外面看起来像是黑盒,在内部实际上是一系列盒子为了得到出最佳性能的相互协作。这些盒子是:编译器、运行时例程、对象模型、垃圾回收等。幸运的是我们的语言和例子非常简单所以我们的运行时系统仅仅多了几行代码:

</>复制代码

  1. function Table() {
  2. // Map from ES Harmony is a simple dictionary-style collection.
  3. this.map = new Map;
  4. }
  5. Table.prototype = {
  6. load: function (key) { return this.map.get(key); },
  7. store: function (key, value) { this.map.set(key, value); }
  8. };
  9. function CHECK_TABLE(t) {
  10. if (!(t instanceof Table)) {
  11. throw new Error("table expected");
  12. }
  13. }
  14. function LOAD(t, k) {
  15. CHECK_TABLE(t);
  16. return t.load(k);
  17. }
  18. function STORE(t, k, v) {
  19. CHECK_TABLE(t);
  20. t.store(k, v);
  21. }
  22. var os = new Table();
  23. STORE(os, "clock", function () {
  24. return Date.now() / 1000;
  25. });

注意到我用了ES6的Map而不是一般的JavaScript对象因为潜在的表可以使用任何键,而不仅是字符串形式的。

</>复制代码

  1. d8 **--harmony** quasi-lua-runtime.js points.js
  2. 737

现在我们编译后的代码可以执行但是却慢地令人失望,因为每一次读和写不得不跨越所有这些抽象层级后才能拿到值。让我们通过所有JavaScript虚拟机都有的最基本的优化inline caching来尝试减少这些开销。即使是用Java实现的JS虚拟机最终也会使用它因为动态调用的本质是被暴露在字节码层面的结构化的內联缓存。Inline caching(在V8资源里通常简写为IC)实际上是一门近30年的非常古老的技术,最初用在Smalltalk虚拟机上。

好鸭子总是叫地一模一样

内联缓存(Inline caching)背后的思想非常简单:创建一个高速路来绕过运行时系统来读取对象的属性:对传入的对象及其属性作出某种假设,然后通过一个低成本的方式验证这个假设是否正确,如果正确就读取上次缓存的结果。在充满了动态类型和晚绑定以及其他古怪行为——比如eval——的语言里对一个对象作出合理的假设是非常困难的,所以我们退而求其次,让我们的读/写操作能够有学习能力:一旦它们看见某个对象它们就可以以某种方式来自适应,使得之后的读取操作在遇到类似结构的对象时能够更快地进行。在某种意义上,我们将要在读/写操作上缓存关于之前见过的对象的布局的相关知识——这也是内联缓存这个名字的由来。内联缓存可以被用在几乎所有需要动态行为的操作上,只要你可以找到正确的高速路:算数操作、调用自由函数、方法调用等等。有些内联缓存还能缓存不止一条快速通道,这些内联缓存就变成了多态的。

如果我们开始思考如何应用内联缓存到上面编译后的代码,答案就变得显而易见了:我们需要改变我们的对象模型。我们不可能从一个map中进行快速读取,因为我们总是要调用get方法。[如果我们能够窥探map后的纯哈希表,我们就可以通过缓存桶索引来让内联缓存替我们工作而不需要相处一个新的对象布局。]

探索隐藏结构

出于效率角度考虑,用作数据结构的表应该更类似于C结构:带有固定偏移量的命名字段序列。这样表就和数组类似:我们希望数字形式的属性的存储类似于数组。但是很显然并不是所有表的键都是数字:键可以被设计成非字符串非数字或者包含太多字符串命名的属性,并且随着表的修改键也会随之修改。不幸的是,我们不能做任何昂贵的类型推断。取而代之我们必须找在程序运行期间的每一个表背后的结构,并且随着程序的运行可以创建和修改它们。幸运的是,有一个众所周知的技术 ☺:_隐藏类(hidden classes)_。

隐藏类背后的思想可以归结为以下两点:

对于每个javascript对象,运行时系统都会将其合一个hidden class关联起来。就像Java VM会关联一个java.lang.Class的实例给每个对象一样。

如果对象的布局改变了,则运行时就会 找到一个hidden class或者创建一个新的hidden class来匹配这个新对象布局并且连接到该对象上。

隐藏类有个非常重要的特性:它们运行虚拟机通过简单比对缓存过的隐藏类来检查关于某个对象布局的假设。这正是我们的内联缓存功能所需要的。让我们为我们的类-Lua运行时来实现一些简单的隐藏类系统。每个隐藏类本质上是属性描述符的集合,每个描述符要么是一个真正的属性,要么是一个过渡(transition):从一个没有该属性的类指向一个有该属性的类。

</>复制代码

  1. function Transition(klass) {
  2. this.klass = klass;
  3. }
  4. function Property(index) {
  5. this.index = index;
  6. }
  7. function Klass(kind) {
  8. // Classes are "fast" if they are C-struct like and "slow" is they are Map-like.
  9. this.kind = kind;
  10. this.descriptors = new Map;
  11. this.keys = [];
  12. }

过渡之所以存在是为了让多个对象之间能共享隐藏类:如果你有两个对象共享了隐藏类并且你为它们同时增加了某些属性,你不希望得到不同的隐藏类。

</>复制代码

  1. Klass.prototype = {
  2. // Create hidden class with a new property that does not exist on
  3. // the current hidden class.
  4. addProperty: function (key) {
  5. var klass = this.clone();
  6. klass.append(key);
  7. // Connect hidden classes with transition to enable sharing:
  8. // this == add property key ==> klass
  9. this.descriptors.set(key, new Transition(klass));
  10. return klass;
  11. },
  12. hasProperty: function (key) {
  13. return this.descriptors.has(key);
  14. },
  15. getDescriptor: function (key) {
  16. return this.descriptors.get(key);
  17. },
  18. getIndex: function (key) {
  19. return this.getDescriptor(key).index;
  20. },
  21. // Create clone of this hidden class that has same properties
  22. // at same offsets (but does not have any transitions).
  23. clone: function () {
  24. var klass = new Klass(this.kind);
  25. klass.keys = this.keys.slice(0);
  26. for (var i = 0; i < this.keys.length; i++) {
  27. var key = this.keys[i];
  28. klass.descriptors.set(key, this.descriptors.get(key));
  29. }
  30. return klass;
  31. },
  32. // Add real property to descriptors.
  33. append: function (key) {
  34. this.keys.push(key);
  35. this.descriptors.set(key, new Property(this.keys.length - 1));
  36. }
  37. };

现在我们可以让我们的表变得更加灵活并且能允许它们自适应其自身地构造方式

</>复制代码

  1. var ROOT_KLASS = new Klass("fast");
  2. function Table() {
  3. // All tables start from the fast empty root hidden class and form
  4. // a single tree. In V8 hidden classes actually form a forest -
  5. // there are multiple root classes, e.g. one for each constructor.
  6. // This is partially due to the fact that hidden classes in V8
  7. // encapsulate constructor specific information, e.g. prototype
  8. // poiinter is actually stored in the hidden class and not in the
  9. // object itself so classes with different prototypes must have
  10. // different hidden classes even if they have the same structure.
  11. // However having multiple root classes also allows to evolve these
  12. // trees separately capturing class specific evolution independently.
  13. this.klass = ROOT_KLASS;
  14. this.properties = []; // Array of named properties: "x","y",...
  15. this.elements = []; // Array of indexed properties: 0, 1, ...
  16. // We will actually cheat a little bit and allow any int32 to go here,
  17. // we will also allow V8 to select appropriate representation for
  18. // the array"s backing store. There are too many details to cover in
  19. // a single blog post :-)
  20. }
  21. Table.prototype = {
  22. load: function (key) {
  23. if (this.klass.kind === "slow") {
  24. // Slow class => properties are represented as Map.
  25. return this.properties.get(key);
  26. }
  27. // This is fast table with indexed and named properties only.
  28. if (typeof key === "number" && (key | 0) === key) { // Indexed property.
  29. return this.elements[key];
  30. } else if (typeof key === "string") { // Named property.
  31. var idx = this.findPropertyForRead(key);
  32. return (idx >= 0) ? this.properties[idx] : void 0;
  33. }
  34. // There can be only string&number keys on fast table.
  35. return void 0;
  36. },
  37. store: function (key, value) {
  38. if (this.klass.kind === "slow") {
  39. // Slow class => properties are represented as Map.
  40. this.properties.set(key, value);
  41. return;
  42. }
  43. // This is fast table with indexed and named properties only.
  44. if (typeof key === "number" && (key | 0) === key) { // Indexed property.
  45. this.elements[key] = value;
  46. return;
  47. } else if (typeof key === "string") { // Named property.
  48. var index = this.findPropertyForWrite(key);
  49. if (index >= 0) {
  50. this.properties[index] = value;
  51. return;
  52. }
  53. }
  54. this.convertToSlow();
  55. this.store(key, value);
  56. },
  57. // Find property or add one if possible, returns property index
  58. // or -1 if we have too many properties and should switch to slow.
  59. findPropertyForWrite: function (key) {
  60. if (!this.klass.hasProperty(key)) { // Try adding property if it does not exist.
  61. // To many properties! Achtung! Fast case kaput.
  62. if (this.klass.keys.length > 20) return -1;
  63. // Switch class to the one that has this property.
  64. this.klass = this.klass.addProperty(key);
  65. return this.klass.getIndex(key);
  66. }
  67. var desc = this.klass.getDescriptor(key);
  68. if (desc instanceof Transition) {
  69. // Property does not exist yet but we have a transition to the class that has it.
  70. this.klass = desc.klass;
  71. return this.klass.getIndex(key);
  72. }
  73. // Get index of existing property.
  74. return desc.index;
  75. },
  76. // Find property index if property exists, return -1 otherwise.
  77. findPropertyForRead: function (key) {
  78. if (!this.klass.hasProperty(key)) return -1;
  79. var desc = this.klass.getDescriptor(key);
  80. if (!(desc instanceof Property)) return -1; // Here we are not interested in transitions.
  81. return desc.index;
  82. },
  83. // Copy all properties into the Map and switch to slow class.
  84. convertToSlow: function () {
  85. var map = new Map;
  86. for (var i = 0; i < this.klass.keys.length; i++) {
  87. var key = this.klass.keys[i];
  88. var val = this.properties[i];
  89. map.set(key, val);
  90. }
  91. Object.keys(this.elements).forEach(function (key) {
  92. var val = this.elements[key];
  93. map.set(key | 0, val); // Funky JS, force key back to int32.
  94. }, this);
  95. this.properties = map;
  96. this.elements = null;
  97. this.klass = new Klass("slow");
  98. }
  99. };

[我不打算一行一行地解释上面的代码,因为它已经是用JavaScript书写的了;而不是C++ 或者 汇编...这正是使用JavaScript的意义所在。然而你可以通过评论或者邮件来询问任何不理解的地方。]

既然我们已经在运行时系统里加入了隐藏类,使得我们能够快速检查对象的结构并且通过它们的索引来快速读取属性,我们只差实现内联缓存了。这需要在编译器和运行时系统增加一些新的功能(还记得我谈论过虚拟机内不同成员之间的协作么?)。

打包生成后代码

实现内联缓存的途径之一是将其分割成两个部分:生成代码里的可变调用点和可以被调用点调用的一系列存根(stubs,一小片生成的本地代码)。非常重要的一点是:存根本身必须能从调用它们的调用点(或者运行时系统)中找到:存根只存放特定假设下的编译后的快速路径,如果这些假设对存根遇到的对象不适用,则存根可以初始化调用该存根的调用点的变动(打包,patching),使得该调用点能够适应新的情况。我们的纯JavaScript仍然包含两个部分:

一个全局变量,每个ic都会使用一个全局变量来模拟可变调用指令;

并使用闭包来代替存根。

在本地代码里, V8通过在栈上监听返回地址来找到要打包的内联缓存点。我们不能通过纯JavaScript来达到这一点(arguments.caller的粒度不够细)。所以我们将只会显式地传递内联缓存的id到内联缓存的存根。通过内联缓存优化后的代码如下:

</>复制代码

  1. // Initially all ICs are in uninitialized state.
  2. // They are not hitting the cache and always missing into runtime system.
  3. var STORE$0 = NAMED_STORE_MISS;
  4. var STORE$1 = NAMED_STORE_MISS;
  5. var KEYED_STORE$2 = KEYED_STORE_MISS;
  6. var STORE$3 = NAMED_STORE_MISS;
  7. var LOAD$4 = NAMED_LOAD_MISS;
  8. var STORE$5 = NAMED_STORE_MISS;
  9. var LOAD$6 = NAMED_LOAD_MISS;
  10. var LOAD$7 = NAMED_LOAD_MISS;
  11. var KEYED_LOAD$8 = KEYED_LOAD_MISS;
  12. var STORE$9 = NAMED_STORE_MISS;
  13. var LOAD$10 = NAMED_LOAD_MISS;
  14. var LOAD$11 = NAMED_LOAD_MISS;
  15. var KEYED_LOAD$12 = KEYED_LOAD_MISS;
  16. var LOAD$13 = NAMED_LOAD_MISS;
  17. var LOAD$14 = NAMED_LOAD_MISS;
  18. function MakePoint(x, y) {
  19. var point = new Table();
  20. STORE$0(point, "x", x, 0); // The last number is IC"s id: STORE$0 ⇒ id is 0
  21. STORE$1(point, "y", y, 1);
  22. return point;
  23. }
  24. function MakeArrayOfPoints(N) {
  25. var array = new Table();
  26. var m = -1;
  27. for (var i = 0; i <= N; i++) {
  28. m = m * -1;
  29. // Now we are also distinguishing between expressions x[p] and x.p.
  30. // The fist one is called keyed load/store and the second one is called
  31. // named load/store.
  32. // The main difference is that named load/stores use a fixed known
  33. // constant string key and thus can be specialized for a fixed property
  34. // offset.
  35. KEYED_STORE$2(array, i, MakePoint(m * i, m * -i), 2);
  36. }
  37. STORE$3(array, "n", N, 3);
  38. return array;
  39. }
  40. function SumArrayOfPoints(array) {
  41. var sum = MakePoint(0, 0);
  42. for (var i = 0; i <= LOAD$4(array, "n", 4); i++) {
  43. STORE$5(sum, "x", LOAD$6(sum, "x", 6) + LOAD$7(KEYED_LOAD$8(array, i, 8), "x", 7), 5);
  44. STORE$9(sum, "y", LOAD$10(sum, "y", 10) + LOAD$11(KEYED_LOAD$12(array, i, 12), "y", 11), 9);
  45. }
  46. return sum;
  47. }
  48. function CheckResults(sum) {
  49. var x = LOAD$13(sum, "x", 13);
  50. var y = LOAD$14(sum, "y", 14);
  51. if (x !== 50000 || y !== -50000) throw new Error("failed x: " + x + ", y:" + y);
  52. }

上述的改变依旧是不言自明的:每一个属性的读/写点都有属于它们自己的、带有id的内联缓存。距离最终完成还剩一小步:实现未命中(MISS)存根和可以生存特定存根的“存根编译器”:

</>复制代码

  1. function NAMED_LOAD_MISS(t, k, ic) {
  2. var v = LOAD(t, k);
  3. if (t.klass.kind === "fast") {
  4. // Create a load stub that is specialized for a fixed class and key k and
  5. // loads property from a fixed offset.
  6. var stub = CompileNamedLoadFastProperty(t.klass, k);
  7. PatchIC("LOAD", ic, stub);
  8. }
  9. return v;
  10. }
  11. function NAMED_STORE_MISS(t, k, v, ic) {
  12. var klass_before = t.klass;
  13. STORE(t, k, v);
  14. var klass_after = t.klass;
  15. if (klass_before.kind === "fast" &&
  16. klass_after.kind === "fast") {
  17. // Create a store stub that is specialized for a fixed transition between classes
  18. // and a fixed key k that stores property into a fixed offset and replaces
  19. // object"s hidden class if necessary.
  20. var stub = CompileNamedStoreFastProperty(klass_before, klass_after, k);
  21. PatchIC("STORE", ic, stub);
  22. }
  23. }
  24. function KEYED_LOAD_MISS(t, k, ic) {
  25. var v = LOAD(t, k);
  26. if (t.klass.kind === "fast" && (typeof k === "number" && (k | 0) === k)) {
  27. // Create a stub for the fast load from the elements array.
  28. // Does not actually depend on the class but could if we had more complicated
  29. // storage system.
  30. var stub = CompileKeyedLoadFastElement();
  31. PatchIC("KEYED_LOAD", ic, stub);
  32. }
  33. return v;
  34. }
  35. function KEYED_STORE_MISS(t, k, v, ic) {
  36. STORE(t, k, v);
  37. if (t.klass.kind === "fast" && (typeof k === "number" && (k | 0) === k)) {
  38. // Create a stub for the fast store into the elements array.
  39. // Does not actually depend on the class but could if we had more complicated
  40. // storage system.
  41. var stub = CompileKeyedStoreFastElement();
  42. PatchIC("KEYED_STORE", ic, stub);
  43. }
  44. }
  45. function PatchIC(kind, id, stub) {
  46. this[kind + "$" + id] = stub; // non-strict JS funkiness: this is global object.
  47. }
  48. function CompileNamedLoadFastProperty(klass, key) {
  49. // Key is known to be constant (named load). Specialize index.
  50. var index = klass.getIndex(key);
  51. function KeyedLoadFastProperty(t, k, ic) {
  52. if (t.klass !== klass) {
  53. // Expected klass does not match. Can"t use cached index.
  54. // Fall through to the runtime system.
  55. return NAMED_LOAD_MISS(t, k, ic);
  56. }
  57. return t.properties[index]; // Veni. Vidi. Vici.
  58. }
  59. return KeyedLoadFastProperty;
  60. }
  61. function CompileNamedStoreFastProperty(klass_before, klass_after, key) {
  62. // Key is known to be constant (named load). Specialize index.
  63. var index = klass_after.getIndex(key);
  64. if (klass_before !== klass_after) {
  65. // Transition happens during the store.
  66. // Compile stub that updates hidden class.
  67. return function (t, k, v, ic) {
  68. if (t.klass !== klass_before) {
  69. // Expected klass does not match. Can"t use cached index.
  70. // Fall through to the runtime system.
  71. return NAMED_STORE_MISS(t, k, v, ic);
  72. }
  73. t.properties[index] = v; // Fast store.
  74. t.klass = klass_after; // T-t-t-transition!
  75. }
  76. } else {
  77. // Write to an existing property. No transition.
  78. return function (t, k, v, ic) {
  79. if (t.klass !== klass_before) {
  80. // Expected klass does not match. Can"t use cached index.
  81. // Fall through to the runtime system.
  82. return NAMED_STORE_MISS(t, k, v, ic);
  83. }
  84. t.properties[index] = v; // Fast store.
  85. }
  86. }
  87. }
  88. function CompileKeyedLoadFastElement() {
  89. function KeyedLoadFastElement(t, k, ic) {
  90. if (t.klass.kind !== "fast" || !(typeof k === "number" && (k | 0) === k)) {
  91. // If table is slow or key is not a number we can"t use fast-path.
  92. // Fall through to the runtime system, it can handle everything.
  93. return KEYED_LOAD_MISS(t, k, ic);
  94. }
  95. return t.elements[k];
  96. }
  97. return KeyedLoadFastElement;
  98. }
  99. function CompileKeyedStoreFastElement() {
  100. function KeyedStoreFastElement(t, k, v, ic) {
  101. if (t.klass.kind !== "fast" || !(typeof k === "number" && (k | 0) === k)) {
  102. // If table is slow or key is not a number we can"t use fast-path.
  103. // Fall through to the runtime system, it can handle everything.
  104. return KEYED_STORE_MISS(t, k, v, ic);
  105. }
  106. t.elements[k] = v;
  107. }
  108. return KeyedStoreFastElement;
  109. }

代码很长(以及注释),但是配合上面所有解释应该不难理解:内联缓存负责观察而存根编译器/工程负责生产自适应和特化后的存根[有心的读者可能注意到了我本可以初始化所有键控的存储内联缓存(keyed store ICs),用一开始的快速读取或者当它进入快速状态后就一直保持住]。

如果我们不管上面所有代码而回到我们的“基准测试”,我们会得到非常令人满意的结果:

</>复制代码

  1. d8 --harmony quasi-lua-runtime-ic.js points-ic.js
  2. 117

这要比我们一开始的天真尝试提升了6倍!

关于JavaScript虚拟机优化永远也不会有结论

希望你在阅读这一部分的时候已经看完了之前所有内容...我尝试从不同的角度,JavaScript开发者的角度,来看某些驱动当今JavaScript引擎的点子。所写的代码越长,我越有一种盲人摸象的感觉。下面的事实只是为了给你一种望向深渊的感觉:V8有10种描述符,5种元素类型(+9外部元素类型),ic.cc里包含了几乎所有内联缓存状态选择的逻辑多达2500行,并且V8的内联缓存的状态不止2个(它们是uninitialized, premonomorphic, monomorphic, polymorphic, generic states,更别提用于键控读/写的内联缓存的特殊的状态或者是算数内敛缓存的完全不同的状态层级),ia32-specific手写的内联缓存存根多达5000行代码,等等。这些数字只会随着时间的流逝和V8为了识别和适应越来越多的对象布局的学习而增长。而且我甚至都还没谈到对象模型本身(objects.cc 13k行代码),或者垃圾回收,或者优化编译器。

话虽如此,在可预见的未来內,我确信基础将不会改变,如果变了肯定会引发一场你一定会注意到的巨大的爆炸!因此我认为这次尝试用JavaScript去理解基础的练习是非常非常非常重要的。

我希望明天或者几周之后你会停下来并且大喊“我找到了!”并且告诉你的为什么特定情况下在一个地方为一个对象增加属性会影响其余很远的接触这些对象的热回路的性能。_你知道的,因为隐藏类变了!_

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/84990.html

相关文章

  • V8 中的 Fast 属性

    摘要:这些是中可用的最快属性。通常来说我们将线性属性存储中存储的属性称为。因此也支持所谓的属性。整数索引属性的处理和命名属性的复杂性相同。 本文为译文,原文地址:http://v8project.blogspot.com...,作者,@Camillo Bruni ,V8 JavaScript Engine Team Blog 在这篇博客中,我们想解释 V8 如何在内部处理 JavaScrip...

    Andrman 评论0 收藏0
  • JavaScript如何工作:V8引擎深入探究 + 优化代码的5个技巧(译文)

    摘要:引擎可以是一个标准的解释器,也可以是一个将编译成某种形式的字节码的即时编译器。和其他引擎最主要的差别在于,不会生成任何字节码或是中间代码。不使用中间字节码的表示方式,就没有必要用解释器了。 原文地址:https://blog.sessionstack.com... showImg(https://segmentfault.com/img/bVVwZ8?w=395&h=395); 数周之...

    William_Sang 评论0 收藏0
  • javascript运行环境和消息队列

    摘要:字节码不能直接运行,而是运行在一个虚拟机之上,一般也把虚拟机称为引擎。这些事件排成队列,等候进入主线程。执行至完成每一个消息执行完成后,其它消息才会被执行。零延迟零延迟并不是意味着回调会立即执行。 JavaScript虚拟机 JavaScript是一种解释型语言,也就是说,它不需要编译,可以由解释器实时运行。这样的好处是运行和修改都比较方便,刷新页面就可以重新解释;缺点是每次运行都要调...

    cppowboy 评论0 收藏0
  • 使 D8 分析 javascript 如何被 V8 引擎优化的

    摘要:负责找出经常被调用的代码,做内联缓存优化,后面的信息进一步说明了这个情况。我们再使用参数看看引擎如何去优化。如果使用,直接运行输出的是的命令行参数,如果想查看的,需要使用。后面章节会介绍的命令行参数以及最有意思的。 在上一篇文章中我们讲了如何使用 GN 编译 V8 源码,文章最后编译完成的可执行文件并不是 V8,而是 D8。这篇我们讲一下如何使用 D8 调试 javascript 代码...

    Airmusic 评论0 收藏0
  • 页面加速优化

    摘要:延迟加载当我们调用外部的时候,使用事件在页面内部被加载前,外部将不被加载脚本调用外部文件拷贝以上代码。代码代码片段组合外部工具列表页面加速优化页面请求工具工具大全扩展阅读方面的设置 内联 CSS 优点 使用内联 CSS 可以减少浏览器去服务端去下载 CSS 文件 关键 CSS 内联到 HTML 文件中 缺点 CSS 文件没法被缓存 注意:该方法只适用于很小的 CSS...

    Lin_YT 评论0 收藏0

发表评论

0条评论

mikyou

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<