如何提升JSON.stringify()的性能?

1. 熟悉的JSON.stringify()

在瀏覽器端或服務(wù)端,JSON.stringify()都是我們很常用的方法:

  • 將 JSON object 存儲(chǔ)到 localStorage 中;
  • POST 請(qǐng)求中的 JSON body;
  • 處理響應(yīng)體中的 JSON 形式的數(shù)據(jù);
  • 甚至某些條件下,我們還會(huì)用它來(lái)實(shí)現(xiàn)一個(gè)簡(jiǎn)單的深拷貝;
  • ……

在一些性能敏感的場(chǎng)合下(例如服務(wù)端處理大量并發(fā)),或面對(duì)大量 stringify 的操作時(shí),我們會(huì)希望它的性能更好,速度更快。這也催生了一些優(yōu)化的 stringify 方案/庫(kù),下圖是它們與原生方法的性能對(duì)比:

image

綠色部分時(shí)原生JSON.stringify(),可見(jiàn)性能相較這些庫(kù)都要低很多。那么,在大幅的性能提升背后的技術(shù)原理是什么呢?

2. 比 stringify 更快的 stringify

由于 JavaScript 是動(dòng)態(tài)性很強(qiáng)的語(yǔ)言,所以對(duì)于一個(gè) Object 類型的變量,其包含的鍵名、鍵值、鍵值類型最終只能在運(yùn)行時(shí)確定。因此,執(zhí)行JSON.stringify()時(shí)會(huì)有很多工作要做。在一無(wú)所知的情況下,我們想要大幅優(yōu)化顯然無(wú)能為力。

那么如果我們知道這個(gè) Object 中的鍵名、鍵值信息呢 —— 也就是知道它的結(jié)構(gòu)信息,這會(huì)有幫助么?

看個(gè)例子:

下面這個(gè) Object,

const obj = {
    name: 'alienzhou',
    status: 6,
    working: true
};

我們對(duì)它應(yīng)用JSON.stringify(),得到結(jié)果為

JSON.stringify(obj);
// {"name":"alienzhou","status":6,"working":true}

現(xiàn)在如果我們知道這個(gè)obj的結(jié)構(gòu)是固定的:

  • 鍵名不變
  • 鍵值的類型一定

那么其實(shí),我可以創(chuàng)建一個(gè)“定制化”的 stringify 方法

function myStringify(o) {
    return (
        '{"name":"'
        + o.name
        + '","status":'
        + o.status
        + ',"isWorking":'
        + o.working
        + '}'
    );
}

看看我們的myStringify方法的輸出:

myStringify({
    name: 'alienzhou',
    status: 6,
    working: true
});
// {"name":"alienzhou","status":6,"isWorking":true}

myStringify({
    name: 'mengshou',
    status: 3,
    working: false
});
// {"name":"mengshou","status":3,"isWorking":false}

可以得到正確的結(jié)果,但只用到了類型轉(zhuǎn)換和字符串拼接,所以“定制化”方法可以讓“stringify”更快。

總結(jié)來(lái)看,如何得到比 stringify 更快的 stringify 方法呢?

  1. 需要先確定對(duì)象的結(jié)構(gòu)信息;
  2. 根據(jù)其結(jié)構(gòu)信息,為該種結(jié)構(gòu)的對(duì)象創(chuàng)建“定制化”的stringify方法,其內(nèi)部實(shí)際是通過(guò)字符串拼接生成結(jié)果的;
  3. 最后,使用該“定制化”的方法來(lái) stringify 對(duì)象即可。

這也是大多數(shù) stringify 加速庫(kù)的套路,轉(zhuǎn)化為代碼就是類似:

import faster from 'some_library_faster_stringify';

// 1. 通過(guò)相應(yīng)規(guī)則,定義你的對(duì)象結(jié)構(gòu)
const theObjectScheme = {
    // ……
};

// 2. 根據(jù)結(jié)構(gòu),得到一個(gè)定制化的方法
const stringify = faster(theObjectScheme);

// 3. 調(diào)用方法,快速 stringify
const target = {
    // ……
};
stringify(target);

3. 如何生成“定制化”的方法

根據(jù)上面的分析,核心功能在于,根據(jù)其結(jié)構(gòu)信息,為該類對(duì)象創(chuàng)建“定制化”的stringify方法,其內(nèi)部實(shí)際是簡(jiǎn)單的屬性訪問(wèn)與字符串拼接。

為了了解具體的實(shí)現(xiàn)方式,下面我以兩個(gè)實(shí)現(xiàn)上略有差異的開(kāi)源庫(kù)為例來(lái)簡(jiǎn)單介紹一下。

3.1. fast-json-stringify

image

下圖是根據(jù) fast-json-stringify 提供的 benchmark 結(jié)果,整理出來(lái)的性能對(duì)比。

image

可以看到,在大多數(shù)場(chǎng)景下具備2-5倍的性能提升。

3.1.1. scheme 的定義方式

fast-json-stringify 使用了 JSON Schema Validation 來(lái)定義(JSON)對(duì)象的數(shù)據(jù)格式。其 scheme 定義的結(jié)構(gòu)本身也是 JSON 格式的,例如對(duì)象

{
    name: 'alienzhou',
    status: 6,
    working: true
}

對(duì)應(yīng)的 scheme 就是:

{
    title: 'Example Schema',
    type: 'object',
    properties: {
        name: {
            type: 'string'
        },
        status: {
            type: 'integer'
        },
        working: {
            type: 'boolean'
        }
    }
}

其 scheme 定義規(guī)則豐富,具體使用可以參考 Ajv 這個(gè) JSON 校驗(yàn)庫(kù)。

3.1.2. stringify 方法的生成

fast-json-stringify 會(huì)根據(jù)剛才定義的 scheme,拼接生成出實(shí)際的函數(shù)代碼字符串,然后使用 Function 構(gòu)造函數(shù)在運(yùn)行時(shí)動(dòng)態(tài)生成對(duì)應(yīng)的 stringify 函數(shù)。

在代碼生成上,首先它會(huì)注入預(yù)先定義好的各類工具方法,這一部分不同的 scheme 都是一樣的:

var code = `
    'use strict'
  `

  code += `
    ${$asString.toString()}
    ${$asStringNullable.toString()}
    ${$asStringSmall.toString()}
    ${$asNumber.toString()}
    ${$asNumberNullable.toString()}
    ${$asIntegerNullable.toString()}
    ${$asNull.toString()}
    ${$asBoolean.toString()}
    ${$asBooleanNullable.toString()}
  `

其次,就會(huì)根據(jù) scheme 定義的具體內(nèi)容生成 stringify 函數(shù)的具體代碼。而生成的方式也比較簡(jiǎn)單:通過(guò)遍歷 scheme。

遍歷 scheme 時(shí),根據(jù)定義的類型,在對(duì)應(yīng)代碼處插入相應(yīng)的工具函數(shù)用于鍵值轉(zhuǎn)換。例如上面例子中name這個(gè)屬性:

var accessor = key.indexOf('[') === 0 ? sanitizeKey(key) : `['${sanitizeKey(key)}']`
switch (type) {
    case 'null':
        code += `
            json += $asNull()
        `
        break
    case 'string':
        code += nullable ? `json += obj${accessor} === null ? null : $asString(obj${accessor})` : `json += $asString(obj${accessor})`
        break
    case 'integer':
        code += nullable ? `json += obj${accessor} === null ? null : $asInteger(obj${accessor})` : `json += $asInteger(obj${accessor})`
        break
    ……

上面代碼中的code變量保存的就是最后生成的函數(shù)體的代碼串。由于在 scheme 定義中,namestring類型,且不為空,所以會(huì)在code中添加如下一段代碼字符串:

"json += $asString(obj['name'])"

由于還需要處理數(shù)組、及聯(lián)對(duì)象等復(fù)雜情況,實(shí)際的代碼省略了很多。

然后,生成的完整的code字符串大致如下:

function $asString(str) {
    // ……
}
function $asStringNullable(str) {
    // ……
}
function $asStringSmall(str) {
    // ……
}
function $asNumber(i) {
    // ……
}
function $asNumberNullable(i) {
    // ……
}
/* 以上是一系列通用的鍵值轉(zhuǎn)換方法 */

/* $main 就是 stringify 的主體函數(shù) */
function $main(input) {
    var obj = typeof input.toJSON === 'function'
        ? input.toJSON()
        : input

    var json = '{'
    var addComma = false
    if (obj['name'] !== undefined) {
        if (addComma) {
            json += ','
        }
        addComma = true
        json += '"name":'
        json += $asString(obj['name'])
    }

    // …… 其他屬性(status、working)的拼接

    json += '}'
    return json
}

return $main

最后,將code字符串傳入 Function 構(gòu)造函數(shù)來(lái)創(chuàng)建相應(yīng)的 stringify 函數(shù)。

// dependencies 主要用于處理包含 anyOf 與 if 語(yǔ)法的情況
dependenciesName.push(code)
return (Function.apply(null, dependenciesName).apply(null, dependencies))

3.2. slow-json-stringify

image

slow-json-stringify 雖然名字叫 "slow",但其實(shí)是一個(gè) "fast" 的 stringify 庫(kù)(命名很調(diào)皮)。

The slowest stringifier in the known universe. Just kidding, it's the fastest (:

它的實(shí)現(xiàn)比前面提到的 fast-json-stringify 更輕量級(jí),思路也很巧妙。同時(shí)它在很多場(chǎng)景下效率會(huì)比 fast-json-stringify 更快。

image
image

3.2.1. scheme 的定義方式

slow-json-stringify 的 scheme 定義更自然與簡(jiǎn)單,主要就是將鍵值替換為類型描述。還是上面這個(gè)對(duì)象的例子,scheme 會(huì)變?yōu)?/p>

{
    name: 'string',
    status: 'number',
    working: 'boolean'
}

確實(shí)非常直觀。

3.2.2. stringify 方法的生成

不知道你注意到?jīng)]有

// scheme
{
    name: 'string',
    status: 'number',
    working: 'boolean'
}

// 目標(biāo)對(duì)象
{
    name: 'alienzhou',
    status: 6,
    working: true
}

scheme 和原對(duì)象的結(jié)構(gòu)是不是很像?

這種 scheme 的巧妙之處在于,這樣定義之后,我們可以先把 scheme JSON.stringify一下,然后“扣去”所有類型值,最后等著我們的就是把實(shí)際的值直接填充到 scheme 對(duì)應(yīng)的類型聲明處。

具體如何操作呢?

首先,可以直接對(duì) scheme 調(diào)用JSON.stringify()來(lái)生成基礎(chǔ)模版,同時(shí)借用JSON.stringify()的第二個(gè)參數(shù)來(lái)作為遍歷方法收集屬性的訪問(wèn)路徑:

let map = {};
const str = JSON.stringify(schema, (prop, value) => {
    const isArray = Array.isArray(value);
    if (typeof value !== 'object' || isArray) {
        if (isArray) {
            const current = value[0];
            arrais.set(prop, current);
        }

        _validator(value);

        map[prop] = _deepPath(schema, prop);
        props += `"${prop}"|`;
    }
    return value;
});

此時(shí),map 里收集所有屬性的訪問(wèn)路徑。同時(shí)生成的props可以拼接為匹配相應(yīng)類型字符還的正則表達(dá)式,例如我們這個(gè)例子里的正則表達(dá)式為/name|status|working"(string|number|boolean|undef)"|\\[(.*?)\\]/。

然后,根據(jù)正則表達(dá)式來(lái)順序匹配這些屬性,替換掉屬性類型的字符串,換成統(tǒng)一的占位字符串"__par__",并基于"__par__"拆分字符串:

const queue = [];
const chunks = str
    .replace(regex, (type) => {
      switch (type) {
        case '"string"':
        case '"undefined"':
          return '"__par__"';
        case '"number"':
        case '"boolean"':
        case '["array-simple"]':
        case '[null]':
          return '__par__';
        default:
          const prop = type.match(/(?<=\").+?(?=\")/)[0];
          queue.push(prop);
          return type;
      }
    })
    .split('__par__');

這樣你就會(huì)得到chunksprops兩個(gè)數(shù)組。chunks里包含了被分割的 JSON 字符串。以例子來(lái)說(shuō),兩個(gè)數(shù)組分別如下

// chunks
[
    '{"name":"',
    '","status":"',
    '","working":"',
    '"}'
]

// props
[
    'name',
    'status',
    'working'
]

最后,由于 map 中保存了屬性名與訪問(wèn)路徑的映射,因此可以根據(jù) prop 訪問(wèn)到對(duì)象中某個(gè)屬性的值,循環(huán)遍歷數(shù)組,將其與對(duì)應(yīng)的 chunks 拼接即可。

從代碼量和實(shí)現(xiàn)方式來(lái)看,這個(gè)方案會(huì)更輕便與巧妙,同時(shí)也不需要通過(guò) Function、eval 等方式動(dòng)態(tài)生成或執(zhí)行函數(shù)。

4. 總結(jié)

雖然不同庫(kù)的實(shí)現(xiàn)有差異,但從整體思路上來(lái)說(shuō),實(shí)現(xiàn)高性能 stringify 的方式都是一樣的:

  1. 開(kāi)發(fā)者定義 Object 的 JSON scheme;
  2. stringify 庫(kù)根據(jù) scheme 生成對(duì)應(yīng)的模版方法,模版方法里會(huì)對(duì)屬性與值進(jìn)行字符串拼接(顯然,屬性訪問(wèn)與字符串拼接的效率要高多了);
  3. 最后開(kāi)發(fā)者調(diào)用返回的方法來(lái) stringify Object 即可。

歸根到底,它本質(zhì)上是通過(guò)靜態(tài)的結(jié)構(gòu)信息將優(yōu)化與分析前置了。

Tips

最后,還是想提一下

  • 所有的 benchmark 只能作為一個(gè)參考,具體是否有性能提升、提升多少還是建議你在實(shí)際的業(yè)務(wù)中測(cè)試;
  • fast-json-stringify 中使用到了 Function 構(gòu)造函數(shù),因此建議不要將用戶輸入直接用作 scheme,以防一些安全問(wèn)題。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 概要 64學(xué)時(shí) 3.5學(xué)分 章節(jié)安排 電子商務(wù)網(wǎng)站概況 HTML5+CSS3 JavaScript Node 電子...
    阿啊阿吖丁閱讀 9,874評(píng)論 0 3
  • 第一部分 HTML&CSS整理答案 1. 什么是HTML5? 答:HTML5是最新的HTML標(biāo)準(zhǔn)。 注意:講述HT...
    kismetajun閱讀 28,826評(píng)論 1 45
  • Swift1> Swift和OC的區(qū)別1.1> Swift沒(méi)有地址/指針的概念1.2> 泛型1.3> 類型嚴(yán)謹(jǐn) 對(duì)...
    cosWriter閱讀 11,674評(píng)論 1 32
  • 第5章 引用類型(返回首頁(yè)) 本章內(nèi)容 使用對(duì)象 創(chuàng)建并操作數(shù)組 理解基本的JavaScript類型 使用基本類型...
    大學(xué)一百閱讀 3,683評(píng)論 0 4
  • 我們先來(lái)看一個(gè)JS中常見(jiàn)的JS對(duì)象序列化成JSON字符串的問(wèn)題,請(qǐng)問(wèn),以下JS對(duì)象通過(guò)JSON.stringify...
    程序員之路閱讀 1,065評(píng)論 0 6

友情鏈接更多精彩內(nèi)容