理解 Python 的 Dataclasses(二)

dataclasses

這是 Python 最新的 Dataclasses 系列的第二部分內(nèi)容。在第一部分里,我介紹了dataclasses 的一般用法。這篇博客主要介紹另一個特征:dataclasses.field。

我們已經(jīng)知道Dataclasses會生成他們自身的__init__方法。它同時把初始化的值賦給這些字段。以下是我們在上一篇博客里定義的內(nèi)容:

  • 變量名

  • 數(shù)據(jù)類型

這些內(nèi)容僅給我們有限的 dataclass字段使用范圍。讓我們討論一下這些局限性,以及它們?nèi)绾瓮ㄟ^ dataclass.field被解決。

復(fù)合初始化

考慮以下情形:你想要初始化一個變量為列表。你如何實現(xiàn)它呢?一種簡單的方式是使用__post_init__方法。

dataclasses

數(shù)據(jù)類Student產(chǎn)生了一個名為marks 的列表。我們不傳遞 marks 的值,而是使用__post_init__方法初始化。這是我們定義的單一屬性。此外,我們必須在__post_init__里調(diào)用get_random_marks 函數(shù)。這些工作是額外的。

辛運的是,Python為我們提供了一個解決方案。我們可以使用dataclasses.field來定制化 dataclass字段的行為以及它們在dataclass的影響。

仍然是上述的使用情形,讓我們從__post_init__里去除 get_random_marks 的調(diào)用。以下是使用dataclasses.field的情形:

dataclasses

dataclasses.field 接受了一個名為default_factory的參數(shù),它的作用是:如果在創(chuàng)建對象時沒有賦值,則使用該方法初始化該字段。

default_factory必須是一個可以調(diào)用的無參數(shù)方法(通常為一個函數(shù))。

這樣我們就可以使用復(fù)合形式初始化字段。現(xiàn)在,讓我們考慮另一個使用場景。

使用全部字段進行數(shù)據(jù)比較

通過上篇博文,我們了解到,dataclass 能夠自動生成< ,=, >, <=>=這些比較方法。但是這些比較方法的一個缺陷是,它們使用類中的所有字段進行比較,而這種情況往往不常見。更經(jīng)常地,這種比較方法會給我們使用 dataclasses造成麻煩。

考慮以下的使用情形:你有一個數(shù)據(jù)類用于存放用戶的信息?,F(xiàn)在,它可能存在以下字段:

  • 姓名

  • 年齡

  • 身高

  • 體重

你僅想比較用戶對象的年齡、身高和體重。你不想比較姓名。這是后端開發(fā)者經(jīng)常會遇到的使用情景。


dataclass

自動生成的比較方法會比較一下的數(shù)組:

dataclass

這將會破壞我們的意圖。我們不想讓姓名(name)用于比較。那么,如何使用 dataclasses.field來實現(xiàn)我們的想法呢?

下面是具體步驟:

dataclass

默認情況下,所用的字段都用于比較,因此我們僅僅需要指定哪些字段用于比較,而實現(xiàn)方法是直接把不需要的字段定義為filed(compare=False)。

一個更為簡單的應(yīng)用情形也可以被討論。讓我們定義一個數(shù)據(jù)類,它被用來存儲一個數(shù)字激起字符串表示。我們想讓比較僅僅發(fā)生在該數(shù)字的值,而不是他的字符串表示。


dataclass

現(xiàn)在,我們有更大的自由來控制 dataclasses 的行為。看起來很棒!

使用全部字段進行數(shù)據(jù)表示

自動生成的__repr__方法使用所有的字段用于表示。當然,這也不是大多數(shù)情形下的理想選擇,尤其是當你的數(shù)據(jù)類有大量的字段時。單個對象的表示會變得異常臃腫,對調(diào)試來說也不利。

dataclass

想象一下在你的日志里看到這樣的表示吧,然后還要寫一個正則表達式來搜索它。太可怕了,對吧?

當然,我們也能夠個性化這種行為??紤]一個類似的使用場景,也許最合適的用于表示的屬性是姓名(name)。那么對__repr__,我們僅使用它:

dataclass

這樣看起來就很棒了。調(diào)試很方便,比較也有意義!

從初始化中省略字段

目前為止我們看到的所有例子,都有一個共同特點——即我們需要為所有被聲明的字段傳遞值,除了有默認值之外。在那種情形下(指有默認值的情況下),我們可以選擇傳遞值,也可以不傳遞。

dataclass

但是,還有一種情形:我們可能不想在初始化時設(shè)定某個字段的值。這也是一種常見的使用場景。也許你在追蹤一個對象的狀態(tài),并且希望它在初始化時一直被設(shè)為 False。更一般地,這個值在初始化時不能夠被傳遞。
dataclass

那么,我們?nèi)绾螌崿F(xiàn)上述想法呢?以下是具體內(nèi)容:

dataclass

瞧??!我們現(xiàn)在對dataclasses的使用有了更大的靈活性。

總結(jié)

希望上兩篇博文能夠幫助你理解dataclass,希望你能盡快在項目中使用它們!

感謝你的閱讀。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容