基于大數(shù)據(jù)的全行業(yè)盈利能力量化分析

1.目的

男怕入錯(cuò)行,女怕嫁錯(cuò)郎!
當(dāng)今社會(huì)上有哪些行業(yè)?各個(gè)行業(yè)的現(xiàn)狀如何?究竟什么樣的行業(yè)是好行業(yè)了?什么樣的行業(yè)是落后行業(yè)?
懷著以上的問題,我在網(wǎng)上搜了一圈,沒有找到十分滿意的答案。
“那就自己來吧”,小紅母雞說。
“好的,不做伸手黨,我自己來吧”,我自己說。

圖片發(fā)自簡(jiǎn)書App

2.思路

總體思路是,能夠持續(xù)5年獲得高利潤(rùn)率的行業(yè),就是好行業(yè)。 具體的思路是:

  1. 按某一個(gè)行業(yè)分類方法,得到該行業(yè)所有的上市公司的、最近5年的利潤(rùn)率,
  2. 計(jì)算每個(gè)行業(yè)利潤(rùn)率的中位數(shù),來代表該行業(yè)的利潤(rùn)率情況
  3. 按照中位數(shù)對(duì)行業(yè)進(jìn)行排序,最高的前10名,為好行業(yè)。最后的10名,為落后行業(yè)。
  4. 對(duì)數(shù)據(jù)可視化
  5. 對(duì)圖表進(jìn)行初步分析
  6. 初步結(jié)論

3.工具

  1. 使用聚寬量化交易平臺(tái)來獲取所有A股上市公司近5年的財(cái)報(bào)數(shù)據(jù)
  2. 使用Python語言進(jìn)行分析(多虧幾個(gè)月自學(xué)了點(diǎn)三腳貓python, 可以實(shí)現(xiàn)簡(jiǎn)單的想法)

4.數(shù)據(jù)獲取與處理(可跳過不用看)

  1. 確定行業(yè)的分類方法 目前行業(yè)的劃分方法有很多。官方的有國(guó)家標(biāo)準(zhǔn)《國(guó)民經(jīng)濟(jì)行業(yè)分類與代碼(GB/T 4754-20117)》。許多證券公司也有自己的劃分。本研究采用常用的申銀萬國(guó)行業(yè)分類標(biāo)準(zhǔn)。申萬分類分為一級(jí)、二級(jí)、三級(jí)三種,我們采用中間申萬二級(jí)行業(yè)分類。在聚寬平臺(tái)上,可以使用get_industries(name="sw_l2"),輕松地獲得申萬二級(jí)的110個(gè)行業(yè)代碼。

  2. 獲取行業(yè)的股票代碼 在聚寬平臺(tái)上,可以使用get_industry_stocks(industry_code, date=None), 獲得每個(gè)行業(yè)的所有股票代碼。

  3. 獲取股票財(cái)務(wù)數(shù)據(jù) 我們使用get_fundamentals(query_object, date=None, statDate=None),獲取股票的財(cái)務(wù)數(shù)據(jù)。query_object是一個(gè)sqlalchemy.orm.query.Query對(duì)象,我們?cè)谄渲锌梢暂p松指定想要獲取的所有股票2005年以后的財(cái)務(wù)數(shù)據(jù)。在這里我們主要取indicator表中的net_profit_margin凈利潤(rùn)率作為我們的分析對(duì)象。

  4. 數(shù)據(jù)處理 拿到數(shù)據(jù)后,我們按前面思路的順序,計(jì)算行業(yè)利潤(rùn)率中位數(shù),然后排序。獲得前10名的好行業(yè)和后10名的落后行業(yè)。然后制作Boxplot圖表以方便進(jìn)行分析。


    取數(shù)據(jù)的核心代碼,供參考。我是剛?cè)腴T小白,歡迎大神指正

5 數(shù)據(jù)分析 (數(shù)據(jù)來源:所有A股股票2013~2017年財(cái)報(bào))

  1. 所有A股行業(yè)的利潤(rùn)率情況


    全行業(yè)利潤(rùn)率分布
  2. 前10名的優(yōu)秀行業(yè)利潤(rùn)率情況


    前10名行業(yè)利潤(rùn)率分布
前10名行業(yè)利潤(rùn)率中值
  1. 后10名的落后行業(yè)利潤(rùn)率情況


    后10名行業(yè)利潤(rùn)率分布
后10名行業(yè)利潤(rùn)率中值

6 結(jié)論

  1. 男怕入錯(cuò)行,女怕嫁錯(cuò)郎是一句真理。行業(yè)盈利能力之間的差異是巨大的。
  2. 360行,行行出狀元也是真理。在各行業(yè),即使是落后的行業(yè),也有盈利能力相對(duì)較好的公司。只是好公司多少的差異較大。努力很重要,有選擇的努力或許更重要。
  3. 行業(yè)是變遷的、有周期性的。根據(jù)歷史數(shù)據(jù)得出來的結(jié)論,只說明過去,不能說明未來。我所在的船舶與海洋工程行業(yè),2008年前后多么輝煌,現(xiàn)在淪落為倒數(shù)幾名。
  4. 用python對(duì)大數(shù)據(jù)進(jìn)行分析,相對(duì)于傳統(tǒng)的Excel手工分析來說,就是收割機(jī)之于鐮刀。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容