各位老師上午好,我是金智教育的李齊光,主要負責主數據產品的設計與規(guī)劃,本次就這兩天出現的信息標準,數據集成等高頻率字眼來跟大家做一個深度分享。
優(yōu)化高校數據集成勢在必行
隨著信息化不斷推進,高校對于數據的深層次需求越發(fā)強烈,越來越多的應用場景對數據的訴求也越來越高。比如人事專業(yè)技術職務申報離不開科研項目,這些場景都離不開數據共享,離不開數據集成。
高校對數據的依賴性正在加強,數據越發(fā)凸顯,數據是高校由經驗型決策轉向數據型決策的驅動力。我們不僅要滿足當前的各個需求場景,還要把數據作為資源長久持續(xù)地保留下來,這也離不開數據集成。
但高校數據現狀卻不容樂觀,近十年的數據集成仍遺留大量問題亟待解決,這些問題涉及以下部分:信息標準建設、數據集成與共享、數據存儲、數據質量、長效運營等。
優(yōu)化高校數據集成勢在必行,我的觀點是:高校數據集成正在由事后集成逐步向事先設計的趨勢發(fā)展。

我們先來看看 信息標準如何建設:
信息標準建設四部曲

1、信息標準初始建設
首先,依托教育部標準,以學校人財物建設“人優(yōu)先,財和物偏后”為指導思想,構建信息標準。建設過程中以服務內容為落腳點,明確各部門間數據提供和數據使用的供需關系。

其次,做好萬全材料收集準備,包括:基礎代碼標準、數據模式標準、數據流向標準,高校數據應用表格、本科教學基本狀況數據,高校整體基礎數據采集結構等。

再次,明確數據設計規(guī)范,包括:每個表命名方式、唯一關鍵字,每次同步記錄操作的人員信息等。

另外,還需做好業(yè)務模型、主數據模型、代碼標準規(guī)范等內容。



最后,有個小建議:以上信息標準建設工作交給1個基礎較好的廠商完成,學校在此基礎上不斷優(yōu)化落地。

2、校內信息需求調研
調研過程中不斷灌輸“統一數據校級資產意識”,信息中心需要不斷引導業(yè)務部門對數據的正確認識:數據是學校公共資源,而并非部門私有財產,這樣良性的數據共享意識將是數據完成有效交換和集成的關鍵。
盤點好業(yè)務系統現狀以及內外部數據關系,這部分工作以業(yè)務部門梳理為主,信息中心配合。過程中一定要把握好調研的“度”:避免不調研或全面調研兩種極端方式。


3、校內核心校標落地:影響全局的標準先落地(組織機構、職工號、學號等),其它隨信息化建設逐步完善,避免求大、求全。核心標準制定后,必須召集相關執(zhí)行人員交流,確保落地。
4、做好日常管控:有了初始標準和核心校標,日常管控也很重要。在新業(yè)務系統建設、現有業(yè)務系統集成過程中,對運行過程中的偏差都需要管控??刂苾热荩?b>代碼標準+數據模式標準+數據流向標準。數據質量是設計出來的,不是集成出來的。
標準不是靜態(tài)的,日常管控確保信息標準可落地與動態(tài)迭代。
多方攜手,系統集成不再是老大難
1、數據集成方案
系統集成必須圍繞信息需求制定數據集成方案,并需結合信息標準數據流向規(guī)劃以及業(yè)務系統建設使用情況來確定集成邊界。需要繼承方、信息中心、業(yè)務部門,第三方公司通力配合完成。
內容邊界一般涉及四個方面:需要的代碼標準,需要的業(yè)務數據,提供的代碼標準,提供的業(yè)務數據。
除了集成內容邊界,還要考慮數據集成的技術方式,一般有三種典型集成方式:ETL數據共享,數據庫共享和API共享,三者是互補關系。

另外,也要考慮同步頻率,實時同步,1小時/1天同步一次,根據業(yè)務需求確定,夠用即可。
2、元數據注冊
元數據是理解數據的前提,是推動學校持續(xù)數據治理優(yōu)化的基礎,元數據注冊范圍盡可能是業(yè)務系統完整元數據,以及涉及到共享和需要的數據及代碼表的元數據。
3、代碼標準檢查
代碼標準檢查依托于上面的元數據,也是數據集成前代碼統一的有效檢查技術手段,我們可以獲取多種代碼差異,在方案評審中進行評審。
4、方案評審
評審內容:集成方案評審(主數據模式差異)、代碼標準評審(代碼標準差異)。評審處理原則:a)優(yōu)先遵循教育部標準;b)優(yōu)先遵循數據源頭標準;c)需要信息中心、業(yè)務部門、公司共同討論。
5、標準迭代
方案評審后會帶來一系列的迭代工作,公司和信息中心層面需要完成學校代碼標準迭代、學校數據模式迭代以及監(jiān)督業(yè)務系統迭代情況,業(yè)務部門和第三方需要完成業(yè)務系統代碼標準調整以及涉及到數據內容的清洗。
6、數據集成
以公司為主,業(yè)務系統提供方強力配合。注意典型數據清洗轉換:


7、運行監(jiān)控
運行監(jiān)控對平臺中不規(guī)范的接口、代碼標準不一致情況、數據質量等問題進行監(jiān)控,監(jiān)控對數據治理是非常有幫助的。

一般常見的數據質量檢測規(guī)則如下:

事先接口涉及調用是大趨勢
這些年集成的本質都是事后集成,重的是技術通道,但是沒有重視內容建設。
在“大平臺、小應用”的開放生態(tài)模式,平臺需要采用一體化的集成策略,內置標準或者數據模式和數據操作接口,把行業(yè)積累轉化為一個個領域模型,并以API方式對外提供,實現傳統緊耦合、封閉式架構到分布式、開放架構的轉變,實現從“數據集成”向“服務集成”的轉變,滿足學校業(yè)務開發(fā)快速響應的需求。
這種模式下數據訪問更及時,數據消費更真實,建設模式更開放,可以讓更多人參與到信息化建設過程當中。

最后想對各位始終堅持在一線的信息化從業(yè)人員致敬,高校信息標準的落地還需要靠大家共同努力。我的報告分享到這邊,謝謝大家~~