4 月底,由華東師范大學(xué)慕課中心、商湯科技、上海知名高中優(yōu)秀教師共同編著的全球第一本人工智能教材 “《人工智能基礎(chǔ)(高中版)》” 正式發(fā)布。本文是這部教材的親歷者,編委會執(zhí)行主編、商湯科技聯(lián)合創(chuàng)始人、香港中文大學(xué) - 商湯科技聯(lián)合實(shí)驗(yàn)室主任林達(dá)華教授講述的編著歷程。
商湯科技聯(lián)合創(chuàng)始人
香港中文大學(xué) - 商湯科技聯(lián)合實(shí)驗(yàn)室主任
林達(dá)華教授
2018 年 4 月 28 日,華東師范大學(xué)逸夫樓。
禮堂里座?虛席,?家翹首以待。隨著舞臺上的 “書” 被翻開,全球首部專為中學(xué)教學(xué)編寫的?工智能教科書終于面世了。對于參與編寫的每?個(gè)?來說,這是?個(gè)值得向至親分享的時(shí)刻。
這部教科書的影響與意義也許需要更長的時(shí)間才能看清楚。但是,?群年輕?在?起去完成?件前?沒有做過的事情,這樣的經(jīng)歷肯定是值得銘記的。本文記述了這段充滿挑戰(zhàn)的歷程,以及教材編寫中的?次關(guān)鍵選擇。
“這是一個(gè)開創(chuàng)歷史的機(jī)會”
2017 年 9 月,在?次研究會議后,我收到海龍(尚海龍,商湯科技香港公司總經(jīng)理兼教育事業(yè)部總經(jīng)理)的電話,他提到商務(wù)印書館希望和商湯科技合作編寫?部中學(xué)版?工智能教材。不久后,湯老師(湯曉鷗,商湯科技創(chuàng)始人,香港中文大學(xué)信息工程系教授)也找到我商量編寫教材的事情。這讓我感到非常意外,也非常糾結(jié)。??面,教科書的編寫對我??是?項(xiàng)全新的?作,我沒有任何經(jīng)驗(yàn);另??面,實(shí)驗(yàn)室的各項(xiàng)研究正在進(jìn)?關(guān)鍵階段,哪有余?開展這樣?個(gè)?項(xiàng)目呢??墒?,湯老師的?句話給了我很?的影響:
“人工智能進(jìn)中學(xué)教材,這是歷史上第?次。
這是?個(gè)開創(chuàng)歷史的機(jī)會。”
確實(shí),這樣的機(jī)會是難以抗拒的。?番天人交戰(zhàn)后,躍躍欲試的雄?戰(zhàn)勝了對困難的顧慮,我接下了這個(gè)任務(wù)。
艱難的開始
2017 年 10 月 10 日,第?次教材工作會議在上海舉?。商務(wù)印書館,華東師范大學(xué)慕課中?,以及商湯科技的同事在華東師?商討教材的編寫計(jì)劃。主持會議的是華東師范大學(xué)慕課中心主任陳玉琨教授。陳教授已經(jīng)在基礎(chǔ)教育耕耘數(shù)十載,桃李滿天下,在教育界威望極?。我剛到會議室,陳教授主動起來到門口歡迎,這份尊重和禮遇讓我頗為感動。
可是,接下來的會議并不順利。
在會前,我準(zhǔn)備了?份關(guān)于教材的大綱——那基本是?學(xué)機(jī)器學(xué)習(xí)教材的簡化版。這份以知識為導(dǎo)向的大綱列出了我認(rèn)為需要講授的基礎(chǔ)知識,包括分類,回歸,無監(jiān)督學(xué)習(xí),和增強(qiáng)學(xué)習(xí)等?向。
這份大綱在會上受到了上海的中學(xué)老師們禮貌卻又強(qiáng)烈的批評。?家認(rèn)為,這些知識點(diǎn)過于艱深,根據(jù)這樣的大綱編寫的教材是無法在中學(xué)課堂講授的。有部分老師提出,教材可以以科普為主,主要介紹基本概念和展示應(yīng)用,不涉及背后的數(shù)學(xué)和算法。對于這種方式,我不能認(rèn)同——這和參觀展覽館有什么區(qū)別呢。
這次會議上的爭論讓我認(rèn)識到人工智能研究和基礎(chǔ)教育之間橫亙著?道鴻溝。要把人工智能的知識和理念傳遞給中學(xué)的同學(xué)們,需要在鴻溝上架設(shè)?座橋梁。這是?個(gè)巨大的挑戰(zhàn),也是我們工作的意義所在。
會議開了整整?天,從早上 9 點(diǎn)到下午 5 點(diǎn)。經(jīng)過反復(fù)深?的溝通,雙方在教材設(shè)計(jì)原則上達(dá)成了基本共識:
中學(xué)人工智能教學(xué)的目的不是把所有同學(xué)培養(yǎng)成人工智能專家,而是傳遞人工智能的基本思想和理念,培養(yǎng)動手能力和創(chuàng)造力,使得同學(xué)們在以后進(jìn)入各行各業(yè)能自覺運(yùn)用人工智能解決問題。
興趣與知識并重。通過生活中的應(yīng)用發(fā)展同學(xué)們對人工智能的興趣,并由此引入適合中學(xué)生接受的基礎(chǔ)知識和基本算法。
以實(shí)踐為導(dǎo)向。在每個(gè)章節(jié),以具體的應(yīng)用為主線,把相關(guān)知識貫穿起來。為教材提供配套的實(shí)驗(yàn)平臺和任務(wù)包。
這次會議的另?個(gè)重要成果是把團(tuán)隊(duì)建立起來,并確立了在編寫過程中的合作方式。具體來說,就是商湯科技和香港中文大學(xué)的團(tuán)隊(duì)負(fù)責(zé)教材專業(yè)內(nèi)容的設(shè)計(jì)和撰寫,由上海六所重點(diǎn)中學(xué)老師組成的團(tuán)隊(duì)負(fù)責(zé)從教學(xué)的角度提出反饋并對教學(xué)語?的運(yùn)用提供指導(dǎo)意見。最后雙方合作統(tǒng)稿。
從 0 到 1
從上海回來后,我開始擬定教材的大綱。大綱的設(shè)計(jì)思路源于海龍?zhí)岢龅陌藗€(gè)字:“耳聰目明,心靈手巧”。最初的大綱把教材分為七個(gè)章節(jié):
一. 總論:人工智能概述
二. 經(jīng)典圖像分類(目明)
三. 深度學(xué)習(xí)(目明)
四. 音樂風(fēng)格分類(耳聰)
五. 相冊聚類
六. 自然語?理解(心靈)
七. 生成模型(手巧)
從機(jī)器學(xué)習(xí)的角度,這個(gè)大綱涵蓋了三種重要的學(xué)習(xí)方式:監(jiān)督學(xué)習(xí)(第二 - 四章),非監(jiān)督學(xué)習(xí)(第五 - 六章),和生成模型(第七章)。
在實(shí)驗(yàn)室其他教授的支持下,我在實(shí)驗(yàn)室內(nèi)部組建了編寫團(tuán)隊(duì)。第?章總論由我撰寫,其余六章各由?位實(shí)驗(yàn)室的同學(xué)負(fù)責(zé)。他們根據(jù)我發(fā)出的每章細(xì)則來進(jìn)行具體的內(nèi)容編寫。湯老師指出,這部教材的編寫是開創(chuàng)歷史的工作。因此,我們在教材編寫之初就訂立了?條鐵律:
堅(jiān)持原創(chuàng)。
每?段話都必須自?撰寫,
每?幅教學(xué)示意圖都必須自?設(shè)計(jì)。
從 2017 年 10 月中開始,同學(xué)們就開始了各自的編寫工作,在這個(gè)過程中,我們和上海的老師們保持了密切的溝通。2018 年 1 月 15 日,教材的初稿完成。
波瀾再起
2018 年 1 月 20 號,由商湯團(tuán)隊(duì)和上海老師參與的全體會議再次舉行,集體對初稿進(jìn)行審議。
初稿的完成使大家備受鼓舞??墒?,隨著會議的進(jìn)?,我們發(fā)現(xiàn)有點(diǎn)高興得太早了。在這次會議上,波瀾再起。雙?爭論的焦點(diǎn)落在了第?章(經(jīng)典圖像分類)和第三章(深度學(xué)習(xí))。這兩章是全書的知識基礎(chǔ),它們的成敗決定了全書的成敗。雖然負(fù)責(zé)這兩章的編委付出了很大的努力以盡可能通俗的方式講授,可是效果還是不能令人滿意。
什么是數(shù)據(jù)?什么是特征?
什么是權(quán)重?什么是卷積?
參與審稿的老師們在會議上直?指出,初稿中對這些最基礎(chǔ)的概念沒有講清楚。編委們在日常的研究工作中對這些非?;镜拿~可以說是習(xí)以為常,可是真要向零基礎(chǔ)的同學(xué)講清楚它們的涵義卻并不容易。兩個(gè)多月辛苦得到的是尖銳的批評。今天回想起來,我依舊能感受到編委同學(xué)在當(dāng)時(shí)的苦悶和委屈。可是,?部高質(zhì)量的教科書,不經(jīng)錘煉又如何能出來呢。
在會議上,老師們還指出,第?章?下子引入了太多基礎(chǔ)概念,擔(dān)心同學(xué)們難以接受,希望把眾多概念在全書中循序漸進(jìn)地展開,讓學(xué)習(xí)曲線變得平緩?點(diǎn)。要實(shí)現(xiàn)這?點(diǎn)意味著第?章和第三章整個(gè)需要推倒重來,重新設(shè)計(jì)。
會議結(jié)束后,我讓相關(guān)的編委組成攻關(guān)小組重新設(shè)計(jì)編寫這兩個(gè)基礎(chǔ)章節(jié),并且把我的?個(gè)博士后研究員王若暉調(diào)進(jìn)來支援這項(xiàng)任務(wù)。在新的設(shè)計(jì)中,我們調(diào)整了章節(jié)內(nèi)容:在第?章只講模式識別的?門知識和基本的分類器,使用的應(yīng)用例子改用可以直觀說明的簡單屬性特征,并把圖像處理的知識移到第三章,從而降低了第?章的概念密集度。在第三章中把圖像濾波的知識和卷積特征提取進(jìn)行有機(jī)融合,使得對卷積的介紹獲得更具體的應(yīng)用背景支撐。此外,大家還?起對所有的基本概念以及它們的銜接關(guān)系進(jìn)行梳理,并且在教材中加入大量具體的例子和圖表,讓讀者可以更形象地理解它們。這些工作取得了明顯的成效,后來參與審稿的同事和老師都表示新修訂的章節(jié)更容易讀懂了。
第三章的修訂過程中,編委們對于如何處理生物神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)的關(guān)系也進(jìn)行了深入討論。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)大學(xué)教材往往是從生物神經(jīng)網(wǎng)絡(luò)說起,然后引入人工神經(jīng)網(wǎng)絡(luò)。我們認(rèn)為這種講授方式很容易讓讀者產(chǎn)生 “仿生學(xué)” 的聯(lián)想,這顯然是不科學(xué)的,也不符合現(xiàn)代主流的設(shè)計(jì)和研究思路。討論后,我們決定依照當(dāng)代研究領(lǐng)域的主流觀點(diǎn),主要從特征學(xué)習(xí)的角度講述卷積神經(jīng)網(wǎng)絡(luò)的意義,淡化它和生物神經(jīng)網(wǎng)絡(luò)的聯(lián)系,以避免讀者形成不恰當(dāng)?shù)睦斫狻?/p>
爭分奪秒,二度大改
二月初,對初稿的修訂完成后,我把第?稿發(fā)給湯老師重新審閱。湯老師看過后,認(rèn)為仍然有很大的改進(jìn)空間,并提出了三個(gè)重要的意見:
這?稿在圖文并茂上仍然不足,需要提高插圖的數(shù)量和質(zhì)量。
加入視頻理解和 AlphaGo 相關(guān)的章節(jié),這代表人工智能發(fā)展的新高度。
科普部分需要加強(qiáng),不僅要講好基礎(chǔ)知識,對于人工智能的最新發(fā)展也要進(jìn)行概要性的介紹,培養(yǎng)同學(xué)們對人工智能更大的興趣。
實(shí)施這些意見對于提高整個(gè)教材的水平是十分有幫助的??墒?,這時(shí)候離原定四月份的發(fā)布時(shí)間只剩下兩個(gè)月了,還來得及嗎?為了做出決定,我給喬宇,海龍與戴娟等幾位兄弟實(shí)驗(yàn)室和相關(guān)部分的負(fù)責(zé)同事都打了電話,尋求他們的意見,得到了堅(jiān)決的支持。我們決定,拿出商湯使命必達(dá)的決心,把我們的教材打造成?部精品。于是,公司和各聯(lián)合實(shí)驗(yàn)室更廣泛地動員起來:各聯(lián)合實(shí)驗(yàn)室再調(diào)集五位博士加入編委團(tuán)隊(duì),商湯設(shè)計(jì)部調(diào)來了三位設(shè)計(jì)師加班加點(diǎn)為教材制作插圖,研發(fā),工程,和商務(wù)團(tuán)隊(duì)的多位同事參與審閱和提出修訂意見。參與教材相關(guān)工作的同事和同學(xué)迅速增加到接近三十?。
2018 年 2 月 25 號,全體會議又?次在上海舉行。除了原編委團(tuán)隊(duì)外,多位新加入的商湯同事以及華東師大出版社的同仁也出席了會議。會議進(jìn)行了?天,逐個(gè)章節(jié)進(jìn)行審議。這次會議進(jìn)展比較順利,第三稿終于得到了老師們和出版社的認(rèn)可。會議決定,抓緊時(shí)間根據(jù)會上提出的具體建議進(jìn)行最后修訂,在 3 月 5 日定稿交付出版。
付梓前后
雖然 2-25 會議決定基于第三稿進(jìn)行最后定稿,但是編委們都明白,這只是確定了結(jié)構(gòu)和內(nèi)容,但是這?稿在圖文細(xì)節(jié)上還存在很多問題。行百里者半九十,我們必須在細(xì)節(jié)上精益求精,才能打造出?部讓我們引以為豪的教科書。
從 2 月 26 號到 3 月 5 號的八天時(shí)間里,整個(gè)編委團(tuán)隊(duì)處于沖刺狀態(tài),為教材的定稿日夜不息地進(jìn)行最后的努?。每?個(gè)章節(jié)都會有三位編委進(jìn)行交叉檢驗(yàn),再交到我手上審閱。我們仔細(xì)檢查了每個(gè)知識點(diǎn),每個(gè)公式,每個(gè)圖表,對不滿意的表述反復(fù)討論修改,對不滿意的圖表重新進(jìn)行制作。
3 月 6 日凌晨 3 點(diǎn),我們把第四稿作為定稿發(fā)給了出版社。
定稿交付后,我對比了第三稿和第四稿,雖然內(nèi)容結(jié)構(gòu)沒有重大變化,但是很多段落都經(jīng)過了重寫,?部分圖表都被重新繪制,整部教材再?次脫胎換骨。定稿交付了,可是編委們似乎并沒有特別?興。大家覺得這個(gè)交付的稿子是有遺憾的——很多地方其實(shí)可以做得更好,但是來不及在截止日期前完成了。
我們不甘心留下遺憾。
在和出版社的交流中,我們發(fā)現(xiàn)還有?次修訂的機(jī)會。按照?般的出版流程,出版社在排版完成后,會把排好版的書稿發(fā)給我們,并給我們?nèi)鞎r(shí)間校驗(yàn),在書稿上標(biāo)示出需要修正的地方。于是,定稿交付后,我們繼續(xù)進(jìn)行未竟的修訂工作,并把后補(bǔ)的修訂?處處記錄下來。最后修訂完成時(shí),我們在第四稿上又進(jìn)行了?千多處局部修改。
3 月下旬,出版社給我們發(fā)來了排好版的書稿,我們在三天內(nèi)把這?千多處修改逐?標(biāo)示在書稿上。收到我們的反饋后,出版社震驚了。他們說,排版要重做了……
發(fā)布
2018 年 4 月 25 日,在商湯人工智能峰會上,同事曉菊把?本出版社印好的教材交給我。我翻著書,眼前浮現(xiàn)的都是這大半年來艱辛的編寫歷程,書中的內(nèi)容卻沒有仔細(xì)看進(jìn)去了。海龍說,這是 “十月懷胎,?朝分娩” 的感覺。
4 月 28 日,華東師范大學(xué)逸夫樓,在多位領(lǐng)導(dǎo),上百位重點(diǎn)中學(xué)校長,以及各方媒體的共同見證下,全球首部中學(xué)版人工智能教材發(fā)布。
全書共有九章:
第一章.?人工智能:新時(shí)代的開啟
第二章. 牛刀小試:察異辨花
第三章. 別具慧眼:識圖認(rèn)物
第四章. 耳聽八方:析音賞樂
第五章. 冰雪聰明:看懂視頻
第六章. 無師自通:分門別類
第七章. 識文斷字:理解文本
第八章. 神來之筆:創(chuàng)作圖畫
第九章. 運(yùn)籌帷幄:圍棋高手