轉(zhuǎn) | 港中文林達(dá)華教授:邁出第一步,《人工智能基礎(chǔ)(高中版)》是怎樣煉成的

4 月底,由華東師范大學(xué)慕課中心、商湯科技、上海知名高中優(yōu)秀教師共同編著的全球第一本人工智能教材 “《人工智能基礎(chǔ)(高中版)》” 正式發(fā)布。本文是這部教材的親歷者,編委會執(zhí)行主編、商湯科技聯(lián)合創(chuàng)始人、香港中文大學(xué) - 商湯科技聯(lián)合實(shí)驗(yàn)室主任林達(dá)華教授講述的編著歷程。

商湯科技聯(lián)合創(chuàng)始人

香港中文大學(xué) - 商湯科技聯(lián)合實(shí)驗(yàn)室主任

林達(dá)華教授

2018 年 4 月 28 日,華東師范大學(xué)逸夫樓。

禮堂里座?虛席,?家翹首以待。隨著舞臺上的 “書” 被翻開,全球首部專為中學(xué)教學(xué)編寫的?工智能教科書終于面世了。對于參與編寫的每?個(gè)?來說,這是?個(gè)值得向至親分享的時(shí)刻。

這部教科書的影響與意義也許需要更長的時(shí)間才能看清楚。但是,?群年輕?在?起去完成?件前?沒有做過的事情,這樣的經(jīng)歷肯定是值得銘記的。本文記述了這段充滿挑戰(zhàn)的歷程,以及教材編寫中的?次關(guān)鍵選擇。


“這是一個(gè)開創(chuàng)歷史的機(jī)會”


2017 年 9 月,在?次研究會議后,我收到海龍(尚海龍,商湯科技香港公司總經(jīng)理兼教育事業(yè)部總經(jīng)理)的電話,他提到商務(wù)印書館希望和商湯科技合作編寫?部中學(xué)版?工智能教材。不久后,湯老師(湯曉鷗,商湯科技創(chuàng)始人,香港中文大學(xué)信息工程系教授)也找到我商量編寫教材的事情。這讓我感到非常意外,也非常糾結(jié)。??面,教科書的編寫對我??是?項(xiàng)全新的?作,我沒有任何經(jīng)驗(yàn);另??面,實(shí)驗(yàn)室的各項(xiàng)研究正在進(jìn)?關(guān)鍵階段,哪有余?開展這樣?個(gè)?項(xiàng)目呢??墒?,湯老師的?句話給了我很?的影響:

“人工智能進(jìn)中學(xué)教材,這是歷史上第?次。

這是?個(gè)開創(chuàng)歷史的機(jī)會。”

確實(shí),這樣的機(jī)會是難以抗拒的。?番天人交戰(zhàn)后,躍躍欲試的雄?戰(zhàn)勝了對困難的顧慮,我接下了這個(gè)任務(wù)。

艱難的開始

2017 年 10 月 10 日,第?次教材工作會議在上海舉?。商務(wù)印書館,華東師范大學(xué)慕課中?,以及商湯科技的同事在華東師?商討教材的編寫計(jì)劃。主持會議的是華東師范大學(xué)慕課中心主任陳玉琨教授。陳教授已經(jīng)在基礎(chǔ)教育耕耘數(shù)十載,桃李滿天下,在教育界威望極?。我剛到會議室,陳教授主動起來到門口歡迎,這份尊重和禮遇讓我頗為感動。

可是,接下來的會議并不順利。

在會前,我準(zhǔn)備了?份關(guān)于教材的大綱——那基本是?學(xué)機(jī)器學(xué)習(xí)教材的簡化版。這份以知識為導(dǎo)向的大綱列出了我認(rèn)為需要講授的基礎(chǔ)知識,包括分類,回歸,無監(jiān)督學(xué)習(xí),和增強(qiáng)學(xué)習(xí)等?向。

這份大綱在會上受到了上海的中學(xué)老師們禮貌卻又強(qiáng)烈的批評。?家認(rèn)為,這些知識點(diǎn)過于艱深,根據(jù)這樣的大綱編寫的教材是無法在中學(xué)課堂講授的。有部分老師提出,教材可以以科普為主,主要介紹基本概念和展示應(yīng)用,不涉及背后的數(shù)學(xué)和算法。對于這種方式,我不能認(rèn)同——這和參觀展覽館有什么區(qū)別呢。

這次會議上的爭論讓我認(rèn)識到人工智能研究和基礎(chǔ)教育之間橫亙著?道鴻溝。要把人工智能的知識和理念傳遞給中學(xué)的同學(xué)們,需要在鴻溝上架設(shè)?座橋梁。這是?個(gè)巨大的挑戰(zhàn),也是我們工作的意義所在。

會議開了整整?天,從早上 9 點(diǎn)到下午 5 點(diǎn)。經(jīng)過反復(fù)深?的溝通,雙方在教材設(shè)計(jì)原則上達(dá)成了基本共識:

中學(xué)人工智能教學(xué)的目的不是把所有同學(xué)培養(yǎng)成人工智能專家,而是傳遞人工智能的基本思想和理念,培養(yǎng)動手能力和創(chuàng)造力,使得同學(xué)們在以后進(jìn)入各行各業(yè)能自覺運(yùn)用人工智能解決問題。

興趣與知識并重。通過生活中的應(yīng)用發(fā)展同學(xué)們對人工智能的興趣,并由此引入適合中學(xué)生接受的基礎(chǔ)知識和基本算法。

以實(shí)踐為導(dǎo)向。在每個(gè)章節(jié),以具體的應(yīng)用為主線,把相關(guān)知識貫穿起來。為教材提供配套的實(shí)驗(yàn)平臺和任務(wù)包。

這次會議的另?個(gè)重要成果是把團(tuán)隊(duì)建立起來,并確立了在編寫過程中的合作方式。具體來說,就是商湯科技和香港中文大學(xué)的團(tuán)隊(duì)負(fù)責(zé)教材專業(yè)內(nèi)容的設(shè)計(jì)和撰寫,由上海六所重點(diǎn)中學(xué)老師組成的團(tuán)隊(duì)負(fù)責(zé)從教學(xué)的角度提出反饋并對教學(xué)語?的運(yùn)用提供指導(dǎo)意見。最后雙方合作統(tǒng)稿。


從 0 到 1

從上海回來后,我開始擬定教材的大綱。大綱的設(shè)計(jì)思路源于海龍?zhí)岢龅陌藗€(gè)字:“耳聰目明,心靈手巧”。最初的大綱把教材分為七個(gè)章節(jié):

一. 總論:人工智能概述

二. 經(jīng)典圖像分類(目明)

三. 深度學(xué)習(xí)(目明)

四. 音樂風(fēng)格分類(耳聰)

五. 相冊聚類

六. 自然語?理解(心靈)

七. 生成模型(手巧)

從機(jī)器學(xué)習(xí)的角度,這個(gè)大綱涵蓋了三種重要的學(xué)習(xí)方式:監(jiān)督學(xué)習(xí)(第二 - 四章),非監(jiān)督學(xué)習(xí)(第五 - 六章),和生成模型(第七章)。

在實(shí)驗(yàn)室其他教授的支持下,我在實(shí)驗(yàn)室內(nèi)部組建了編寫團(tuán)隊(duì)。第?章總論由我撰寫,其余六章各由?位實(shí)驗(yàn)室的同學(xué)負(fù)責(zé)。他們根據(jù)我發(fā)出的每章細(xì)則來進(jìn)行具體的內(nèi)容編寫。湯老師指出,這部教材的編寫是開創(chuàng)歷史的工作。因此,我們在教材編寫之初就訂立了?條鐵律:

堅(jiān)持原創(chuàng)。

每?段話都必須自?撰寫,

每?幅教學(xué)示意圖都必須自?設(shè)計(jì)。

從 2017 年 10 月中開始,同學(xué)們就開始了各自的編寫工作,在這個(gè)過程中,我們和上海的老師們保持了密切的溝通。2018 年 1 月 15 日,教材的初稿完成。

波瀾再起

2018 年 1 月 20 號,由商湯團(tuán)隊(duì)和上海老師參與的全體會議再次舉行,集體對初稿進(jìn)行審議。

初稿的完成使大家備受鼓舞??墒?,隨著會議的進(jìn)?,我們發(fā)現(xiàn)有點(diǎn)高興得太早了。在這次會議上,波瀾再起。雙?爭論的焦點(diǎn)落在了第?章(經(jīng)典圖像分類)和第三章(深度學(xué)習(xí))。這兩章是全書的知識基礎(chǔ),它們的成敗決定了全書的成敗。雖然負(fù)責(zé)這兩章的編委付出了很大的努力以盡可能通俗的方式講授,可是效果還是不能令人滿意。


什么是數(shù)據(jù)?什么是特征?

什么是權(quán)重?什么是卷積?


參與審稿的老師們在會議上直?指出,初稿中對這些最基礎(chǔ)的概念沒有講清楚。編委們在日常的研究工作中對這些非?;镜拿~可以說是習(xí)以為常,可是真要向零基礎(chǔ)的同學(xué)講清楚它們的涵義卻并不容易。兩個(gè)多月辛苦得到的是尖銳的批評。今天回想起來,我依舊能感受到編委同學(xué)在當(dāng)時(shí)的苦悶和委屈。可是,?部高質(zhì)量的教科書,不經(jīng)錘煉又如何能出來呢。

在會議上,老師們還指出,第?章?下子引入了太多基礎(chǔ)概念,擔(dān)心同學(xué)們難以接受,希望把眾多概念在全書中循序漸進(jìn)地展開,讓學(xué)習(xí)曲線變得平緩?點(diǎn)。要實(shí)現(xiàn)這?點(diǎn)意味著第?章和第三章整個(gè)需要推倒重來,重新設(shè)計(jì)。

會議結(jié)束后,我讓相關(guān)的編委組成攻關(guān)小組重新設(shè)計(jì)編寫這兩個(gè)基礎(chǔ)章節(jié),并且把我的?個(gè)博士后研究員王若暉調(diào)進(jìn)來支援這項(xiàng)任務(wù)。在新的設(shè)計(jì)中,我們調(diào)整了章節(jié)內(nèi)容:在第?章只講模式識別的?門知識和基本的分類器,使用的應(yīng)用例子改用可以直觀說明的簡單屬性特征,并把圖像處理的知識移到第三章,從而降低了第?章的概念密集度。在第三章中把圖像濾波的知識和卷積特征提取進(jìn)行有機(jī)融合,使得對卷積的介紹獲得更具體的應(yīng)用背景支撐。此外,大家還?起對所有的基本概念以及它們的銜接關(guān)系進(jìn)行梳理,并且在教材中加入大量具體的例子和圖表,讓讀者可以更形象地理解它們。這些工作取得了明顯的成效,后來參與審稿的同事和老師都表示新修訂的章節(jié)更容易讀懂了。

第三章的修訂過程中,編委們對于如何處理生物神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)的關(guān)系也進(jìn)行了深入討論。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)大學(xué)教材往往是從生物神經(jīng)網(wǎng)絡(luò)說起,然后引入人工神經(jīng)網(wǎng)絡(luò)。我們認(rèn)為這種講授方式很容易讓讀者產(chǎn)生 “仿生學(xué)” 的聯(lián)想,這顯然是不科學(xué)的,也不符合現(xiàn)代主流的設(shè)計(jì)和研究思路。討論后,我們決定依照當(dāng)代研究領(lǐng)域的主流觀點(diǎn),主要從特征學(xué)習(xí)的角度講述卷積神經(jīng)網(wǎng)絡(luò)的意義,淡化它和生物神經(jīng)網(wǎng)絡(luò)的聯(lián)系,以避免讀者形成不恰當(dāng)?shù)睦斫狻?/p>


爭分奪秒,二度大改

二月初,對初稿的修訂完成后,我把第?稿發(fā)給湯老師重新審閱。湯老師看過后,認(rèn)為仍然有很大的改進(jìn)空間,并提出了三個(gè)重要的意見:

這?稿在圖文并茂上仍然不足,需要提高插圖的數(shù)量和質(zhì)量。

加入視頻理解和 AlphaGo 相關(guān)的章節(jié),這代表人工智能發(fā)展的新高度。

科普部分需要加強(qiáng),不僅要講好基礎(chǔ)知識,對于人工智能的最新發(fā)展也要進(jìn)行概要性的介紹,培養(yǎng)同學(xué)們對人工智能更大的興趣。

實(shí)施這些意見對于提高整個(gè)教材的水平是十分有幫助的??墒?,這時(shí)候離原定四月份的發(fā)布時(shí)間只剩下兩個(gè)月了,還來得及嗎?為了做出決定,我給喬宇,海龍與戴娟等幾位兄弟實(shí)驗(yàn)室和相關(guān)部分的負(fù)責(zé)同事都打了電話,尋求他們的意見,得到了堅(jiān)決的支持。我們決定,拿出商湯使命必達(dá)的決心,把我們的教材打造成?部精品。于是,公司和各聯(lián)合實(shí)驗(yàn)室更廣泛地動員起來:各聯(lián)合實(shí)驗(yàn)室再調(diào)集五位博士加入編委團(tuán)隊(duì),商湯設(shè)計(jì)部調(diào)來了三位設(shè)計(jì)師加班加點(diǎn)為教材制作插圖,研發(fā),工程,和商務(wù)團(tuán)隊(duì)的多位同事參與審閱和提出修訂意見。參與教材相關(guān)工作的同事和同學(xué)迅速增加到接近三十?。

2018 年 2 月 25 號,全體會議又?次在上海舉行。除了原編委團(tuán)隊(duì)外,多位新加入的商湯同事以及華東師大出版社的同仁也出席了會議。會議進(jìn)行了?天,逐個(gè)章節(jié)進(jìn)行審議。這次會議進(jìn)展比較順利,第三稿終于得到了老師們和出版社的認(rèn)可。會議決定,抓緊時(shí)間根據(jù)會上提出的具體建議進(jìn)行最后修訂,在 3 月 5 日定稿交付出版。


付梓前后

雖然 2-25 會議決定基于第三稿進(jìn)行最后定稿,但是編委們都明白,這只是確定了結(jié)構(gòu)和內(nèi)容,但是這?稿在圖文細(xì)節(jié)上還存在很多問題。行百里者半九十,我們必須在細(xì)節(jié)上精益求精,才能打造出?部讓我們引以為豪的教科書。

從 2 月 26 號到 3 月 5 號的八天時(shí)間里,整個(gè)編委團(tuán)隊(duì)處于沖刺狀態(tài),為教材的定稿日夜不息地進(jìn)行最后的努?。每?個(gè)章節(jié)都會有三位編委進(jìn)行交叉檢驗(yàn),再交到我手上審閱。我們仔細(xì)檢查了每個(gè)知識點(diǎn),每個(gè)公式,每個(gè)圖表,對不滿意的表述反復(fù)討論修改,對不滿意的圖表重新進(jìn)行制作。

3 月 6 日凌晨 3 點(diǎn),我們把第四稿作為定稿發(fā)給了出版社。

定稿交付后,我對比了第三稿和第四稿,雖然內(nèi)容結(jié)構(gòu)沒有重大變化,但是很多段落都經(jīng)過了重寫,?部分圖表都被重新繪制,整部教材再?次脫胎換骨。定稿交付了,可是編委們似乎并沒有特別?興。大家覺得這個(gè)交付的稿子是有遺憾的——很多地方其實(shí)可以做得更好,但是來不及在截止日期前完成了。

我們不甘心留下遺憾。

在和出版社的交流中,我們發(fā)現(xiàn)還有?次修訂的機(jī)會。按照?般的出版流程,出版社在排版完成后,會把排好版的書稿發(fā)給我們,并給我們?nèi)鞎r(shí)間校驗(yàn),在書稿上標(biāo)示出需要修正的地方。于是,定稿交付后,我們繼續(xù)進(jìn)行未竟的修訂工作,并把后補(bǔ)的修訂?處處記錄下來。最后修訂完成時(shí),我們在第四稿上又進(jìn)行了?千多處局部修改。

3 月下旬,出版社給我們發(fā)來了排好版的書稿,我們在三天內(nèi)把這?千多處修改逐?標(biāo)示在書稿上。收到我們的反饋后,出版社震驚了。他們說,排版要重做了……


發(fā)布

2018 年 4 月 25 日,在商湯人工智能峰會上,同事曉菊把?本出版社印好的教材交給我。我翻著書,眼前浮現(xiàn)的都是這大半年來艱辛的編寫歷程,書中的內(nèi)容卻沒有仔細(xì)看進(jìn)去了。海龍說,這是 “十月懷胎,?朝分娩” 的感覺。

4 月 28 日,華東師范大學(xué)逸夫樓,在多位領(lǐng)導(dǎo),上百位重點(diǎn)中學(xué)校長,以及各方媒體的共同見證下,全球首部中學(xué)版人工智能教材發(fā)布。

全書共有九章:

第一章.?人工智能:新時(shí)代的開啟

第二章. 牛刀小試:察異辨花

第三章. 別具慧眼:識圖認(rèn)物

第四章. 耳聽八方:析音賞樂

第五章. 冰雪聰明:看懂視頻

第六章. 無師自通:分門別類

第七章. 識文斷字:理解文本

第八章. 神來之筆:創(chuàng)作圖畫

第九章. 運(yùn)籌帷幄:圍棋高手

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 2月5日精進(jìn),今日體驗(yàn):今天在家買東西布置房間,聯(lián)系婚慶彩排了一下,看著不忙,一天下來也忙的夠嗆,但是很開心!
    京心達(dá)田佳閱讀 168評論 0 0
  • 此刻,我和自己臨在 就在剛剛,我感覺到心痛 我和爸爸,二哥都在杭州,我感覺有快一個(gè)月沒和他們聯(lián)系了,而且,我們住的...
    微笑的牙齒閱讀 270評論 0 4
  • [日記洋洋] 一 騎滑板車,我騎不快,不騎了。 今天印象最深的莫過于洋洋騎滑板車上路 洋洋回上海見到了心心念念的滑...
    Sophie2liu閱讀 292評論 0 0
  • 上世紀(jì)五十年代的冬季,天蒙蒙亮,她亭亭地站在不遠(yuǎn)處的霜地里,笑得像一株帶雪綻放的玉蘭花。他輕快地迎上去,接過她手里...
    小沃姑娘閱讀 979評論 6 4

友情鏈接更多精彩內(nèi)容