圖源:Unsplash
撰文 | 張?zhí)炱?/p>
過去幾年,“人工智能學(xué)院”在中國(guó)高校中迅速鋪開,據(jù)不完全統(tǒng)計(jì),已經(jīng)有超50所高校開設(shè)了“人工智能學(xué)院”。在這一波浪潮中,北京大學(xué)深圳研究生院選擇了建立一所面向“科學(xué)智能”(AI for Science)的學(xué)院,把人工智能的重心放在基礎(chǔ)科學(xué)問題上。
傳統(tǒng)的AI教育更多是培養(yǎng)算法和工程人才,而 AI for Science 的目標(biāo),則是用AI去重塑和加速基礎(chǔ)科學(xué)的發(fā)現(xiàn)過程。正如AlphaFold對(duì)生物學(xué)產(chǎn)生的影響,這種模式試圖將AI從一個(gè)應(yīng)用工具,轉(zhuǎn)變?yōu)轵?qū)動(dòng)物理、化學(xué)、材料等基礎(chǔ)科學(xué)產(chǎn)生源頭創(chuàng)新的關(guān)鍵。
“我們認(rèn)為,未來從事數(shù)學(xué)、物理、化學(xué)、生物、材料等基礎(chǔ)研究的科學(xué)家,應(yīng)當(dāng)積極擁抱AI,適應(yīng)這種科研范式變革,否則他們的研究很可能就會(huì)落后”。北京大學(xué)深圳研究生院副院長(zhǎng)、科學(xué)智能學(xué)院執(zhí)行院長(zhǎng)田永鴻在與《知識(shí)分子》的對(duì)談中,這樣表達(dá)學(xué)院選擇AI for Science的考量。
知識(shí)分子:我們注意到現(xiàn)在很多高校都在成立人工智能學(xué)院,為什么北京大學(xué)深圳研究生院會(huì)選擇“科學(xué)智能”(AI for Science)這個(gè)方向?
田永鴻:之所以選擇AI for Science這個(gè)方向,主要有兩個(gè)層面的考量。
首先,我們看到一個(gè)清晰的趨勢(shì):人工智能正在深刻地改變科學(xué)研究的范式。一個(gè)非常典型的例子就是蛋白質(zhì)折疊預(yù)測(cè)。AlphaFold一出來,在一兩年之內(nèi),幾乎把全球所有的蛋白質(zhì)結(jié)構(gòu)都預(yù)測(cè)完了。這就是AI的魅力。它作為一個(gè)強(qiáng)大的工具,正在重塑科學(xué)研究的模式。
我們認(rèn)為,未來從事數(shù)學(xué)、物理、化學(xué)、生物、材料等基礎(chǔ)研究的科學(xué)家,應(yīng)當(dāng)積極擁抱AI,適應(yīng)這種科研范式變革,否則他們的研究很可能就會(huì)落后。
其次,這個(gè)選擇也與北京大學(xué)整體的發(fā)展布局相契合。北京大學(xué)深圳研究生院建院二十多年來,形成了學(xué)科交叉氛圍濃厚的學(xué)術(shù)環(huán)境。這為我們探索AI for Science的新模式提供了一塊創(chuàng)新的試驗(yàn)田。北大本部在數(shù)、理、化等基礎(chǔ)學(xué)科上力量非常雄厚,我們希望在深圳先探索經(jīng)驗(yàn),如果成功,未來可以將這些好的經(jīng)驗(yàn)和模式推廣到北大本部乃至全國(guó),起到一個(gè)探索的作用。
知識(shí)分子:在您看來,當(dāng)前制約“AI+Science”快速發(fā)展的最大瓶頸是什么?科學(xué)智能學(xué)院的成立,能在多大程度上改變這種局面?
田永鴻:核心要解決的,就是人才短板問題。
現(xiàn)在在很多傳統(tǒng)行業(yè),比如醫(yī)藥領(lǐng)域,大家都知道AI重要,但具體怎么做很少有人知道。舉個(gè)例子,我們對(duì)一些公司的調(diào)研時(shí)發(fā)現(xiàn),從他們的院長(zhǎng)到研究員,都意識(shí)到要用AI工具。但他們實(shí)際在用的,很多還是十年前的傳統(tǒng)統(tǒng)計(jì)學(xué)習(xí)方法。對(duì)于大模型等新技術(shù),他們一方面覺得很重要,另一方面又不知道該怎么用。
連領(lǐng)軍企業(yè)都面臨這種困惑,可想而知廣大企業(yè)有多么缺少既懂AI又懂基礎(chǔ)科學(xué)的復(fù)合型人才。我們希望通過建立這個(gè)學(xué)院,能夠大量培養(yǎng)這樣的人才,以解決現(xiàn)存的短板問題。
知識(shí)分子:過去很多“AI for Science”項(xiàng)目,往往是由具體的實(shí)驗(yàn)室或科研團(tuán)隊(duì)以跨學(xué)科合作的方式完成的。為什么現(xiàn)在需要將AI for Science系統(tǒng)化,專門建立一個(gè)學(xué)院來培養(yǎng)交叉人才呢?這種培養(yǎng)模式和傳統(tǒng)的跨學(xué)科合作有何不同?
田永鴻:坦白說,傳統(tǒng)的跨學(xué)科合作模式我們已經(jīng)走了很多年,但始終存在一些難以解決的痛點(diǎn)。
首先是合作問題。比如一個(gè)做生物的老師和一個(gè)做 AI 的老師要合作,對(duì)方可能自己的項(xiàng)目都忙不過來,未必有精力參與,這種情況大量存在。即便合作了,第二個(gè)難題是成果的知識(shí)產(chǎn)權(quán)歸屬。項(xiàng)目做完后,論文誰做第一作者,誰做通訊作者?直到今天,這依然是高校里難以解決的難題。
搞科學(xué)的人往往認(rèn)為,自己定義了科學(xué)問題、提供了數(shù)據(jù),理應(yīng)是主導(dǎo)。而做AI的人則認(rèn)為自己提供了關(guān)鍵的工具和方法,也應(yīng)獲得相應(yīng)的認(rèn)可,這個(gè)矛盾很難調(diào)和。
最關(guān)鍵的,對(duì)于參與合作的學(xué)生來說,完成的交叉學(xué)科學(xué)位論文,由哪個(gè)學(xué)科的學(xué)位委員會(huì)來評(píng)審和把關(guān)?傳統(tǒng)的學(xué)科體系是分離的,搞數(shù)學(xué)的、化學(xué)的、計(jì)算機(jī)的各有各的委員會(huì)和評(píng)價(jià)標(biāo)準(zhǔn)。一篇交叉學(xué)科的論文,兩邊的評(píng)委可能都看不懂,也找不到合適的評(píng)審人,導(dǎo)致學(xué)生的畢業(yè)和評(píng)價(jià)都面臨困難。
知識(shí)分子:科學(xué)智能學(xué)院的模式,與傳統(tǒng)跨學(xué)科合作相比,有什么不同?
田永鴻:我們推行雙導(dǎo)師制,兩位來自不同學(xué)科的老師從一開始就有共同的責(zé)任,他們的成果就是培養(yǎng)AI for Science的人才。這樣一來,合作的意愿問題自然就解決了。兩位導(dǎo)師共同指導(dǎo)一個(gè)學(xué)生,知識(shí)產(chǎn)權(quán)的問題也更容易通過協(xié)商解決,學(xué)生的歸屬是明確的,不必再去爭(zhēng)“一作”或“通訊作者”。
學(xué)院會(huì)設(shè)立專門的交叉學(xué)科學(xué)位評(píng)定分會(huì),來負(fù)責(zé)評(píng)審這類跨學(xué)科的論文。這樣從制度上改變了過去那種依賴個(gè)人自學(xué)或零散合作的模式,使得交叉人才的培養(yǎng)能夠系統(tǒng)化、制度化,從而真正推動(dòng)AI for Science的發(fā)展。
知識(shí)分子:您剛才提到了雙導(dǎo)師制,這個(gè)制度在實(shí)際運(yùn)作中是如何分工的?
田永鴻:雙導(dǎo)師制是我們針對(duì)當(dāng)前現(xiàn)實(shí)的一個(gè)核心設(shè)計(jì)。坦白說,現(xiàn)在全球范圍內(nèi)既懂AI又懂Science的科學(xué)家鳳毛麟角,我們很難找到足夠多的單一導(dǎo)師來培養(yǎng)這樣的學(xué)生。所以,我們采用兩位導(dǎo)師共同指導(dǎo)一個(gè)學(xué)生的模式。這兩位導(dǎo)師最好過去有合作基礎(chǔ),至少也要有強(qiáng)烈的合作意愿。
在指導(dǎo)過程中,他們的分工是明確的??茖W(xué)導(dǎo)師負(fù)責(zé)定方向,也就是判斷哪些科學(xué)問題是值得做的、是這個(gè)領(lǐng)域幾十年來沒解決的難題。AI導(dǎo)師則負(fù)責(zé)定技術(shù)路線,他要分析這個(gè)科學(xué)問題是否能用AI技術(shù)來加速或解決。
兩者結(jié)合,共同指導(dǎo)學(xué)生。也意味著學(xué)生匯報(bào)工作時(shí),兩位導(dǎo)師需要同時(shí)參加。這個(gè)制度增加了導(dǎo)師的時(shí)間成本,學(xué)生的學(xué)習(xí)時(shí)間和內(nèi)容也更多,但獨(dú)特的培養(yǎng)和研究經(jīng)歷也會(huì)帶來更優(yōu)秀的競(jìng)爭(zhēng)力。
知識(shí)分子:談到評(píng)價(jià),過去有一種說法,交叉學(xué)科在現(xiàn)有的科研評(píng)價(jià)體系里其實(shí)是比較吃虧的。作為一個(gè)新學(xué)院,科學(xué)智能學(xué)院會(huì)如何改革科研評(píng)價(jià)體系,避免被現(xiàn)有體系同化?
田永鴻:科研評(píng)價(jià)是指揮棒,如果指揮棒沒弄好,交叉學(xué)科一定做不好。我們當(dāng)然不可能憑學(xué)院之力徹底解決這個(gè)歷史問題,但我們正面臨一個(gè)很好的改革機(jī)遇?,F(xiàn)在全社會(huì)已經(jīng)認(rèn)識(shí)到,發(fā)展交叉學(xué)科是必須要做的事情,整個(gè)學(xué)術(shù)界對(duì)交叉學(xué)科的包容度也在提高。
在學(xué)院內(nèi)部,我們已經(jīng)有了一些初步的探索。首先,對(duì)于學(xué)生的評(píng)價(jià),北京大學(xué)專門設(shè)有一個(gè)交叉學(xué)位評(píng)定分會(huì),我們AI for Science的學(xué)生論文就歸這個(gè)分會(huì)來評(píng)審。這個(gè)分會(huì)是從交叉學(xué)科的視角來評(píng)價(jià)學(xué)生的學(xué)位論文。
其次,在教師的科研成果認(rèn)定上。學(xué)院會(huì)在自己的學(xué)科領(lǐng)域內(nèi),率先認(rèn)可共同第一作者、共同通訊作者具有同等貢獻(xiàn),在計(jì)算工作量、認(rèn)定成果時(shí)予以同等考量。我們認(rèn)為,在一項(xiàng)AI for Science的研究中,科學(xué)和AI兩個(gè)方面的貢獻(xiàn)是同等重要的。這個(gè)成果是雙方緊密合作才能做得又快又好,必須拋棄傳統(tǒng)的主次之分觀念。
當(dāng)然,我們一所學(xué)院的探索只是局部的。更大范圍的評(píng)價(jià)體系改革,還得靠國(guó)家來調(diào)整這個(gè)指揮棒。這會(huì)是一個(gè)長(zhǎng)期的過程,不可能一蹴而就,但我們希望通過這樣的探索,慢慢引導(dǎo)形成一種新的、認(rèn)可交叉融合的科研文化。
知識(shí)分子:在課程設(shè)置上,AI會(huì)與哪些學(xué)科交叉?
田永鴻:在課程設(shè)置方面,我們首批設(shè)立的交叉方向主要集中在AI與物理、化學(xué)、生命科學(xué)和材料科學(xué)的融合。當(dāng)然,這只是我們的起點(diǎn)。未來,AI的應(yīng)用會(huì)滲透到更多理工學(xué)科,如能源、環(huán)境等,甚至?xí)U(kuò)展到人文社科領(lǐng)域。
在我們當(dāng)前的培養(yǎng)體系中,課程設(shè)計(jì)概括為“一體六向”?!耙惑w”指的是所有學(xué)生都要修的公共基礎(chǔ)課程平臺(tái)。這個(gè)平臺(tái)包括三類課程:一是導(dǎo)論課,如《人工智能導(dǎo)論》和《科學(xué)智能導(dǎo)論》;二是計(jì)算與智能課,涵蓋機(jī)器學(xué)習(xí)、科學(xué)計(jì)算和編程;三是交叉基礎(chǔ)課,如《科學(xué)第一性原理》和科學(xué)實(shí)驗(yàn)方法。
在完成這個(gè)“一體”的學(xué)習(xí)后,學(xué)生再根據(jù)自己的興趣和方向,進(jìn)入不同的專業(yè)選修課模塊,也就是所謂的“六向”。例如,選擇AI for Life Science方向的學(xué)生,會(huì)選修計(jì)算生物學(xué)、蛋白質(zhì)組學(xué)、AI藥物設(shè)計(jì)等課程;而AI for Materials方向的學(xué)生,則會(huì)學(xué)習(xí)計(jì)算材料學(xué)、材料模擬等專業(yè)課程。
知識(shí)分子:在具體的平臺(tái)建設(shè)上,學(xué)院如何規(guī)劃“AI for Science”的落地?
田永鴻:AI for Science 的研究與教學(xué),與傳統(tǒng) AI 有很大不同。傳統(tǒng) AI 培養(yǎng)中,一個(gè)學(xué)生可能有算力平臺(tái)支撐就夠了。但我們不僅需要算力和數(shù)據(jù),更關(guān)鍵的是要有一個(gè)“干濕閉環(huán)”的實(shí)驗(yàn)平臺(tái)。這里的“干實(shí)驗(yàn)”指 AI 模型的設(shè)計(jì)與計(jì)算,“濕實(shí)驗(yàn)”則是真實(shí)的物理、化學(xué)、生物實(shí)驗(yàn)。我們希望將兩者緊密結(jié)合,讓學(xué)生在校期間就能在這樣的平臺(tái)上訓(xùn)練,掌握新的科研模式。
舉例來說,假設(shè)要設(shè)計(jì)一種新藥分子,首先會(huì)在計(jì)算機(jī)上用 AI 大模型生成候選分子序列,篩選出最有希望的幾個(gè),并自動(dòng)生成實(shí)驗(yàn)方案,由自動(dòng)化實(shí)驗(yàn)機(jī)器人執(zhí)行合成與驗(yàn)證。自動(dòng)化設(shè)備不僅提高效率,也降低了 AI 背景學(xué)生操作復(fù)雜實(shí)驗(yàn)的門檻。實(shí)驗(yàn)完成后,數(shù)據(jù)會(huì)自動(dòng)回傳、可視化分析,并反饋給模型,形成高效的自動(dòng)化迭代閉環(huán)。這樣的設(shè)施與環(huán)境,是傳統(tǒng) AI 或傳統(tǒng)實(shí)驗(yàn)室所不具備的。
知識(shí)分子:在數(shù)據(jù)資源和算力共享方面,學(xué)院會(huì)如何推動(dòng)“AI for Science”的基礎(chǔ)設(shè)施建設(shè)?
田永鴻:在建設(shè)這樣的平臺(tái)過程中,我們的目標(biāo)不僅是提供 AI for Science 的科研基礎(chǔ)架構(gòu),更重要的是推動(dòng)科學(xué)數(shù)據(jù)的共享。長(zhǎng)期以來,許多科學(xué)家習(xí)慣將自己的數(shù)據(jù)牢牢掌握在手中,結(jié)果就形成了成千上萬個(gè)零散孤立的“數(shù)據(jù)孤島”。
但在未來的大科學(xué)研究中,只有把分散的數(shù)據(jù)匯聚起來,才能取得真正突破。那些率先收集、整理并共享大科學(xué)數(shù)據(jù)的團(tuán)隊(duì),將更有機(jī)會(huì)產(chǎn)出重大成果;而堅(jiān)持“數(shù)據(jù)私有化”的模式,則會(huì)大大放慢研究進(jìn)展,甚至難以取得實(shí)質(zhì)性成果。這一趨勢(shì)也會(huì)推動(dòng)科學(xué)界的數(shù)據(jù)共享模式發(fā)生根本變化。
我認(rèn)為這是一個(gè)重大的機(jī)遇。鋪設(shè)這樣的新型設(shè)施,就像建設(shè)高鐵或發(fā)展電動(dòng)汽車一樣,是具有長(zhǎng)遠(yuǎn)價(jià)值的基礎(chǔ)性工作,對(duì)國(guó)家科技發(fā)展意義重大。
知識(shí)分子:學(xué)院地處粵港澳大灣區(qū),這里有非?;钴S的創(chuàng)新文化和企業(yè)集群。學(xué)院會(huì)如何與產(chǎn)業(yè)界合作?
田永鴻:我們正在和多家企業(yè)探討合作,合作形式可以很多樣,比如共建實(shí)驗(yàn)平臺(tái),或者采用企業(yè)出題的方式,由企業(yè)提供真實(shí)的產(chǎn)業(yè)疑難,作為我們學(xué)生的實(shí)訓(xùn)課題。而我們的角色,就是把企業(yè)帶來的這些實(shí)際問題進(jìn)行提煉和升華,剝離掉具體的工程細(xì)節(jié),找出其中最本質(zhì)的科學(xué)或技術(shù)挑戰(zhàn),讓我們的師生來攻克。
知識(shí)分子:現(xiàn)在很多人在討論,AI有沒有可能自主發(fā)現(xiàn)一些新的科學(xué)定律,而不只是在現(xiàn)有框架內(nèi)做一些高效的預(yù)測(cè)和計(jì)算?您對(duì)此有什么看法?
田永鴻:這可以說是AI for Science研究的終極目標(biāo)之一。隨著技術(shù)的發(fā)展,這種可能性是一定會(huì)有的。在當(dāng)前階段,AI的主要作用還是加速科學(xué)發(fā)現(xiàn)。
它體現(xiàn)在“干實(shí)驗(yàn)”環(huán)節(jié),我們用大模型高效探索合成路徑;也體現(xiàn)在“濕實(shí)驗(yàn)”環(huán)節(jié),我們用自動(dòng)化機(jī)器人并行做實(shí)驗(yàn),效率遠(yuǎn)超人工。過去做碳納米管材料,一天可能才能做一組數(shù)據(jù),現(xiàn)在,機(jī)器人一晚上就能得到十組,而且數(shù)據(jù)重復(fù)性非常高。這種速度本身就對(duì)科研推動(dòng)巨大。
實(shí)際上,AI自主發(fā)現(xiàn)的苗頭已經(jīng)出現(xiàn)。我們下一步就是要讓AI模型通過學(xué)習(xí)海量的科學(xué)數(shù)據(jù),進(jìn)一步具備提出科學(xué)假設(shè),甚至對(duì)某些科學(xué)問題進(jìn)行自主探索的能力。我相信這一天的到來不會(huì)太久。當(dāng)然,要解決像哥德巴赫猜想那樣更深層次、更難的問題,還需要很長(zhǎng)的時(shí)間。
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析
- 賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析丨賽道Hyper | 通義千問萬億模型的戰(zhàn)略突圍解析