beplay2網頁登錄
beplay2網頁登錄
西湖大學首屆本科生張樂程論文登陸AI頂會
2023-12-12 16:39:00
beplay2網頁登錄浙江站

beplay2網頁登錄浙江站訊 (記者 陳顯婷)12月10日,為期一周的2023年的NeurIPS大會在美國新奧爾良Ernest N. Morial會議中心舉行。

  NeurIPS,全稱為Neural Information Processing Systems,即神經信息處理係統大會,聚焦於深度學習、計算機視覺、大規模機器學習、學習理論等方麵,是人工智能領域的頂級學術會議之一,在全球包括Nature、Science在內的所有科技文獻中排名第9。

  今年舉行的第37屆會議,共收到了12343 篇有效論文投稿,最終26.1%的文章被錄用;西湖大學有9篇論文中選,分別來自工學院人工智能方向的李子青實驗室、王東林實驗室、張嶽實驗室。

  這本是學術界的常態,但其中一篇題為“理解和克服深度模型在分子屬性預測任務上的局限性”的論文,卻引起了關注。因為共同一作中,出現了一個叫“張樂程”的名字——他是西湖首屆本科生,來自α書院。按投稿時間(今年春天)計算,他參與這項科研和寫論文的時候還在讀大一。

  大一學生發AI頂會,怎麼做到的?

△ 張樂程

  張樂程研究了什麼?

  當前,AI已經成為輔助新藥發現的重要手段,尤其在藥物分子的屬性預測中(如毒性、溶解度等),起到了至關重要的作用。但在實際研發和生產中卻發現,高級的深度神經網絡AI模型反而不如傳統模型有效,這很反常。這篇論文的研究就專注於此。

  曆時三個多月,他們搜集數據、寫代碼、設計了一係列實驗,終於找到了症結所在:因為分子具有“活性懸崖”的效應,即分子結構上細微的變化會導致很大的屬性差異,而先進的深度模型對這種細微的結構變化不敏感。由此,他們提出一種基於分子數據特征編碼的方式來解決該問題。

  相對於張樂程的論文而言,更有趣的是他本人。

  張樂程成長在一個雙教師家庭,數學和物理一直是他所長。初中畢業保送蕭山中學後,他提前半年去高中學習,在那裏接觸到了編程、算法及其他計算機科學方麵的知識,並加入了學校的信息學競賽隊伍,不停地刷題、自學、搜看各種專業博客、電子書,沉浸在這個全新的世界裏。

  進入西湖大學後,張樂程早早瞄準了“人工智能”方向。按照西湖的培養模式,所有本科生前兩年不分專業,但學校會給每一位學生配備一名博導作為學術導師,帶領他們“入門”。導師和學生有“雙向選擇”的權利。作為浙江省信息學競賽一等獎獲得者,張樂程毫不猶豫地選擇了西湖人工智能分支的“頂配”——講席教授李子青。

  李子青曾任微軟亞洲研究院Research Lead,是中國科學院自動化所模式識別國家重點實驗室資深研究員。

  張樂程毛遂自薦,給李子青寫了一封自薦信,最終順利入駐實驗室,在一眾博士師兄師姐們的座位當中有了“一席之地”。

  後麵的故事,看起來似乎水到渠成。有導師,有實驗室,就不缺上手的機會。張樂程用了大半年的時間,一邊學習機器學習的基礎理論,一邊參加小項目,提高深度學習的實踐能力。有一天,博士生師兄夏俊和他說,要不要一起來做個項目?他欣然加入。

  初出茅廬即首戰告捷,而且是西湖首屆本科生中第一個發表論文的。當記者問到張樂程有什麼心得可以分享?他認真思考了一會兒說:“要學會積極地去溝通,而不是等著別人上門來找你。西湖大學是一座‘富礦’,能不能用好,就看你會不會主動去搜尋和獲取。”

  同樣的故事,在夏俊這裏卻有不一樣的解讀。

  夏俊是李子青實驗室博士四年級的學生,也是這篇頂會的共同一作,研究方向是“機器學習方法和其在生物醫藥領域的應用”。

  在一眾AI分支的學生中,夏俊也算是個小小的“傳奇”。他先後拿到了國家獎學金、西湖大學校長獎章、蘇武獎學金等榮譽,還手握多篇被AI不同頂會收錄的論文。

  回到2022年8月11日,夏俊收到導師李子青轉發張樂程寫給他的郵件,“李老師說已經決定接收他了,讓我教他一些入門的基礎知識。”

  第二天,兩人就在本科生書院見麵了。之後的日子,就是老手帶新手,這對“搭子”差不多每周要溝通一次,有線上也有線下。夏俊住C11號樓,張樂程住C13號樓,多數時候兩人喜歡在C13的α書院見麵,有大電子屏,方便他們寫寫畫畫。夏俊還會給張樂程帶一些專業的書,讓他邊看邊提問,也會給他布置一些小項目練練手。實驗室每周一次的組會,隻要張樂程沒有課,都會來參加,不管能聽懂多少。

△ 本科生α書院

  當李子青確定啟動研究AI智藥那個令人費解的問題時,夏俊決定推薦實驗室裏最年輕的麵孔作為自己的合作者,李子青也毫無意外地給予支持。

  “從經驗來講,樂程肯定不如實驗室裏其他人,寫代碼的規範性要差一點,畢竟訓練少,之前有很多東西還是靠自學‘野蠻生長’。”但夏俊發現,張樂程經常會提出一些奇奇怪怪的問題。“他在思考,他有自己的想法。”有些問題甚至讓夏俊都感到汗顏,“為什麼我沒想到呢?”

  而提問,正是西湖最看重的“科研潛質”之一。

  “這個課題在別人眼裏也許就是一個必須完成的作業,但在張樂程眼裏不是,他會鑽進去,認真琢磨一些事。”李子青相信,這位初生“牛犢”,一定會交出亮眼的成績。

  李子青人生中改過的論文無數。他曾任AI頂刊IEEE T-PAMI等刊物副主編,擔任過100餘個國際學術會議大會主席、程序主席或程序委員,迄今他自己發表的論文就超過500篇。

  在學院裏,他對文章以及文字的“挑剔”眾所周知。可對大一學生張樂程發AI頂會這件事,他用了“少見”兩個字來評價。

  “這是一個很優秀的學生”,李子青對張樂程寫給他的那封自薦信印象深刻:“我是高中信息競賽的選手,在高中階段打了100,000+行的代碼,最後獲得了NOIP省一和NOI冬令營全國銀牌成績。”“我基本掌握算法導論、組合數學、離散數學,也涉獵了斯坦福大學的具體數學,也對人工智能有些許了解。”“至於數學,我涉獵了高等數學、線性代數、概率論和數理統計、數學分析……”

  雖然李子青從未帶過本科一年級的學生,但數學好、編程好,是他對學生的基本要求,況且,這孩子才高中畢業,那一刻他覺得自己發現了一塊璞玉。

  李子青深知學校“200博導對應60學生”的投入和對這批年輕學生的期望。“我所做的隻不過是發掘學生的特點和潛力,鼓勵他們盡早積極參與前沿科研,並創造條件讓他們快速成長、成才。”李子青說。

  所以,張樂程的頂會論文對李子青而言,既是意外之喜,又是期待的達成。“真為他高興。”

  在這樣的規劃下,才大二的張樂程已經忙到飛起:他要去上海參加資助AI領域優秀本科生的獎學金的麵試選拔;他去南京和合肥參加美國計算機協會發起組織的國際大學生程序設計競賽(ICPC)亞洲區域賽;他還要準備托福考試,因為按照西湖的規定,下一個學年他們將出國交換學習, 張樂程希望能去在計算機領域排行“數一數二”的加州大學伯克利分校,見識一下業界最厲害的“大牛”……

  當然,少年人愛玩的天性不變。即使在這麼忙的情況下,張樂程依然記掛著他的另一重身份:視頻博主“孫1超”。在夏俊眼裏,張樂程是個典型的競賽生,在數學、計算和編程方麵有天賦,但不擅長表達。為此,夏俊曾特意讓張樂程和一群高年級的訪問學生、碩士生一起看論文、說論文,鍛煉他的口頭表達能力。

  豈料,“躲”在視頻背後的“孫1超”卻玩得“遊刃有餘”:西湖大學本科生的錄取通知書長什麼樣?想看看本科生的寢室嗎?西湖大學超市裏600ml的可樂隻要2塊9,是真的嗎……一個個話題時不時掀起一陣小高潮。

△ 張樂程的個人主頁

  下一個話題是什麼?說不好。因為對年輕人的想象,永遠不能停留在今天。

(責任編輯 吳文建 趙洪河)

免責聲明:

① 凡本站注明“稿件來源:beplay2網頁登錄”的所有文字、圖片和音視頻稿件,版權均屬本網所有,任何媒體、網站或個人未經本網協議授權不得轉載、鏈接、轉貼或以其他方式複製發表。已經本站協議授權的媒體、網站,在下載使用時必須注明“稿件來源:beplay2網頁登錄”,違者本站將依法追究責任。

② 本站注明稿件來源為其他媒體的文/圖等稿件均為轉載稿,本站轉載出於非商業性的教育和科研之目的,並不意味著讚同其觀點或證實其內容的真實性。如轉載稿涉及版權等問題,請作者在兩周內速來電或來函聯係。

相關新聞
SRC-1076488726 2023-11-09 15:41