首都科學講堂第678期《應用數學:數學到底有什么用?》

信息來源:北京科學中心      發布時間:2021-01-17

  2021年1月16日,首都科學講堂線上開講,本次首都科學講堂邀請了北京大學北京國際數學研究中心副教授董彬,為大家帶來題為《應用數學:數學到底有什么用?》的精彩講座。

  

  應用數學 :數學到底有什么用?

  我們為什么要學數學?學好數學又有什么用?其實,“宇宙之大,粒子之微,火箭之速,化工之巧,地球之變,生物之謎,日用之繁,無處不用數學。”同時,數學也是重大技術創新發展的基礎。數學實力往往影響著國家實力,幾乎所有的重大發現都與數學的發展與進步息息相關。那么,應用數學是什么?數學和應用數學以及人工智能的關系又是什么?

  第一講 什么是應用數學 

  我們都知道數學,我們都聽說過華羅庚、陳景潤這樣的數學大師,那么,應用數學到底是什么?這里,我引用一下世界知名的應用數學家和力學家林家翹先生的定義。林先生是美國科學院院士,為建設祖國的應用數學,2002年回到中國,在清華大學成立了周培源應用數學中心。

  林家翹先生對應用數學的詮釋是:應用數學注重主動提出研究對象中的科學問題,通過問題的解決加深對研究對象的認識,或創造出新的知識。應用數學的意義在于揭示自然界和社會實際問題的規律。

  應用數學它是不同于純數學的一門獨立的基礎學科,應用數學的核心是,用數學方法來解決實際科學問題,但是純數學的核心是邏輯構架。簡單來說,純數學是數學的核心,它負責完成整個邏輯構架的完善,那么應用數學處于邊緣,負責的是整個學科的擴充。在過去的幾百年里面,應用數學和純數學之間相輔相成,互相配合,使數學不斷地往前推進和發展。

  現代意義上的應用數學源于二戰。美國在1942年啟動的“曼哈頓計劃”,很多著名科學家都在里面作出了卓越的貢獻,尤其孕育了一批應用數學家,其中就有數學界的鬼才——馮·諾依曼。他做出了核武器的數值模擬,并且提出了蒙特卡羅方法,這個方法在科學計算和人工智能等諸多領域中被廣泛使用。他還發展了微分方程數值解,造就了應用數學中非常大的一個學科——計算數學。

  此外,馮·諾依曼還被后人稱為“現代計算機之父” 及“博弈論之父”。他提出了現代計算機的邏輯結構,在橋接數學、物理、信息,以及國防的研究中,作出了非常重要的貢獻。

  在過去,二戰時期一直到上世紀90年代左右,應用數學的主體是基于物理的,因為當時很多重要的實際問題都是從物理中來。從上世紀90年代開始,逐漸地出現了基于數據的應用數學,其中一個重要的例子是圖像處理。在圖像處理領域,應用數學發揮了巨大的作用,一方面推動了圖像處理的發展;另一方面,也了解決圖像處理中的各種問題,產生了大量的新的數學工具。另一個值得一提的是壓縮感知(2005-2015年),它是信息領域的一場革命,其理論基礎就是應用數學中的“稀疏逼近”。

  2010年到2020年這十年是深度學習和人工智能應用發展的“黃金十年”,然而其面對的最大問題之一是缺乏理論基礎,其中數學將會起到至關重要的作用,而人工智能的理論基礎也將會是應用數學未來發展的一個重要方向。人工智能的數學基礎到底是什么?如何用數學來推動人工智能的發展?在理解、推動人工智能發展的同時,到底能凝練出什么樣新鮮的數學問題,把它再帶回到數學領域?這些還都是非常前沿的科學研究,是科學家們還在孜孜不倦研究的課題。

  第二講 圖像與數學

  圖像是人類探索自然非常重要的一類工具,進入21世紀之后,圖像更是無處不在。科學研究中,使用顯微鏡可以讓我們觀察物質和生命體的微觀結構;借助望遠鏡,可以讓幫助我們揭開浩瀚宇宙的奧秘;通過衛星遙感,可以讓我們方便快捷的觀測到地面的情況、對未來天氣變化進行預測。在平時生活中,手機拍照非常的方便,拍后可以用各種各樣的圖像處理軟件處理照片。自動駕駛領域中,可以通過相機來實時判斷路面狀況;視頻監控時,也可以根據視頻拍攝的圖片,做人臉識別等大數據分析。在電腦特效和動畫領域,也需要大量的圖像處理、渲染及數值仿真模擬,產生各種各樣非常逼真的影像。這些內容的實現,全都離不開數學。

  這里我們介紹下醫院中最常用也是最重要的醫學影像之一,CT成像。CT的全稱叫Computed tomography,中文翻譯為斷層掃描技術。其實也解釋了CT成像的基本原理:一片一片掃描人體,每次掃描后把得到的數據記錄下來。

  現代CT設備的成像質量非常高,CT呈現的是一個三維的圖像,我們也可以觀察其XY、YZ和XZ三個不同截面上的二維圖像,從這里面可以清晰地看到人體軟組織結構及骨骼上的任何病變。那么,數學在這里面起到了什么樣的作用?我們是如何通過數學獲得這種高質量圖像的?

  背后一個最重要的數學工具叫Radon變換(拉東變換),以澳大利亞數學家Radon的名字來命名。想了解Radon變換的話,需要具備微積分的相關知識。簡單地說,如果有一個兩元的函數就是我們想要重建的圖像,雖然CT設備沒法直接采集到的每個像素點,但可以采集這個函數在平面上所有直線上的積分。所謂的積分就是:一條直線穿越了函數,直線上面就得到一條相應的曲線,把這個曲線下面的面積求出來,這個結果就是函數沿著這條直線上面的積分。如果把所有的積分數值收集起來,大家所看到的就是CT設備采集到的數據。我們希望通過采集的,把我們想要的CT圖像重建出來。

  通過Radon變換來描述CT成像是第一個數學問題,就是機器是怎么采集數據的。第二個數學問題就是,我們得到這個數據之后,怎么轉換成醫生想要的CT圖像。這個對應的數學基礎就是如何求解大規模的線性方程組。在這里面作出重要貢獻的是波蘭數學家Kaczmarz,他在1937年描述了怎么用一種迭代方法來求解大規模的線性方程組。采用這種算法,就可以重建出醫生想要看到的CT圖像。基于Kaczmarz這個迭代算法,曾獲得諾貝爾醫學獎的科學家Cormack,設計出了一個高效的迭代算法,叫做代數重建算法,從而實現了從采集到的數據,反演得到醫生想要看到的CT圖像的過程。

  CT圖像重建至今仍然是一個非常前沿的研究課題,我本人也在CT成像中做了很多工作。我們在不斷追求的目標是把X光對人體的傷害降到最低,同時把CT成像的質量提到最高。

  下一個例子就是電腦特效與動畫。如果我們想要讓計算機產生一個特效動畫,需要什么樣的數學工具呢?

  首先,我們要思考一個虛擬的物體或者人,如何在電腦中表達,這就涉及到第一個問題,就是幾何體的數學表達。

  粗略來講有兩種不同的表達方式,第一種叫三角剖分曲面。一個三角剖分曲面是由眾多三角形組成,每一個三角形都是由頂點、邊和面組成,這是一個非常精巧的數學結構。用三角剖分可以構建非常復雜的曲面結構,同時也可以在這個曲面上做非常復雜的計算,比如算這個曲面的局部曲率、曲面的表面面積,以及在曲面上求解方程。

  另外一種表達叫隱式表達,最有代表性的例子是水平集函數表達。我們想象有一個二元函數,這個函數在x、y和z平面呈現的形態像一個山包,所謂的水平集,就是這個函數值z等于一個固定數值的所有點x,y組成的集合。可以想象你用一個水平的平面去切這個函數,交點組成的集合就是一個水平集。通常我們考慮0水平集,即所有函數值為0的點組成的集合。

  有了水平集的表達之后,就可以很方便地去做一些復雜的動畫模擬。比如做一個水珠分裂成兩個水珠的動畫,可以把水珠對應的水平集函數逐漸向下拉,展現的動畫形態就是從一個連通的區域(一個水珠)慢慢地斷裂,變成兩個區域,即實現了一顆水珠分裂成兩顆水珠的動畫。

  如果想生成非常復雜的動畫或電腦特效,得讓幾何體能夠動起來。用數學方法,嚴格來講叫數值計算,不但能讓幾何體動起來,而且還能動得非常逼真。比如,電影《終結者》里面的液態機器人,慢慢地被液化;電影《加勒比海盜》中世界盡頭的大漩渦,這里面牽涉到的都是對液體的模擬。對液體的模擬,需要用剛才所提到的水平集函數,求解一個非常復雜的微分方程。當然,其他動畫效果也大多基于物理規律來求解微分方程,從而做出非常逼真的模擬。

  上面提到的這些工作都是一個非常著名的應用數學家、計算機科學家Ronald Fedkiw做出來的,他是斯坦福大學的教授,同時也是我的師兄。我們的博士導師都是加州大學洛杉磯分校(UCLA)著名應用數學家、美國科學院和工程院院士Stanley Osher。因為Fedkiw在流體模擬特效領域作出了卓越的貢獻,他獲得了2008年奧斯卡技術成就獎。

  所以,有時候我跟學生們半開玩笑地講,做數學的也是有可能獲得奧斯卡的。據我師兄Ronald Fedkiw回憶,得獎的時候他非常激動,除了獲得榮譽,還因為頒獎人是他心中的女神Jessica Alba,這兩個原因都讓他對那一刻終生難忘。

  第三講 人工智能與數學

  人工智能的大概發展歷程是什么?背后到底跟數學有什么樣的關系?接下來我將詳細介紹一下。

  《列子·湯問》曾記載過,3000年前的周穆王時代,已有能工巧匠造出了能歌善舞,活靈活現的“人造人”。更厲害的是,穆王甚至看不出這個“人造人”和真人的區別。這個故事其實也暗含了圖靈測試的思想。所謂的圖靈測試是,一個人和機器分別被安置在兩個密封房間,外面另一個人和他們進行交流,但看不到房間內是人還是機器,如果外面的人無法分辨哪一個房間里是人哪一個是機器,那么說明這個機器已經達到了一定的“人工智能”的水平。

  在第一臺計算機出現之后,現代意義上的人工智能才成為了可能。第一臺電子計算機誕生在1941年,由德國工程師康拉德·楚澤制造。楚澤畢業之后一直在德國的一家飛機制造廠,主要工作就是計算各種各樣飛機機翼的受力,這是一個非常復雜的計算過程。而在那個時候,他所能夠使用的工具僅僅只是簡單的計算尺。繁瑣的工作給了大巨大的動力,他設想通過設計一臺機器,來替他完成繁瑣復雜的計算。雖然它是第一臺圖靈完備的計算機,但現代意義的計算機,還是在馮·諾依曼奠定了計算機的邏輯基礎之后才被制造出來。

  1956年,人工智能(artificial intelligence)一詞在達特茅斯會議上被提出,會議的發起人John MacCarthy是達特茅斯大學數學系的一名助理教授。上世紀50年代-70年代期間,人工智能一直穩步地向前發展。當時美國發展人工智能的一個很大的動力在于,冷戰時期,美國截獲了蘇聯大量情報,亟須設計出一個人工智能算法,能夠自動地把俄文翻譯成英文。

  1974年開始,人工智能進入了第一次寒冬。很多科學家發現,當時機器翻譯的算法需要大量人工介入,十分不智能。在圖像識別方面,當時的科學家設想可以設計出一個機械臂,可以自動辨識、抓取和移動物體,然而他們發現,僅僅是讓機器能夠識別物體這個看似簡單的任務就遭遇到非常多的困難。第一次寒冬的出現,主要因為大量失敗的案例,再加上那個時候計算和存儲資源都非常匱乏,所以當時想要真正實現人工智能,其實還不到時候。

  1980年-1987年這段時間,人工智能出現了回暖,專家系統的出現,讓人們再次看到了人工智能的希望。但好景不長,隨著專家系統很快走到了它的極限,人工智能又進入了第二次寒冬。專家系統的主要問題在于更新維護困難,不能像人類一樣實現真正意義上的學習,可擴展性比較差。

  1993年到2011年左右,人工智能迎來了春天。一是計算機的計算能力大幅度提升。此外,數據采集、傳輸、存儲的能力也在不斷地攀升,數據量越來越大。這些都為人工智能的發展創造了必要條件。

  還有另外一個非常重要的原因,叫”the victory of the neats”,提出這個說法的是著名計算機科學家Peter Norvig 和 Stuart Russell,意指AI研究人員開始大量地去使用數學工具,也不停地創造新的數學工具。所以說,二戰之后一直到21世紀初,數學的長足發展,產生了大量的基礎的數學工具,有些可以直接被應用在人工智能的發展中,基于這些數學工具,也可以制造出更多新的數學工具,來幫助人工智能的發展。

  我也推薦給同學們兩本書,一本是叫Artificial intelligence — A MODERN APPROACH,另外一本是Machines Who Think。它們介紹了人工智能的發展,非常有意思。

  前幾年,DeepMind公司的AlphaGo戰勝人類之后,有不少人批評DeepMind,認為公司花了這么多錢,最后就只是用人工智能在圍棋上戰勝了人類,它的實際應用的意義在哪里?于是,DeepMind先后在2018年和2020年推出了第一和第二代模型Alphafold。這個模型解決了在科學領域一個非常基礎且重要的問題:預測蛋白質的折疊。這個科學問題是Science雜志在2016年列舉的本世紀最前沿的120個科學問題中的第58個問題:我們是否能夠根據蛋白質的DNA測序來預測它的折疊?即蛋白質在三維空間的形態。

  因為現有對于蛋白質測序的數據浩如煙海,而想得到它的三維結構非常困難。冷凍電鏡雖然能夠看到蛋白質三維形態,但設備本身和維護運行都非常昂貴,采集到數據后,需要對它進行一系列復雜的處理,最后才能得到一個比較高質量的三維結構,整個過程需要花大量的人力和物力。Alphafold的最大價值在于,它可以基于現有的DNA序列和對應的三維結構,使用深層神經網絡去預測它們之間的映射關系,實現蛋白質三維結構的快速、準確的預測。

  Alphafold預測的三維結構,和實際的生物試驗得到的三維結構已經非常接近,這個也使得它成為了在結構生物學中一個全新的、重要的科學工具,是人工智能賦能科學探索的一個重要的例子。

  那么,圖像識別背后的數學到底是什么?目前,能夠真正地解決圖像識別這個難題,我們可以使用“人工神經網絡”這個源于神經科學的數學模型。

  什么是(人工)神經網絡?神經網絡是由多個神經元鏈接而成的網絡,每一個神經元有很多的邊,比如說最中間的神經元,與其相連的那些邊把數據輸入到這個神經元,同時它也給下一層的神經元輸入處理過后的數據,這是對人類大腦神經元工作機制的一個近似。每一個神經元的形式都非常簡單,它把輸入的信號進行很簡單的線性組合,然后經過一個非常簡單的非線性函數,得到了該神經元的輸出,并且把它輸入到下一層的神經元。

  盡管每一個神經元它的功能非常簡單,是對大腦神經元一個非常粗糙的模擬,但是我們可以把神經元通過線性疊加和復合的方式,把簡單的神經元函數疊加起來形成深層神經網絡,從而實現非常復雜的功能。在一些復雜的圖像識別任務中,我們使用的神經網絡的層數可以達到成百上千,所需要訓練的參數可能會是億、百億、千億級別。在一些任務中,當神經網絡參數量達到這個量級之后,量變引發了質變,使得人工智能系統越來越接近甚至超越人類智能。

  但是,現在的很多成功的人工智能模型,在很多情況下還是基于海量的大樣本來學習的,然而我們人類從來都不需要從海量的數據中學習知識,這是目前基于深層神經網絡的人工智能面臨的一個非常大的挑戰,即如何從少量的樣本中有效的學習知識。此外,人工智能在諸如對肢體的控制、語言理解、情感交流、邏輯思維等方面,還未達到人類4-8歲孩子的水平,可謂任重而道遠。

  人工智能面臨這些挑戰的一個重要原因,我認為就是數學基礎的薄弱。在這里援引徐匡迪院士2019年的一次講話,他認為,數學基礎薄弱是人工智能產業的一個軟肋,他呼吁更多數學家能夠投入到人工智能研究中。

  我也曾跟很多人工智能領域不同分支的科研工作者進行過探討,他們是非常希望能夠和數學家合作,認為數學會對人工智能的發展作出重要的貢獻。只不過,到底使用什么樣的數學方法,現有的數學工具到底夠不夠用,需要提出什么樣的新數學工具,才能夠更好地解決人工智能里面的各種瓶頸問題——這些都是人工智能理論基礎正在研究的前沿問題。

  第四講 我的數學之路

  最后,也給大家講一講我是怎么走上數學研究的道路的,通過分享求學到做研究工作的經歷,談一談我在科研中的一些體會,以及對數學的一些感悟。

  我的母親是清華大學化學系的教授,1999年報高考志愿時,我有子承母業的想法,也去學化學。但是,從小到大,我從沒有認真思考過我喜歡做什么,只是很自然地想,既然對化學接觸非常多,那我也去學化學好了。所以我就報了北京大學化學系。最后很不巧,分數不夠,化學系招滿了,最后我就被調劑到了數學系。

  這種情況現在不可能出現了,因為現在北大數學的分數僅次于光華管理學院。那時的運氣比較好,當時數學科學學院的院長張繼平發話說:這些學生你們收不下來,那就來數學系。化學系的實驗臺是有數量限制的,但只要給你一根筆、一張紙,你就可以做數學。當時,我們那一屆有很多人就是這樣進了北大數學。

  這個學年是我從高中進入大學的第一年,大學生活和高中真的非常不一樣。大學的老師基本上講完課就走了,和學生的互動非常有限。如果不積極地去找他提問題的話,他不會特別地關心每一個同學的學習進展。所以進入大學之后,首先要學會規劃分配自己的時間,什么時候學習,什么時候鍛煉,什么時候休閑娛樂等。

  第一年的數學課,包括非常基礎的數學分析、線性代數和幾何。我不喜歡幾何和代數,但是發現函數展開非常有意思。數學分析的授課老師彭立中教授(現已退休),在課堂上超綱講了關于小波函數的內容,彭立中老師自己一直在做小波的研究。當時在基礎課的課堂上,老師們很少會講超綱內容,彭老師雖然介紹的很簡單,但在我腦海中留下很深的烙印,覺得小波函數非常酷,這也為我后來在研究生階段選擇學習和研究小波埋下了種子。

  之后,我的大二、大三、大四的生活都非常豐富多彩。當然,這個豐富是在學習以外:比如說音樂和電影,還有籃球和游戲。暴雪是我非常崇拜的一個游戲公司,他們設計游戲時的理念是:精益求精,要么不做,要么就做精品。這種設計理念對我今后的研究也產生了一些影響:要做研究的話,要么不做,要做就做精益求精的研究。

  最后,我以“驚人”的成績本科畢業——基礎數學系的第二名,不過是倒數第二名。我反省了一下為什么沒有認真地學習數學,我認為主要是沒有真正對基礎數學本身感興趣,在學很多抽象概念的時候,我不知道這些抽象的概念到底跟現實的生活有什么樣的關系,因此也沒有學習數學的動力。

  我認為,我人生一個很大的轉折點從讀研開始,當時我很有幸去到新加坡國立大學攻讀碩士。選擇方向的時候,我腦子里第一時間想到大一時候,彭立中老師講數學分析時提到的小波函數。新加坡國立大學的沈佐偉教授在小波方面造詣很深,我很想跟沈佐偉老師去做小波,也非常感謝沈佐偉老師給了我這個學習機會,讓我進入到小波這樣一個非常有趣的領域。

  但是,因為我在本科時候并沒有把數學的基礎打好,所以我花了漫長的時間去彌補。不過,這時候目的是為了能搞懂小波這個非常酷的數學概念和方法,我學習的動力非常足。研究生畢業時,兩年時間我寫了三篇論文,相對比較高產,也算正式地入門了科研,然后也體會到了數學學科,特別是做應用數學研究的樂趣。

  讀博士時我去了UCLA,師從Stanley Osher ,研究圖像和數學,即用數學來做圖像處理。當時在學習過程中,我最大體會是“出來混總是要還的”,因為我本科時候沒有把數學的基礎知識打牢,當我真正想用它來做一些我感興趣的事情時,發現我的數學基礎不夠。所以,我又進一步地惡補了一把數學。

  我在攻讀博士學位期間并不是一帆風順,也遇到了各種挫折,我也曾經萌生碩士畢業就去工業界的想法,但最后還是堅持了下來。我的體會是,如果你能堅持,很多時候成功就在拐角。讀博的最后一年時間,也是我的學術成果涌現的一年,但我其實是堅持積累了很長的時間,才看到最后科研成果井噴的那一天,最后四年拿到博士學位。

  到這里,同學們可能想問,董老師到底想說什么?這里給大家總結一下。

  一是希望同學們盡早思考自己喜歡什么,一定要follow your heart。不要讓別人告訴你,你應該干什么,而改變自己的想法。

  二是要勇于面對挑戰,不要怕失敗。有一次我參加一個活動,大家討論中國科研界為什么少有頂級、領先的大師學者,我在發言時表達的觀點是:我們對成功的定義過于單一、對失敗的容忍太低。如果所有人都朝著同一個所謂成功的目標去沖,很難產生多元的、多樣化的社會。如何做到勇于面對挑戰,不怕失敗?同學們可以從一間小事做起:就是你在上課的時候,不管是大學還是在哪的課堂,敢不敢問老師問題。我在美國任教的時候,我發現美國學生一個非常典型的特點就是,非常敢問問題,他們從來不怕被別人嘲笑他們“這是簡單或是蠢的問題”。因為,一是,你問的這個問題有可能別的同學也有類似疑問,但他們不敢問。第二是,通過問問題和老師進行互動,你不僅能學地更快,也能夠慢慢地學會,怎么能夠問出越來越聰明的問題。所以說不怕失敗,可以從勇于問問題做起。

  三是要堅持,要更多的迎難而上,而不是總“打一槍換一個地方”,這樣的話實際上是很難做出來一些很重要、很基礎的工作。

  最后,也可能是最重要的一點是,要學會享受學習和工作過程中的點點滴滴,enjoying little things,為什么?是因為如果大家都向著成功的目標去沖,所謂的成功僅是這個頭部的百分之一,甚至千分之一。那么也就是說,99%或999‰點的人做不到所謂的成功。那么我們的人生目標,不應該是向著這1%或是0.1%的成功去看,而是要學會享受自身的提高。現在流行的一個詞匯叫“內卷”,我覺得很多內卷就是因為不停地去跟別人比,忘記了享受在學習和成長過程中的快樂。所以最后,希望大家在學習和工作過程中,能夠享受其中的樂趣,這樣你的心態也會更好,工作和學習也能夠推進得更加順利。

木瓜视频app下载安装-木瓜视频app下载汅api-木瓜视频ios Produced By 大漢網絡 大漢版通發布系統