在過去一星期,我認真地嘗試使用 AI 工具進行數學研究。在這段很短的時間內,我完成了幾篇 AI 輔助的研究論文,其中部分已提交至 arXiv,並以預印本形式公開發表。我把這些論文收集在個人網頁上,一方面作為這些論文本身的記錄,另一方面也作為一種正在形成中的研究方法的記錄。

這個論文集的目的,並不是展示一些隨意生成的 AI 內容。相反,我希望親身體驗、記錄並展示,在持續的人類數學判斷、問題選擇、概念引導和嚴謹核查之下,現時的 AI 工具在數學研究中究竟可以做到甚麼。這些項目仍然是由人類主導的。AI 被用作一個主動的助手,但數學上的責任仍然由我承擔。

在某些方面,我在這些項目中的角色類似於一位研究導師指導研究生。我提出研究問題,判斷研究方向是否具有數學意義,設定研究範圍,評估中間產物,修正錯誤方向,並判斷最終結果是否連貫、有意義,以及是否值得公開。當然,這個比喻並不完全準確,因為 AI 不是獨立研究者,也不能為研究工作承擔責任。然而,這個比喻確實捕捉到這種工作流程的一個核心特徵:成果的質素很大程度上取決於專家的引導、持續的回饋,以及批判性的數學判斷。

這個過程的速度令我印象深刻。第一篇這類論文大約用了半天時間,便發展成一份相當完整的初稿。隨着我逐漸熟習如何與 AI 溝通、如何設計提示,以及如何引導研究發展,我逐步能夠把產生一份技術上較成熟的初稿所需時間減至大約三至四小時。這並不表示一篇完成的研究論文可以在沒有思考或核查的情況下產生。它說明的是,當人類研究者有清晰方向,並懂得有效引導工具時,AI 可以非常迅速地協助產生一份 substantial 的初步版本。

我通常的工作流程,是先向 AI 提供幾篇我過去相關的論文,請它總結其中的主要思想、技術和數學結構。然後,我會描述我想探索的新方向,並要求 AI 嘗試把它與我以往的工作聯繫起來。透過進一步對話,我會逐步細化想法,並檢查 AI 是否能夠跟上我預期的數學方向。這個階段十分重要。在要求 AI 撰寫報告之前,我需要確定它已經理解問題、動機、相關背景,以及我希望發展的結果類型。

當我覺得已有足夠細節可以形成一個項目時,我會請 AI 展開技術推導,並把內容整理成一份 LaTeX 報告。由於輸出長度的限制,第一版草稿通常少於十頁,這往往只是一般學術論文最終長度的大約一半。之後,我會逐節處理,要求 AI 改善論述、補充缺少的細節、釐清數學結構,並加強文章的流暢性。因此,最初的草稿並不是最終成果,而是一個用來進一步發展和打磨的起點。

核查是整個過程中非常重要的一部分。我會要求 AI 為提出的想法提供理論支持,建議可能的命題或定理,並協助發展相應的推導或證明。這些輸出必須仔細檢查。AI 可以產生有用的論證,但也可能犯錯、遺漏假設,或者給出看似合理但不夠嚴謹的推理。因此,人類研究者必須持續參與閱讀、質疑、修正和完善數學內容。

我也會請 AI 建議可用來驗證想法的數值例子。ChatGPT 可以產生 Python 程式,有時也可以直接執行數值實驗,但這方面仍有限制。在很多情況下,我會要求它產生 MATLAB 程式,讓我下載後在自己的電腦上執行。生成的程式通常接近正確,或許有大約 95% 是沒有明顯錯誤的,但仍然常有一些細節需要調整。如果修改很簡單,我會直接在自己的電腦上處理;如果問題較大,我會再要求 AI 重新生成或除錯 MATLAB 程式。

一個有用的做法,是要求程式不只輸出圖像,也把數值結果以 CSV 格式輸出。然後我可以把這些結果重新上載給 AI,讓它檢視數值數據,並改善論文中的數值例子部分。這形成了一個有效的回饋循環:AI 提出例子、生成程式,我執行計算,然後把數值結果交回 AI,再根據實際輸出改善文章的論述。

另一個重要的部分是反覆修訂。我經常把中間版本的 TeX 檔重新上載給 AI,請它改善文章的質素、行文、符號一致性和學術語氣。我也可能把中間報告上載到另一個 AI 系統,例如 Gemini,請它撰寫審稿報告並提出改進建議。然後我再把這些意見交回 ChatGPT,請它據此修改論文。透過這種方式,不同 AI 系統不僅可用於生成內容,也可用於批評、審閱和完善內容。

因此,這個過程更接近於指導一個研究項目,而不是簡單地要求機器寫一篇論文。我提出方向,提供背景,判斷數學上的重要性,引導研究進展,要求補充理論或數值支持,評估輸出結果,並決定所得成果是否成熟到可以公開分享。AI 加速了很多技術性工作,但它並沒有取代數學經驗的需要。

這次實驗對我特別有意義的一個原因,是最初的幾個項目並不是由 AI 隨機產生的題目。它們來自我和學生多年前發展的一些數值算法中尚未完成的理論問題。在原來的論文中,我們透過數值例子展示這些算法的準確性。在某些情況下,算法框架本身是針對一般 (n) 階構造而提出的,但數值展示只做到較低階,例如 (n=3) 或 (n=4)。當時欠缺的是一個完整的理論證明。

這是我一直想做的事情。然而,要為這些算法建立嚴謹理論並不容易。它似乎需要結合微分幾何、逼近理論、插值理論,以及仔細的漸近分析。坦白說,我並不覺得自己有足夠時間或完整技術能力,完全靠自己建立這套理論。我也覺得,把這個問題交給學生作為研究項目會非常困難,因為它需要一種相當特殊的背景組合。因此,這個問題一直擱置了多年。

所以,我向 AI 提出的第一個項目非常具體:為其中一個數值構造建立完整的理論基礎。我首先請它分析低階情況,從 (n=2) 開始,然後是 (n=3),再到 (n=4)。這在某種程度上是測試 AI 是否能理解方法的結構,並重現建立一般結果所需的推理方式。令我驚訝的是,它相當順利地處理了這些情況。當我再要求它根據觀察到的模式建立一般 (n) 階理論時,它在幾分鐘內便提出了一個候選框架。

令我印象深刻的,不只是 AI 能夠快速生成一套理論,而是之後的核查過程具有互動性。當我要求它檢查自己的論證時,它指出了證明中的缺口,並承認第一個版本並不完整。之後我們經過了幾輪修改:找出缺少的假設,加強定理陳述,細化估計,並改善論證的邏輯結構。最終,AI 產生了一個它認為在內部邏輯上較為一致的版本。我讀過這個論證,雖然我不能說每一個技術細節都已經完全核實到令我完全滿意,但整體策略看來是數學上合理的,而且與原來數值方法的結構密切相關。

為了進一步測試結果的穩健性,我要求 AI 從另一個角度發展一個不同的證明。它做到了,而這亦成為第二篇論文的基礎。這一點尤其令我驚訝。在傳統研究過程中,即使只是為這類方法建立一個完整的理論解釋,也可能需要很長時間。在這裡,AI 不僅協助提出一個可能的理論框架,還能生成另一條推理路線,使我可以比較不同的證明和觀點。

完成最初這些偏重證明的項目之後,我想從另一個方向測試 AI 的能力。最初的幾篇論文比較接近應用數學中偏純數學的一面:它們主要集中於為已經提出並經數值測試的算法建立理論支持。之後,我想看看 AI 是否也能參與更真正的應用數學項目。在這類項目中,任務不只是建立理論,還包括設計計算方法、實作算法、測試結果,並把整個過程清楚地呈現出來。

這引出了另外兩個項目。其中一個與一般曲面上的插值有關,動機是探討當數據受限於一個非線性幾何物件上時,如何構造高階插值方法。另一個則與一個動力系統問題的數值算法發展有關。這些項目要求我以不同方式與 AI 互動。AI 不再只是建議定義、命題和證明。它還需要協助建立數值程序,把數學想法轉化為可實作的算法,生成程式碼,設計數值測試,並解讀計算輸出。

我發現這一階段的實驗同樣具有啟發性。AI 能夠產生相當認真的程式碼,並在出現問題時作出修訂。當然,像任何計算項目一樣,仍有一些細節需要調整,但整體工作流程出乎意料地順暢。特別是,AI 能夠在數學 formulation、算法描述、實作、數值驗證和論文寫作之間來回切換。這種把應用數學項目的多個層面連接起來的能力,是整個經驗中最令我印象深刻的地方之一。

因此,後來形成的兩篇論文與最初偏重證明的項目有所不同。它們不只是嘗試填補過去工作的理論缺口,也是在 AI 協助下產生和測試新的應用數學發展。我對這兩篇論文大致滿意,並不是因為我認為它們已經是最終版本或沒有可批評之處,而是因為它們已達到一個我通常會視為嚴肅初步研究手稿的連貫性、完整性和計算支持程度。

AI 在數學研究中並不是從一個含糊的提示中直接寫出一篇完美論文。相反,它協助我重新處理自己工作中長期存在的理論缺口,探索低階例子,歸納一般結構,指出自身推理中的弱點,透過反覆回饋改善論證,然後進一步推進到算法設計和數值實作。整個過程仍然需要人類判斷:我必須選擇問題,理解其重要性,引導 AI 掌握相關背景,提出合適的核查問題,並判斷輸出是否有足夠意義繼續發展。但 AI 所提供的速度和深度,遠遠超出我原本的預期。

對我而言,核心問題並不是 AI 能否取代數學家。更有意思的問題是:數學家如何能夠負責任而有效地使用 AI 工具,擴展自己可以探索的問題範圍。AI 可以幫助快速測試想法、生成例子、建議 formulation、整理文獻、起草技術段落,以及產生計算程式。若能謹慎引導,這些能力可以顯著加快研究發展的早期和中期階段。

與此同時,AI 輔助研究也帶來關於作者身份、原創性、責任、核查和透明度的重要問題。這些問題不應被忽視。秉承《人工智能與數學萊頓宣言》的精神,我希望清楚說明 AI 在這些工作中的角色。AI 工具被用來生成候選論證、探索例子、建議可能的結構、協助符號推導、起草技術論述,以及加速數值實驗。它們不被視為作者,也不是人類意義下的獨立合作者,更不是數學權威。

在現階段,我並不打算立即把這些預印本投稿至學術期刊。原因有幾個。首先,雖然我真心對目前產生的成果感到高興,但我對所有論文的現有形式並不是完全滿意。有些細節我仍想補充,有些論證我仍想更仔細檢查,有些數值例子可能需要進一步驗證,與現有文獻的連繫也應該更充分地發展。若要把這些論文提升到我完全放心投稿至期刊的程度,仍然需要相當多時間。

其次,這裡也存在一個更微妙的作者身份和 credit 問題。這些論文目前都是單作者論文,而我仍然對它們的數學方向、詮釋、呈現和完整性負責。但同時,我也必須誠實地說,我並不認為自己能夠完全憑一己之力,以這樣的速度和這樣的技術廣度,產生目前形式的論文。AI 不會獲得作者身份,因為它不能為工作承擔責任,不能回應批評,也不能保證結果的正確性。然而,它在這些論文發展過程中的作用確實是 substantial 的。

這造成了一種我認為學術界尚未完全解決的張力。傳統上,單作者論文意味著作者本人親自發展了其中的想法、論證、計算和文字呈現。在這些項目中,概念方向、判斷和責任屬於我,但許多技術成分都是透過與 AI 大量互動而生成、擴展、重組或改善的。這正是為甚麼我更願意明確把這些工作稱為 AI 輔助數學研究,而不是簡單地把它們視為普通意義下的單作者論文。

從這個意義上說,我對這些論文感到高興,但並不是以那種對一篇完全經由自己長時間技術工作發展出來的論文所感到的方式而自豪。我更傾向把它們視為嚴肅的研究實驗。它們包含我認為有意義的想法和發展,但它們同時也提出了在 AI 輔助研究時代,作者身份、原創性和學術 credit 應該如何理解的方法論和倫理問題。

因此,我希望讀者從兩個角度看待我網頁上收集的論文。第一,它們是數學預印本,可以像其他預印本一樣被閱讀、檢查、批評和改善。在我看來,它們作為探索性手稿已達到相當成熟的標準,但它們不是最終的期刊投稿版本。它們仍然是預印本,理應接受數學社群進一步的審閱、修正和完善。

第二,它們也是一種方法論的例子。它們展示了一種人類與 AI 在數學研究中合作的可能模式:人類研究者提供概念方向、數學判斷和責任,而 AI 則協助探索、推導、計算、起草和修訂。這些論文的成敗不應只由是否使用 AI 來判斷,而應由通常的數學標準來評價:問題是否有意義?結果是否正確?論證是否嚴謹?想法是否原創或有用?論文是否對相關領域有所貢獻?

我決定把這些工作公開,是因為我相信數學界需要具體的 AI 輔助研究例子,而不只是關於 AI 的抽象討論。我們仍然處於理解這些工具應如何使用的早期階段。透過公開記錄這個過程,我希望能為關於數學研究未來的嚴肅而透明的討論作出一點貢獻。

最終,我的目標並不是為了推廣 AI 生成數學本身。我的目標是理解,人類數學判斷與 AI 計算輔助如何能夠以負責任的方式結合。如果得到適當引導,AI 工具或許可以成為數學探索中的強大助手。但提出好問題、識別有意義的想法、核查正確性,以及維持學術誠信的責任,必須仍然由人類研究者承擔。

因此,這個網頁既是一個論文集,也是一場關於研究實踐的實驗。我歡迎數學社群就這些結果的正確性、原創性和重要性,以及其背後更廣泛的方法論,給予建設性的意見。