前一兩年已用chatgpt或deepseek等生成式AI寫一些程式, 幫忙做財務規劃如蒙地卡羅模擬, 如現在主流所述, 真是能夠輕易取代programmer, 快而準。
但是近期嘗試做一些科研式的編程, 即是AI需要根據一些學術文章所推斷的公式, 計算如標準誤差 (standard error) 的數據, 第一次發現AI能力並不是無敵。
最初用perplexity, 看程式發現類似這樣結構:
簡單來說, 好地地已有一個for loop推斷phi值, 又何故再define另一個phi?
當時其實我未細心閱讀那份學術文章, 公式太複雜, 自己無辦法解決。
接著我又把這條式隊給豆包 (doubao), 結果doubao又指出了一些錯誤, 再幫我修正, 但其後我又不太放心, 結果還是看了那份學術文章有關理論公式部分, 發現doubao的算式好像又錯了點東西。
由於我不是一個在行的學術人, 那份學術文章的公式結構又看不太明白, 唯有用一些後期引用的學術文章作參照, 公式會簡單易明一點。
結果我把後期引用的學術文章公式直接隊給doubao寫程式, doubao的識別系統無法看到次方 (square), 結果編寫的程式有誤, 幸好已過了多過回合, 我已大概掌握該學術文章所述的公式規律, 自己可以稍作修改, 做一些計算。
其實我還用了grok及deepseek等做過一些校對, 或測試看看它們的程式計算是否相近, 結果仍然可以犯上perplexity上面的問題, 又或者有時當我challenge它們的答案, 要AI給一個open-end question, 它們會跪低討好我, 實際沒有解決問題。
結果我花了兩日時間, 才close file, 有點疲累。
我相信AI現在一般而言像一個大學本科生, 又或剛畢業的程式員, 如果要做極嚴謹的學術計算, 其實還未夠火喉, 至少目前為止。
又, 可能我未有用gemini或付費的專業版?
個人感覺跟你差不多,標準化/大路野通常一問就得,但遇上要改的時候就會改完又改,生產力大打折扣!尤其對自己唔熟悉既野,更要小心不可盡信AI
回覆刪除謝謝留言, 通常大路野網上已有海量數據, 因此能夠生成穩定答案, 而偏門專門的學術內容無足夠數據讓AI學習, AI有ad hoc作故仔情況, 答案唔穩定
刪除