近幾天DeepSeek的橫空出世,的確會讓大家有了很多期待,特別是R1在數學跟程式上的優異表現。但我比較不喜歡從排行版或benchmark的分數來評比大語言模型(LLM)間的優劣。我會把不同的大語言模型當成不同專長或個性的夥伴來選擇合作的領域。
以ChatGPT o1來說,我最近喜歡跟他討論複雜的概念或報告。Gemini來說的話適合整理資料。NotebookLM每當我有新的想法或是想更瞭解一本書就會跟他討論。不過Claude我沒買所以我跟他不熟。
近幾天DeepSeek的橫空出世,的確會讓大家有了很多期待,特別是R1在數學跟程式上的優異表現。但我比較不喜歡從排行版或benchmark的分數來評比大語言模型(LLM)間的優劣。我會把不同的大語言模型當成不同專長或個性的夥伴來選擇合作的領域。
留言