DeepSeek初步想法

 近幾天DeepSeek的橫空出世,的確會讓大家有了很多期待,特別是R1在數學跟程式上的優異表現。但我比較不喜歡從排行版或benchmark的分數來評比大語言模型(LLM)間的優劣。我會把不同的大語言模型當成不同專長或個性的夥伴來選擇合作的領域。

以ChatGPT o1來說,我最近喜歡跟他討論複雜的概念或報告。Gemini來說的話適合整理資料。NotebookLM每當我有新的想法或是想更瞭解一本書就會跟他討論。不過Claude我沒買所以我跟他不熟。
我用Chatbot Arena測試DeepSeek我最近使用的幾個領域後,我覺得DeepSeek的確在很多問題的初始回答上都還不錯,但好像追問幾次後就會變成奇怪的樣子?可能要在觀察看看?



沒有留言:

Claude Code分析電腦問題