文字有點主要總結(jié)就是

優(yōu)點:

1. 思維模式強大

Grok 3的“思維模式”強大。它在解決類似《卡坦島》游戲網(wǎng)頁的任務(wù)時,能夠生成一個簡潔且功能完整的六邊形棋盤網(wǎng)頁。不僅能按要求生成,還能根據(jù)滑塊調(diào)整環(huán)的數(shù)量,表現(xiàn)相當精準。與其他頂尖的模型相比,GroK 3在這類任務(wù)中的表現(xiàn)可靠。

我按他的六邊形棋盤要求輸入給deepseek得到的是這個:

2. 復(fù)雜計算推理是強項

給Grok 3提了一個數(shù)學(xué)問題——估算訓(xùn)練GPT-2所需的FLOP數(shù)。很多模型在面對這樣的計算推理時都會陷入困境,但Grok 3不僅沒有直接放棄,反而提供了一個相對精確的估算過程。它通過一定的推理和計算,正確估算了大概的訓(xùn)練量,這是許多模型無法做到的。

還有就是,Grok 3并沒有回避困難的數(shù)學(xué)問題。提出黎曼猜想問題,它并沒有立即回避,而是嘗試解答。

缺點

1. 一些簡單的解碼問題難倒它

我給Grok 3出了一道關(guān)于表情符號的“謎題”,涉及Unicode變體選擇符。雖然給了它提示,尤其是一些Rust代碼來解碼,它依然沒解答出來。相比之下,DeepSeek-R1在這方面進展稍好,能部分解碼。因此,某些細節(jié)的處理上,Grok 3還有待改進。

2. 生成圖像時仍顯生硬

在SVG圖像生成方面,Grok 3的表現(xiàn)有些“拗口”。例如,要求它生成一個騎著自行車的鵜鶘的SVG時,結(jié)果雖然看得出有鵜鶘,但依然顯得有些不自然,排列不盡人意。相比之下,Claude在這方面的表現(xiàn)稍好一點。

分享到

崔歡歡

相關(guān)推薦