GoogleがオープンモデルDiffusionGemmaを発表。26B MoEアーキテクチャで推論時アクティブパラメータ3.8B、H100で1000トークン/秒以上という最大4倍の高速化を主張する。研究者・エンジニア出身の徐 聖博が、技術的な新規性と本番投入のリアルなギャップを論評。
システム開発やAI推進についてのご相談はこちらから