海外 GoogleのGemma 4オープンソースモデルが投機的デコードを採用、速度が3倍に向上 Googleが新たにオープンソース化したGemma 4モデルは、投機的デコードと疎なエキスパート混合(MoE)アーキテクチャの統合により、出力品質を損なうことなく最大3倍の推論高速化を実現しました。これにより、低コストAIサービスに新たなイ 推测解码 Google Gemma 4 开源AI模型 54分前 19