NVIDIAとGoogleがAI推論コストを削減するための協力を発表
Google Cloud Next大会で、GoogleとNVIDIAがAI推論コストを大幅に削減するための新しいハードウェアとソフトウェア設計を発表しました。
Google Cloud Next大会で、GoogleとNVIDIAがAI推論コストを大幅に削減するための新しいハードウェアとソフトウェア設計を発表しました。
AI推論最適化に特化するスタートアップGimlet Labsが8000万ドルのシリーズA資金調達を完了し、異種チップ間でのAIモデル同時実行を可能にする革新的技術で業界の長年の課題を解決。
AI換顔アプリRefaceとAIアートフィルターPrismaの共同創業者らが、デバイス端末でのAI推論を最適化する新企業Miraiを設立し、1000万ドルのシード資金を調達した。
AI推論プラットフォームを手がけるModal Labsが、General Catalyst主導で25億ドル評価での新規資金調達を交渉中。わずか4年で評価額が倍増し、AI推論市場の急成長を反映している。
OpenAIのo1-previewモデルは数学・推論タスクで驚異的な性能を示したが、複雑な数学問題で頻繁に「幻覚」(誤った回答を自信満々に生成)を起こすことが判明し、AI専門家から真の能力を疑問視する声が上がっている。この事件はX上で百万を
LMSYS OrgとMLCommonsが協力し、長いコンテキストとマルチエージェント推論に特化したAI業界初のオープンソース標準化フレームワーク「Ares」ベンチマークを正式リリースしました。
MLCommonsがクライアント推論シナリオ向けの最新ベンチマークテストスイート「MLPerf Client 1.5」を発表。モバイルデバイスやノートPC、エッジデバイスでのAI性能評価に焦点を当て、実際のアプリケーションに近い測定基準を提
AI数学スタートアップAxiomが、自社開発のAIシステムで4つの未解決数学問題を解決し、AIが補助ツールから独立した創造者へと転換する画期的な成果を達成した。
NVIDIAの早期アクセスプログラムを通じて、デスクトップワークステーション形態でスーパーコンピューティング性能を実現するNVIDIA DGX Sparkを詳細にレビューし、SGLangを使用した性能テストと実用シナリオを検証しました。
SGLangがNVIDIAの最新高効率Nemotron 3 Nano MoEモデルを発表当日にサポート。同モデルは業界最高レベルの計算効率と精度を提供し、専門的なエージェント型AIシステムの構築を支援します。
OpenAIが最近発表したo1-previewモデルは、その強力な推論能力にも関わらず、使用制限が頻繁に限界に達し、ユーザーからの不満が高まっています。この問題は、大規模モデル時代における推論コストの高さを浮き彫りにしています。
OpenAIは新たにo1-previewとo1-miniモデルを発表し、AIの内部推論プロセス「推論チェーン」を初めて公開しました。この技術革新はAIの思考過程を人間のように段階的に展開し、AIの透明性を高める重要な一歩となっています。
2024年9月、OpenAIはo1-previewおよびo1-miniモデルを発表し、AI業界を驚かせました。特にARC-AGIの抽象推論タスクで83%のスコアを達成し、AI推論能力のマイルストーンとされています。