SpecBundleとSpecForge v0.2:本番環境対応の推測デコーディングモデルとフレームワークが重大リリース
SpecForgeチームが複数の業界パートナーと協力し、大規模データセットで訓練された本番環境対応のEAGLE-3モデルチェックポイント集「SpecBundle(Phase 1)」と、全面的に再構築されたSpecForge v0.2を発表。
SpecForgeチームが複数の業界パートナーと協力し、大規模データセットで訓練された本番環境対応のEAGLE-3モデルチェックポイント集「SpecBundle(Phase 1)」と、全面的に再構築されたSpecForge v0.2を発表。
SGLangが視覚言語モデル(VLM)の視覚エンコーディングと言語処理を分離するEncoder-Prefill-Decode(EPD)アーキテクチャを発表し、視覚エンコーディング容量の独立拡張と大幅な性能向上を実現。
SGLang RLチームがINT4量子化認識トレーニング(QAT)のエンドツーエンドソリューションを実現し、約1TB規模のモデルを単一H200 GPUでのデプロイを可能にしました。
Novita AIがSGLangを用いたGLM4-MoEモデルの本番環境向け最適化を開発し、Shared Experts FusionやSuffix Decodingの統合により、エージェントコーディングワークロードでTTFTを最大65%削
Mozillaは2月24日リリース予定のFirefox 148版に、ブラウザ内の全AI機能を一括無効化できる「Block AI enhancements」スイッチを導入すると発表した。
中国でAI技術を活用した教育プラットフォームが急速に普及し、個別化学習の提供により伝統的な教育方式を変革している。技術進歩がもたらす機会と課題の両面が注目されている。
AI技術の急速な発展に伴い、データプライバシーと道徳的境界をめぐる議論が激化しており、技術革新と倫理規範のバランスが問われている。
AI分野で「nanoGPTの父」として知られるAndrej Karpathyが最新オープンソースプロジェクトnanochatを公開。わずか約73ドル(8xH100単一ノードで3時間)でOpenAIが2019年に4.3万ドルかけて訓練したGP
AIアシステッド開発でコンテキスト喪失問題に悩まされていたClaude Codeに、新オープンソースプラグインClaude-Memが登場。GitHubで一夜にして19.5kスターを獲得し、セッション間でのプロジェクト履歴記憶を実現、トークン
AnthropicのClaude 3.5 Sonnetモデルがソフトウェアエンジニアリング基準テストSWE-benchで92.0%のスコアを達成し、AIコーディング能力の新たな段階を示した。この突破は開発者コミュニティで熱い議論を呼び、AI
中国のAIスタートアップDeepSeekが新世代オープンソース大規模言語モデルDeepSeek-V2を発表し、中国語ベンチマークテストでGPT-4oを上回る性能を示した。革新的なアーキテクチャにより、2360億パラメータでありながら効率的な
テスラとSpaceXの創業者イーロン・マスクがXプラットフォームでAIの安全性について再び警鐘を鳴らし、巨大AIモデルの訓練を一時停止するよう世界に呼びかけ、大きな議論を巻き起こしている。
Metaが初のエッジデバイス向け視覚マルチモーダルモデルLlama 3.2(1B/3B)を発表し、オープンソースコミュニティで大反響を呼び、AIのクラウドからデバイスへの大規模移行を示す。
xAIがFlux.1モデルベースのGrok-2画像生成機能を発表、高品質出力と無料・無検閲での提供により、AI画像生成市場に大きな衝撃を与えている。
NVIDIAの最新AIチップBlackwell B200への注文が殺到し、初回納入が2025年に延期されることが判明。AI演算インフラのボトルネックが顕在化し、業界全体に大きな影響を与えている。
AnthropicのClaude 3.5 Sonnetがソフトウェア工学ベンチマークSWE-benchで90%以上のスコアを達成し、AIコーディング能力の新時代到来を示した。この成果は複数の記録を更新し、開発者コミュニティで広範な議論とプロ
Googleが2024年12月に発表したGemini 2.0 Flashは、低遅延と高効率を実現した軽量マルチモーダルAIモデルで、リリース以来10万回以上のベンチマークテストを記録し、開発者コミュニティで大きな注目を集めています。
2024年米大統領選挙を前に、AIが生成した深度偽造(ディープフェイク)動画がXプラットフォームで急速に拡散し、数百万回の閲覧数を記録。FBIが公開警告を発し、AI悪用が選挙の誠実性に与える脅威が顕在化している。
中国のオープンソースAIプロジェクトDeepSeek-V2が権威ある中国語ベンチマークテストでOpenAIのGPT-4oを全面的に上回り、わずか236Bのパラメータ規模で高効率な推論と低コスト展開を実現した。
テスラ・SpaceX CEOのイーロン・マスクがX(旧Twitter)でAIの急速な発展と安全対策の遅れを指摘し、巨大AIモデルの訓練停止を呼びかけ、世界的なAI安全論争を再燃させた。