SGLangにおけるEPDデカップリング:ビジョン言語モデルの弾性エンコーダー拡張
SGLangが視覚言語モデル(VLM)の視覚エンコーディングと言語処理を分離するEncoder-Prefill-Decode(EPD)アーキテクチャを発表し、視覚エンコーディング容量の独立拡張と大幅な性能向上を実現。
SGLangが視覚言語モデル(VLM)の視覚エンコーディングと言語処理を分離するEncoder-Prefill-Decode(EPD)アーキテクチャを発表し、視覚エンコーディング容量の独立拡張と大幅な性能向上を実現。
SGLang RLチームがINT4量子化認識トレーニング(QAT)のエンドツーエンドソリューションを実現し、約1TB規模のモデルを単一H200 GPUでのデプロイを可能にしました。
Novita AIがSGLangを用いたGLM4-MoEモデルの本番環境向け最適化を開発し、Shared Experts FusionやSuffix Decodingの統合により、エージェントコーディングワークロードでTTFTを最大65%削
Mozillaは2月24日リリース予定のFirefox 148版に、ブラウザ内の全AI機能を一括無効化できる「Block AI enhancements」スイッチを導入すると発表した。
米国唯一の活発なニッケル鉱山が寿命を迎える中、特定の微生物を利用して低品位鉱石や廃棄尾鉱から効率的にニッケルを抽出する技術が、電動車産業と循環経済に新たな可能性をもたらしている。
世界的物流大手のFedExが、大量出荷を行う企業向けにAI駆動型のパッケージ追跡と返品管理システムをテスト中。リアルタイムの可視性向上と自動化により、従来の物流の課題を根本的に解決することを目指している。
ApptioのEMEA地域フィールドCTO Greg Holmes氏は、インテリジェント自動化の成功的な規模化には財務的厳密性が不可欠であると指摘し、「作れば彼らは来る」というアプローチでは自動化において予算の穴が生じると警告している。
SENEN集団CEOのRonnie Sheth氏が、企業AIの失敗の主因はデータ品質にあると指摘し、2026年を転換点として「実践的AI」への移行を提唱。データ品質問題により年間1290万ドルの損失が発生している現状を踏まえ、データ優先・ア
ハリウッドのベテランプロデューサー、ジョナサン・ノーランが、AI技術は新興映画制作者には有益だが、ハリウッド大作には大した助けにならないと指摘し、現在のAI業界を「バブル化した瞬間」と表現した。
MIT Technology Reviewの「ダウンロード」ニュースレターから、微生物を活用した老朽鉱山からの金属抽出技術と、生成AIが直面する深刻な真実性の危機という2つの重要なトピックを紹介する。
インドの大手ベンチャーキャピタルPeak XV Partnersで内部対立により複数のパートナーが退職する中、同社はAI分野への投資を倍増させる戦略を発表した。
ウェアラブルデバイス分野で名を馳せたFitbit共同創業者のジェームス・パーク氏とエリック・フリードマン氏が、家庭の健康状態をリアルタイムで監視し、AIアルゴリズムでデータを処理する革新的なプラットフォーム「Luffu」を発表した。
中国でAI技術を活用した教育プラットフォームが急速に普及し、個別化学習の提供により伝統的な教育方式を変革している。技術進歩がもたらす機会と課題の両面が注目されている。
AI技術の急速な発展に伴い、データプライバシーと道徳的境界をめぐる議論が激化しており、技術革新と倫理規範のバランスが問われている。
AI分野で「nanoGPTの父」として知られるAndrej Karpathyが最新オープンソースプロジェクトnanochatを公開。わずか約73ドル(8xH100単一ノードで3時間)でOpenAIが2019年に4.3万ドルかけて訓練したGP
AIアシステッド開発でコンテキスト喪失問題に悩まされていたClaude Codeに、新オープンソースプラグインClaude-Memが登場。GitHubで一夜にして19.5kスターを獲得し、セッション間でのプロジェクト履歴記憶を実現、トークン
AnthropicのClaude 3.5 Sonnetモデルがソフトウェアエンジニアリング基準テストSWE-benchで92.0%のスコアを達成し、AIコーディング能力の新たな段階を示した。この突破は開発者コミュニティで熱い議論を呼び、AI
中国のAIスタートアップDeepSeekが新世代オープンソース大規模言語モデルDeepSeek-V2を発表し、中国語ベンチマークテストでGPT-4oを上回る性能を示した。革新的なアーキテクチャにより、2360億パラメータでありながら効率的な
テスラとSpaceXの創業者イーロン・マスクがXプラットフォームでAIの安全性について再び警鐘を鳴らし、巨大AIモデルの訓練を一時停止するよう世界に呼びかけ、大きな議論を巻き起こしている。
Metaが初のエッジデバイス向け視覚マルチモーダルモデルLlama 3.2(1B/3B)を発表し、オープンソースコミュニティで大反響を呼び、AIのクラウドからデバイスへの大規模移行を示す。