a16z AIインフラ投資実録:注目分野への賭けと、見過ごされた領域とは?
Andreessen Horowitz(a16z)が記録的な150億ドルの資金調達を完了し、そのうち17億ドルをインフラチームに配分。OpenAI、Black Forest Labs、Cursorなど数十社のAIスタートアップへの投資戦略と
Andreessen Horowitz(a16z)が記録的な150億ドルの資金調達を完了し、そのうち17億ドルをインフラチームに配分。OpenAI、Black Forest Labs、Cursorなど数十社のAIスタートアップへの投資戦略と
著名ベンチャーキャピタルのAndreessen Horowitz(A16z)が150億ドルの新規資金調達を完了し、うち17億ドルをAI基盤インフラチームに投入すると発表。同チームはOpenAI、Cursor、ElevenLabsなど数十社の
Amazonは待望のAI音声アシスタントAlexa+を米国全土のユーザーに正式公開し、Primeメンバーは全デバイスで無料、非メンバーもモバイルとウェブで無料で利用可能となった。
フランスのスタートアップMistralが超高速翻訳モデル「Mistral Translate Ultra」を発表し、効率的なアプローチでGPUリソースに依存する米国AI大手に挑戦状を突きつけた。
AI音声合成のElevenLabsがSequoia Capitalから5億ドルを調達し、評価額が110億ドルに達した。過去12ヶ月で評価額は3倍以上に成長している。
2026年2月5日に開幕したAIエキスポでは、AIの「デジタル同僚」としての展望が注目を集め、受動的な自動化から自律的な「エージェント型」システムへの移行が主要テーマとなった。技術セッションでは、エージェント型AIを安全に運用するためのガバ
Robloxが革新的な4D創作機能のパブリックベータテストを開始し、時間を第4の次元として3D空間モデリングに融合させることで、ユーザー生成コンテンツの風景を根本的に変えようとしている。
世界最大の出会い系アプリTinderが、ユーザーの「スワイプ疲れ」問題に対処するため、AIとカメラロールの洞察を組み合わせた新機能をテスト中。
AI数学スタートアップAxiomが、自社開発のAIシステムで4つの未解決数学問題を解決し、AIが補助ツールから独立した創造者へと転換する画期的な成果を達成した。
清華大学とApproaching.AIが開発したKTransformersプロジェクトは、MoEモデルのCPU/GPU混合推理を最適化し、SGLangに統合されることで大幅な性能向上を実現しました。
米国のAI医療スタートアップLotus Healthが、CRVとKleiner Perkins主導で3500万ドルのシリーズA資金調達を完了し、全米50州で医療ライセンスを取得した無料AI医師サービスを提供している。
Appleの開発ツールXcode 26.3がOpenAIのCodexとAnthropicのClaude Agentを統合し、AIが自律的にコーディングタスクを実行する「代理式コーディング」機能を導入。開発プロセスの根本的な変革をもたらす。
WIRED記者がAI専用SNS「Moltbook」に偽のAIアイデンティティで潜入し、その実態を暴露。表面的な革新性の裏に潜む技術的限界と倫理的問題を鋭く指摘する。
IntelがGPU市場への本格参入を発表し、NVIDIA主導の市場構造に挑戦します。顧客ニーズを中心とした差別化戦略で、AI時代における復活を目指します。
SGLang-Diffusionは2025年11月の公開以来、速度が初期版の2.5倍に向上し、新モデルサポート、LoRA対応、並列処理の強化など多くの改善を実現しました。
SGLangが超長コンテキスト推論のために高度に最適化されたPipeline Parallelism(PP)を実装し、DeepSeek-V3.1で3.31倍のPrefillスループット向上、TTFTを最大67.9%削減、強スケーリング効率8
AMD GPUでFP4量子化モデルを効率的に実行するためのGPUカーネル集「Petit」を開発し、Llama 3.3 70Bモデルで1.74倍の推論性能向上を実現しました。
SGLangがThinking Machines Labのbatch-invariant演算子を基に完全な決定論的推論を実現し、slimeと協力して100%再現可能なRL訓練を可能にしました。CUDA graphs有効時で2.8倍の高速化を
SGLangチームがGB200 NVL72上でDeepSeek V3/R1の推論性能を大幅に最適化し、FP8 attentionとNVFP4 MoEなどの技術により、H100と比較してプリフィル3.8倍、デコード4.8倍のスループット向上を
H20 GPUの特性を活かしたハードウェア認識型の並列化戦略と、カーネルレベルの最適化によって、DeepSeek-R1の大規模MoEモデルを効率的にデプロイする手法を紹介。ノードあたり16.5k入力トークン/秒、5.7k出力トークン/秒のS