Meta Llama 3.2が登場:初のオープンソース視覚言語モデルがAIの地形を変える
Meta AIチームがLlama 3.2シリーズを発表し、オープンソースAIが多モーダル時代に突入。視覚と言語を統合したモデルで、画像理解や視覚推論をサポートし、エッジデバイスでの展開に大きな潜在力を持つ。
Meta AIチームがLlama 3.2シリーズを発表し、オープンソースAIが多モーダル時代に突入。視覚と言語を統合したモデルで、画像理解や視覚推論をサポートし、エッジデバイスでの展開に大きな潜在力を持つ。
エロン・マスク氏が、AGIが人間の価値観と整合しない場合に「壊滅的な災害」を引き起こす可能性があると警告し、AIの安全性とオープンソース化の必要性を訴えた。この発言は業界内で大きな議論を巻き起こしている。
中国のAIスタートアップDeepSeek AIが新たに公開したDeepSeek-V3チャットモデルは、AnthropicのClaude 3.5 Sonnetに迫る性能を持ち、完全に無料でオープンソースとして提供されています。この発表は中国A
最新の研究により、AI生成コンテンツに対する「透かし」技術が簡単に除去可能であることが明らかになり、技術の限界や偽ニュース、コンテンツ乱用、規制に関する激しい議論が巻き起こっています。
最近、xAIのGrok-2ビジュアルモデルが画像生成機能を正式にリリースし、AIコミュニティで大きな話題を呼んでいます。Grok-2は画像のリアリティと細部の処理において優れたパフォーマンスを示し、Elon Muskも生成した画像をシェアし
OpenAIは新たにo1-previewとo1-miniモデルを発表し、AIの内部推論プロセス「推論チェーン」を初めて公開しました。この技術革新はAIの思考過程を人間のように段階的に展開し、AIの透明性を高める重要な一歩となっています。
アリババクラウドのQwen2.5-MaxモデルがArena-Hardランキングでトップに立ち、GPT-4oを超えたことで、AI業界において大きな話題となっています。この成果は、中国のAIが性能面で重要な突破を果たしたことを示し、128Kの超
7月24日、Meta AIはLlama 3.1シリーズのオープンソース大規模言語モデルを発表し、その中で405Bパラメータのフラッグシップ版が業界の認識を一新する驚異的な性能を示しました。このモデルは、GPT-4oやClaude 3.5 S
AnthropicはClaude 3.5 Sonnetモデルを発表し、このモデルはSWE-bench Verified基準テストで49%のスコアを達成し、OpenAIのGPT-4oを約20%リードしました。このニュースは開発者コミュニティで
xAIは、Colossusスーパーコンピューターの稼働開始を発表しました。これは10万枚のNVIDIA H100 GPUを搭載し、Grok-3の大規模言語モデル訓練に活用されます。
OpenClawは低コストで高精度なAIロボットアームのオープンソースプロジェクトで、短期間で大きな注目を集めています。プロジェクトは、AIハードウェアの民主化の典型として評価され、DIYロボットエコシステムを再構築しています。
AI技術の進化により、従来10年以上かかっていた新薬開発プロセスが大幅に短縮される可能性があると注目されていますが、臨床試験や規制の壁が依然として大きな課題となっています。この記事では、AIが薬物開発に与える影響を客観的に分析します。
AIエージェントの急速な発展に伴い、トークン消費が開発者の課題となっています。Shopify創設者のTobi Lütkeが開発したqmdツールは、ローカルで実行されるセマンティック検索エンジンで、トークン使用量を10分の1にし、オフラインで
OpenAIのCEOであるサム・アルトマンは、2025年に一般人工知能(AGI)が到来する可能性があると予測し、AI安全への投資の重要性を強調しました。この発言はAIコミュニティで大きな議論を巻き起こし、技術革新とリスク管理の重要性が再認識
欧州連合議会は、世界初の包括的なAI規制フレームワークである「人工知能法案」(EU AI Act)を可決しました。これにより、高リスクAIシステムは厳格なリスク評価が求められることとなり、一般AIモデルもトレーニングデータとシステム能力の開
Claude 3.5 SonnetがSWE-bench基準テストでGPT-4oを超える成果を上げ、AIコード生成分野で注目を集めています。強化学習を活用したこのモデルは、開発者にとってより信頼性の高いプログラミングアシスタントとしての地位を
快手科技はKling AIの1.5バージョンを発表し、1080pの高画質ビデオ生成が可能となり、最長2分の動画が作成できるようになりました。この新機能はOpenAIのSoraモデルと比較されるほどの動的な一貫性を持ち、AI動画生成ツールの普
DeepSeekチームは、236億パラメータで16GBのVRAMのみで効率的に推論できる大規模言語モデルDeepSeek-V2を発表しました。このモデルは数学ベンチマークでMetaのLlama3を上回り、中国のAI業界における大きな突破口と
イーロン・マスクがOpenAIをオープンソースの理念を捨て、利益追求の商業マシンになったと批判し、AI界での論争が再燃。OpenAIのサム・アルトマンは安全性を理由に反論し、AIのオープンソースと商業化をめぐる深い議論が続いている。
Meta AIはLlama 3.2シリーズのビジョンモデルをオープンソースとして公開しました。これは、Llamaシリーズが初めて大規模なビジョン機能を導入し、エッジデバイスでの効率的な動作を可能にするものです。