3大モデル翻訳対決:第24週品質評価、passthroughが9点でリード

今週は 2425 件の翻訳タスクを 3 個のモデルが完了しました。3 件をサンプリングしてマルチモデル盲評比較を実施し、総合最優秀は:passthrough(平均点 9/10)。

今週の翻訳統計

モデル言語翻訳量平均所要時間平均品質スコア
deepseek-v4-flashen3411.9s未評価
claude-sonnet-4.6ja14738s未評価
native-englishen1-未評価
deepseek-v4-flashzh115.3s未評価
passthroughen22420s未評価

サンプリング比較評価

評価1:WordPress.comに新AIアシスタント追加:テキスト編集、スタイル調整、画像生成まで一通り対応

モデル正確性流暢性用語可読性総合点
passthrough99989
deepseek-v4-pro67776
gpt-o368787

passthrough

✓ 原文の核心内容を忠実に再現。例えば「make this section feel more modern or spacious」は自然言語の指示機能に直接対応しており、余計な追加はない。

✗ 末尾でテキストが切断されている。例えばblock themesリンク部分が不完全で、可読性に影響する。

deepseek-v4-pro

✓ 構造化されたリストが明確で、例えば小見出し「Analysis of the AI Assistant's Powerful Features」で機能説明を整理している。

✗ 原文にない内容を大量に追加。例えば冒頭の「In the field of content creation, the rapid advancement of AI technology is quietly changing how creators work」は過度な意訳と追加である。

gpt-o3

✓ 段落の繋がりが流暢で、例えばリスト項目に太字の小見出しを使って機能モジュールを区別しており、論理が明確。

✗ 同様に原文にない導入段落を追加しており、例えば「In the field of content creation...」は原文タイトルのニュース告知的性質から逸脱している。

結論:バージョンAが総合的に最も優れており、正確性と忠実度が最も高い。他の2バージョンはいずれも明らかな追加と原文からの逸脱の問題がある。

評価2:GoogleがChromeにAIスキルを追加、ワークフローの簡単保存を実現

モデル正確性流暢性用語可読性総合点
passthrough99989
deepseek-v4-pro67787
gpt-o368787

passthrough

✓ 用語の使用が自然かつ正確。例えば「Gemini AI into Chrome」は専門製品名に直接対応しており、追加の説明は不要

✗ 本文末尾が明らかに切断されている。例えば「For instance, Google suggests that if a user often asks Gemini to suggest vegan substitutions when looking at recipe websites, the」となっており内容が不完全

deepseek-v4-pro

✓ 「Highlights of the "Skills" Feature」などの小見出しを追加し、段落の階層がより明確

✗ 原文にない引用内容を追加。例えば「The launch of this feature marks another important milestone in the deep integration of AI and browsers.」— Technology Analyst は過度な追加である

gpt-o3

✓ 言葉遣いがやや流暢で、例えば「This feature is especially practical for users who frequently use AI for data processing or information retrieval」の表現が自然

✗ 同様に原文にない引用段落を追加。例えば「The launch of this feature marks another important milestone in the deep integration of AI and browsers.」— Technology analyst は原文から逸脱している

結論:バージョンAが総合的に最も原文に忠実かつ言葉遣いが自然で、BとCはいずれも明らかな追加内容の問題がある。Aを優先採用することを推奨。

評価3:MetaがAMD株10%を保有か:6ギガワットのチップ大型契約がAI野心を後押し

モデル正確性流暢性用語可読性総合点
passthrough99989
deepseek-v4-pro68777
gpt-o368777

passthrough

✓ 原文ニュースの事実を正確かつ忠実に再現。例えば「AMD's chief executive Lisa Su said that "each gigawatt of compute is worth double-digit billions"」は原意に直接対応し、追加なし

✗ 末尾の文「The terms of the warrant a」が明らかに切断され、完全性に影響

deepseek-v4-pro

✓ 「Deal Details: 6-Gigawatt Chip Supply and Equity Exchange」などの小見出しを構造的に追加し、論理階層が比較的明確

✗ 原文にない説明を過度に追加。例えば「performance approaching NVIDIA's H100 and Blackwell series」は過度な意訳である

gpt-o3

✓ 小見出し「Deal Details Emerge」により段落の繋がりがより自然

✗ 同様に「performance approaching NVIDIA's H100 and Blackwell series」など原文にない内容を追加しており、忠実性原則から逸脱

結論:バージョンAが総合的に最優秀で、正確性と流暢性が最も高く、基準翻訳として適している。BとCは可読性がやや高いものの、明らかな過度の追加内容が存在し、厳密な翻訳としては推奨されない