3大モデル翻訳対決：第24週品質評価、passthroughが9点でリード

2026年6月8日 414 約7分 Translation Quality Report

翻译质量 AI模型对比 passthrough deepseek-v4-pro gpt-o3

今週は 2425 件の翻訳タスクを 3 個のモデルが完了しました。3 件をサンプリングしてマルチモデル盲評比較を実施し、総合最優秀は：passthrough（平均点 9/10）。

今週の翻訳統計

モデル	言語	翻訳量	平均所要時間	平均品質スコア
deepseek-v4-flash	en	34	11.9s	未評価
claude-sonnet-4.6	ja	147	38s	未評価
native-english	en	1	-	未評価
deepseek-v4-flash	zh	1	15.3s	未評価
passthrough	en	2242	0s	未評価

サンプリング比較評価

評価1：WordPress.comに新AIアシスタント追加：テキスト編集、スタイル調整、画像生成まで一通り対応

モデル	正確性	流暢性	用語	可読性	総合点
passthrough	9	9	9	8	9
deepseek-v4-pro	6	7	7	7	6
gpt-o3	6	8	7	8	7

passthrough

✓ 原文の核心内容を忠実に再現。例えば「make this section feel more modern or spacious」は自然言語の指示機能に直接対応しており、余計な追加はない。

✗ 末尾でテキストが切断されている。例えばblock themesリンク部分が不完全で、可読性に影響する。

deepseek-v4-pro

✓ 構造化されたリストが明確で、例えば小見出し「Analysis of the AI Assistant's Powerful Features」で機能説明を整理している。

✗ 原文にない内容を大量に追加。例えば冒頭の「In the field of content creation, the rapid advancement of AI technology is quietly changing how creators work」は過度な意訳と追加である。

gpt-o3

✓ 段落の繋がりが流暢で、例えばリスト項目に太字の小見出しを使って機能モジュールを区別しており、論理が明確。

✗ 同様に原文にない導入段落を追加しており、例えば「In the field of content creation...」は原文タイトルのニュース告知的性質から逸脱している。

結論：バージョンAが総合的に最も優れており、正確性と忠実度が最も高い。他の2バージョンはいずれも明らかな追加と原文からの逸脱の問題がある。

評価2：GoogleがChromeにAIスキルを追加、ワークフローの簡単保存を実現

モデル	正確性	流暢性	用語	可読性	総合点
passthrough	9	9	9	8	9
deepseek-v4-pro	6	7	7	8	7
gpt-o3	6	8	7	8	7

passthrough

✓ 用語の使用が自然かつ正確。例えば「Gemini AI into Chrome」は専門製品名に直接対応しており、追加の説明は不要

✗ 本文末尾が明らかに切断されている。例えば「For instance, Google suggests that if a user often asks Gemini to suggest vegan substitutions when looking at recipe websites, the」となっており内容が不完全

deepseek-v4-pro

✓ 「Highlights of the "Skills" Feature」などの小見出しを追加し、段落の階層がより明確

✗ 原文にない引用内容を追加。例えば「The launch of this feature marks another important milestone in the deep integration of AI and browsers.」— Technology Analyst は過度な追加である

gpt-o3

✓ 言葉遣いがやや流暢で、例えば「This feature is especially practical for users who frequently use AI for data processing or information retrieval」の表現が自然

✗ 同様に原文にない引用段落を追加。例えば「The launch of this feature marks another important milestone in the deep integration of AI and browsers.」— Technology analyst は原文から逸脱している

結論：バージョンAが総合的に最も原文に忠実かつ言葉遣いが自然で、BとCはいずれも明らかな追加内容の問題がある。Aを優先採用することを推奨。

評価3：MetaがAMD株10%を保有か：6ギガワットのチップ大型契約がAI野心を後押し

モデル	正確性	流暢性	用語	可読性	総合点
passthrough	9	9	9	8	9
deepseek-v4-pro	6	8	7	7	7
gpt-o3	6	8	7	7	7

passthrough

✓ 原文ニュースの事実を正確かつ忠実に再現。例えば「AMD's chief executive Lisa Su said that "each gigawatt of compute is worth double-digit billions"」は原意に直接対応し、追加なし

✗ 末尾の文「The terms of the warrant a」が明らかに切断され、完全性に影響

deepseek-v4-pro

✓ 「Deal Details: 6-Gigawatt Chip Supply and Equity Exchange」などの小見出しを構造的に追加し、論理階層が比較的明確

✗ 原文にない説明を過度に追加。例えば「performance approaching NVIDIA's H100 and Blackwell series」は過度な意訳である

gpt-o3

✓ 小見出し「Deal Details Emerge」により段落の繋がりがより自然

✗ 同様に「performance approaching NVIDIA's H100 and Blackwell series」など原文にない内容を追加しており、忠実性原則から逸脱

結論：バージョンAが総合的に最優秀で、正確性と流暢性が最も高く、基準翻訳として適している。BとCは可読性がやや高いものの、明らかな過度の追加内容が存在し、厳密な翻訳としては推奨されない

3大モデル翻訳対決：第24週品質評価、passthroughが9点でリード

今週の翻訳統計

サンプリング比較評価

評価1：WordPress.comに新AIアシスタント追加：テキスト編集、スタイル調整、画像生成まで一通り対応

passthrough

deepseek-v4-pro

gpt-o3

評価2：GoogleがChromeにAIスキルを追加、ワークフローの簡単保存を実現

passthrough

deepseek-v4-pro

gpt-o3

評価3：MetaがAMD株10%を保有か：6ギガワットのチップ大型契約がAI野心を後押し

passthrough

deepseek-v4-pro

gpt-o3

関連記事