中国のテック企業、アリババグループが開発した人工知能(AI)モデル「Qwen2.5 Coder」が、米国のOpenAIやAnthropicといった競合他社の先進的なモデルに匹敵するコーディング能力を持つことが明らかになりました。これは、中国のテック企業がオープンソースモデルでアメリカ企業と互角に渡り合っていることを示しています。
アリババクラウドコンピューティング部門からリリースされたこの最新のオープンソース大規模言語モデル(LLM)は、人間による評価やEvalPlus、Aiderといった評価基準でOpenAIのGPT-4oやAmazon.com支援のAnthropicのClaude 3.5 Sonnetを凌駕しました。声明によれば、12項目中9項目でQwen2.5 Coderは他のモデルよりも優れたパフォーマンスを示したとされています。
これまで、オープンソースLLMは一般的にOpenAIやAnthropicなどのプロプライエタリ(非公開)モデルに比べてコーディング能力が劣るとされていました。しかし今回、このギャップが埋まりつつあることが示されました。さらに、研究者や開発者は特定用途向けにオープンソースモデルを活用する傾向が強まっています。
Meta Platforms(Facebook親会社)は今月、自社のLlamaオープンソースモデルを米国政府機関に提供し、防衛・国家安全保障分野で利用できるようにすると発表しました。この動きは米中技術競争にも影響を与えています。Metaによれば、中国など他国も独自のオープンソースモデル開発へ向けた投資を加速させており、米国を凌ぐために努力しているとのことです。
Qwen2.5 Coderは多様で膨大なトレーニングデータから成り立っており、その一部には92ものプログラミング言語から成るGitHub上のコードリポジトリも含まれています。また、中国ではアリババ以外にも百度やByteDance(TikTok運営会社)がAIモデル分野への進出を果たしています。百度は最近、自然言語でプログラム作成可能なツール「Miaoda」を発表し、一方ByteDanceは100以上ものプログラミング言語対応可能な「MarsCode」を提供しています。
この記事はSouth China Morning Post (SCMP) に初掲載されたものです。SCMPは中国とアジアについて最も信頼性ある報道機関として知られています。
Source link
GIPHY App Key not set. Please check settings