株式会社TIMEWELLの濱本です。
米OpenAIが3月12日(日本時間)に、開発者向け機能「Responses API」と「Agents SDK」を発表しました。この発表は、AIエージェントの開発において重要な転換点となるでしょう。この記事では、発表された2つのツールについて解説します。
新機能の開発の背景 新しいAPIプリミティブ「Responses API」 オープンソースのSDK「Agents SDK」 まとめ 新機能の開発の背景
OpenAIは今年、ChatGPTにおいて2つのエージェントを公開しています。1つ目は、ウェブを閲覧してユーザーに代わってタスクを実行する「WebGPT」です。2つ目は、ユーザーが指定したトピックについて詳細なレポートを作成する「DeepResearch」です。これらのエージェントに対するフィードバックは非常に良好でしたが、OpenAIはさらに進んで、これらのツールをAPIを通じて開発者に提供することを目指していました。
過去数ヶ月間、OpenAIは世界中の開発者と協力し、エージェント構築を容易にする方法について意見を交換してきました。その結果、モデルは複雑なマルチステップのワークフローを処理できる準備が整っているが、開発者は異なるソースからさまざまな低レベルのAPIを組み合わせる必要があり、困難で時間がかかり、脆弱に感じられることが多いという課題も明らかになりました。
そこで今回発表された「Responses API」と「Agents SDK」は、これらの課題を解決し、エージェント開発をより容易にすることを目的としています。
新しいAPIプリミティブ「Responses API」
「Responses API」は、OpenAIの組み込みツールを活用してエージェントを構築するための新しいAPIプリミティブです。この API は、Web検索、ファイル検索、コンピュータの使用などの新しい組み込みツールをサポートしています。
新しく導入された組み込みツールは以下の3つです。
Web Search Tool:モデルがインターネットから最新の情報にアクセスできるようにし、応答の内容を最新のものにします。API の Web 検索は、ChatGPT 検索で使用されているのと同じモデルによって実行されます。短い事実の質問に対する LLM の回答精度を評価するベンチマークである SimpleQA では、GPT-4o 検索プレビューと GPT-4o ミニ検索プレビューのスコアはそれぞれ 90% と 88% を記録しました。
File Search Tool:開発者がドキュメントをアップロードし、埋め込むことができ、関連する情報を簡単に検索できます。このファイル検索ツールは、カスタマーサポートエージェントがFAQに簡単にアクセスできるようにしたり、法律アシスタントが過去の事例をすばやく参照して資格のある専門家に問い合わせたり、コーディングエージェントが技術文書を照会するのを支援したりするなど、さまざまな実際の使用例に使用できます。
Computer Use Tool:仮想マシンやレガシーアプリケーションなど、APIアクセスのないグラフィカルユーザーインターフェースを備えたコンピューターを制御できます。このコンピュータ使用ツールを使用して、Webアプリの品質保証やレガシーシステム全体でのデータ入力タスクの実行など、ブラウザベースのワークフローを自動化することができます。
オープンソースのSDK「Agents SDK」
さらにOpenAIはオープンソースのSDK「Agents SDK」を発表しました。これは、以前に実験的に公開されていた「Swarm」を生産性の高いものに進化させたもので、エージェントオーケストレーションを容易にします。
このSDKには、明確な指示と組み込みツールで簡単に構成できるエージェント機能や、エージェント間で制御をインテリジェントに転送するハンドオフ機能などが含まれています。
そのため、「Agents SDK」を使用すると、顧客サポートエージェントなどの複雑なアプリケーションを、リファンド処理や請求関連の処理など、複数のエージェントに分割して構築でき流ため、顧客サポートの自動化、多段階の調査、コンテンツ生成、コードレビュー、販売見込み調査など、さまざまな実際のアプリケーションに適しています。
まとめ
OpenAIは、Chat Completions APIのサポートを継続しつつ、Responses APIを通じて新しい機能を提供していく予定です。また、Assistance APIの機能をResponses APIに統合し、移行ガイドを提供することで、開発者がスムーズに移行できるようサポートします。
2025年はエージェントの年になるでしょう。ChatGPTとOpenAIの開発者ツールが、単なる質問への回答からユーザーに代わって実世界でタスクを実行するようになるのです。OpenAIは今後も強力な新しいモデルを構築し、より優れたエージェントの構築に役立つ強力なツールを提供し続けます。AIエージェントの新時代の幕開けに期待です。
参考:https://openai.com/index/new-tools-for-building-agents/ https://www.youtube.com/watch?v=hciNKcLwSes&t=1s
