Computer Useとは、AIモデルがコンピュータの画面を「見て」、マウスクリックやキーボード入力を通じてソフトウェアを直接操作する能力です。

API経由のツール呼び出しとは異なり、Computer Useは人間がGUIを操作するのと同じ方法でアプリケーションを制御します。スクリーンショットを解析してUI要素を認識し、座標指定でクリックやテキスト入力を行います。

2026年3月時点で、GPT-5.4がOSWorld-Verifiedベンチマークで75.0%を達成し、人間のベースライン(72.4%)を初めて超えました。Claude Opus 4.6も72.7%で人間と同等の水準に達しています。

RPA(ロボティック・プロセス・オートメーション)の代替や、API未提供のレガシーアプリケーションの自動操作など、実務での活用が急速に広がっています。