Computer-Using Agent
OpenAI
앤트로픽에 이어 OpenAI도 컴퓨터 사용(computer use) 테스트 버전을 출시했다. 수치를 봐도 인간보다 많이 부족하다는 점을 확인할 수 있지만 (실제 데모를 봐도 그렇고), 전용 API가 없이 모든 종류의 소프트웨어나 웹에서 작업을 자동화 할 수 있는 방법이다. GUI가 새로운 API가 되는 것.
CUA(Computer-Using Agent)는 아직 초기 단계이고 한계가 있지만, 최신 벤치마크 결과를 새롭게 제시하여 전체 컴퓨터 사용 작업의 경우 OSWorld에서 38.1%의 성공률, 웹 기반 작업의 경우 WebArena에서 58.1%, WebVoyager에서 87%의 성공률을 달성했습니다. 이러한 결과는 CUA가 단일 일반 작업 공간을 사용하여 다양한 환경에서 탐색하고 운영할 수 있는 능력을 강조합니다.
답글 남기기