HYSONG

오픈AI, 컴퓨터 사용 에이전트

작성자

in"의 한국어 번역은 "안"입니다.

앤트로픽에 이어 OpenAI도 컴퓨터 사용(computer use) 테스트 버전을 출시했다. 수치를 봐도 인간보다 많이 부족하다는 점을 확인할 수 있지만 (실제 데모를 봐도 그렇고), 전용 API가 없이 모든 종류의 소프트웨어나 웹에서 작업을 자동화 할 수 있는 방법이다. GUI가 새로운 API가 되는 것.

CUA(Computer-Using Agent)는 아직 초기 단계이고 한계가 있지만, 최신 벤치마크 결과를 새롭게 제시하여 전체 컴퓨터 사용 작업의 경우 OSWorld에서 38.1%의 성공률, 웹 기반 작업의 경우 WebArena에서 58.1%, WebVoyager에서 87%의 성공률을 달성했습니다. 이러한 결과는 CUA가 단일 일반 작업 공간을 사용하여 다양한 환경에서 탐색하고 운영할 수 있는 능력을 강조합니다.

오픈AI, 컴퓨터 사용 에이전트

코멘트

답글 남기기

더 많은 게시물

AI슬롭 바이럴

코드커팅의 둔화 신호

유튜브의 AI 연령 추정

챗봇에 비밀을 유출하는 직원들