인공지능 참여의 아키텍처

How to Fix “AI’s Original Sin”
O’Reilly

생성형 인공지능 학습데이터의 권리와 귀속에 관한 오라일리의 글. 중앙집권적 시스템(OpenAI)을 떠올리지만, 이는 초기 온라인 정보 제공자(AOL, MS) 모델과 유사하며, 인공지능도 웹과 같은 아키텍처를 가지는 그림을 제시.

잠시 상상해보세요, AI가 월드 와이드 웹이나 리눅스와 같은 방식으로 작동하는 세상을. 기초 모델은 인간의 프롬프트를 이해하고 다양한 콘텐츠를 생성할 수 있습니다. 그러나 이들은 저작권 자료를 인식하고 이를 어떻게 다룰 수 있는지를 알고 있습니다. 중앙집중식 모델은 모든 것을 자유롭게 읽을 수 있는 것(세계 접근 권한)으로 훈련되어 있습니다. 다른 모델은 특정 그룹(회사나 조직, 사회, 국가 또는 언어 그룹 등)에 속한 콘텐츠를 기반으로 작동하며, 또 다른 모델은 개인의 고유한 콘텐츠를 기반으로 작동합니다.

이런 세상을 ChatGPT나 Claude 또는 대형 중앙집중식 모델 위에서 구축할 수도 있겠지만, 협력하는 소규모 분산 모델로 구축하는 것이 더 가능성이 큽니다. 웹이 AOL이나 마이크로소프트 네트워크 위에서 구축된 것이 아니라 협력하는 웹 서버들에 의해 구축된 것과 마찬가지입니다. 오픈 소스 AI 모델이 대형 중앙집중식 모델보다 더 위험하다고 들었지만, 그 혜택과 위험을 명확하게 평가하는 것이 중요합니다. 오픈 소스는 혁신뿐만 아니라 통제도 더 잘 가능하게 합니다. 콘텐츠 소유자가 AI 검색 제공자에게 자신의 저장소를 열어주되, 콘텐츠가 어떻게 다뤄지는지 그리고 특히 어떻게 수익화되는지에 대한 통제와 포렌식을 제공하는 오픈 프로토콜이 있다면 어떨까요?

유튜브의 콘텐츠ID를 언급하기도 한다. 그리고 자기네가 할 수 있다면 (이런 시스템을 구축하고자 하고 있음) 다른 사람들도 할 수 있다는 것을 알고 있다고 말한다.

코멘트

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다