생성 인공지능의 2막


Generative AI’s Act Two
SEQUOIA

여러 불확실성에도 불구하고 생성 인공지능은 이미 스타트업에서만 10억 달러 이상의 매출을 올리며 SaaS보다 성공적인 출발을 보였다고 평가한다. 1) 생성 인공지능이 대세이며, 2) 킬러 앱(ChatGPT)이 등장해 가장 빠르게 1억 MAU에 도달했으며, 3) 개발자 엑세스가 이루어지고, 4) 폼 팩터가 진화하고 있다. 하지만 문제는 실질적인문제는 가치를 입증해야 한다는 점이라고 말한다. 1달 리텐션에서 기존 앱이 평균 63%라면, 인공지능 기업의 평균은 42%에 지나지 않는다.

그래서 다양한 개발 스택이 등장하고 새로운 제품의 청사진이 등장하고 있다고 말한다.

  • 생각의 사슬, 생각의 나무, 반사와 같은 새로운 추론 기법은 더 풍부하고 복잡한 추론 작업을 수행할 수 있는 모델의 능력을 향상시켜 고객의 기대와 모델 기능 사이의 격차를 좁히고 있습니다. 개발자들은 Langchain과 같은 프레임워크를 사용하여 더 복잡한 멀티체인 시퀀스를 호출하고 디버깅하고 있습니다.
  • 특히 최근 GPT-3.5 및 Llama-2에 대한 미세 조정이 가능해짐에 따라 RLHF 및 미세 조정과 같은 전이 학습 기법에 대한 접근성이 높아지고 있으며, 이는 기업이 특정 도메인에 맞게 기초 모델을 조정하고 사용자 피드백을 통해 개선할 수 있다는 것을 의미합니다. 개발자들은 허깅 페이스에서 오픈 소스 모델을 다운로드하고 이를 미세 조정하여 우수한 성능을 달성하고 있습니다.
  • 검색 증강 세대는 비즈니스 또는 사용자에 대한 컨텍스트를 가져와 환각을 줄이고 진실성과 유용성을 높이고 있습니다. Pinecone과 같은 회사의 벡터 데이터베이스는 RAG의 인프라 중추가 되었습니다.
  • 새로운 개발자 도구와 애플리케이션 프레임워크는 기업이 재사용 가능한 빌딩 블록을 통해 고급 AI 애플리케이션을 만들고, 개발자가 운영 중인 AI 모델의 성능을 평가, 개선 및 모니터링할 수 있도록 지원하며, 여기에는 랭스미스웨이트 앤 바이어스 같은 LLMOps 도구도 포함됩니다.
  • CoreweaveLambda LabsFoundryReplicateModal과 같은 AI 우선 인프라 기업은 퍼블릭 클라우드의 번들링을 해제하고 AI 기업이 가장 필요로 하는 것, 즉 합리적인 비용으로 온디맨드 방식으로 사용할 수 있고 확장성이 뛰어난 풍부한 GPU와 우수한 PaaS 개발자 환경을 제공하고 있습니다.

관련 서비스가 다양하게 등장하며 자체적으로 비즈니스모델을 만들고 이용하기 쉬운 환경을 만들고 있지만, 아직까지는 여전히 돈이 꽤 드는 작업이라 서비스 개발이 아닌 연구쪽에서는 어떻게 활용할 수 있을지 감이 잘 오지 않는다.