Blog

  • 컴퓨터를 사용하는 AI

    클로드에서 출시한 컴퓨터 이용(computer use) 기능. 인공지능이 브라우징, 클릭, 텍스트 입력을 수행할 수 있게 되면서 AI 에이전트가 일반화 될 것이라고 본다. 프로그래밍에서와 유사하게 속도가 느리고 보안 문제가 발생할 가능성은 있지만 다양한 솔루션으로 발전할 거라고 예상한다.

  • EU 개인정보 보호와 메타

    EDPB opinion on AI models: GDPR principles support responsible AI
    European Data Protection Board

    이제는 관심을 더 가지려고 하지만 보던게 있어 보게되는 유럽 규제 사례. 작년 7월 메타는 개인정보보호법 적용이 명확하지 않아 최신 오픈소스 언어모델(Llama) 출시를 하지 않는다고 했으나, EU는 24년 말 지침에 관해 이야기했다. 규제의 문제라고 할 수 있는 것들, 명확하게 설명하는 것이 느리고 규정이 모호한 부분이 많다는 점. 아래는 기계 요약

    1. AI 모델이 익명으로 간주될 수 있는 기준
      AI 모델이 익명성(Anonymity)을 갖추려면 개인을 직접 또는 간접적으로 식별할 가능성이 매우 낮아야 한다.
      또한, 사용자의 쿼리를 통해 개인 데이터를 추출할 가능성도 매우 낮아야 한다.
      익명성을 입증하기 위한 방법에 대한 비규범적(non-prescriptive)이고 포괄적이지 않은(non-exhaustive) 예시 목록이 제공됨.
    2. AI 모델 개발 및 배포 시 ‘정당한 이익(Legitimate Interest)’을 법적 근거로 사용할 수 있는지
      AI 모델이 개인 데이터를 처리할 때 ‘정당한 이익’을 법적 근거로 인정받을 수 있는지 여부는 사례별로 평가해야 한다.
      평가를 위한 3단계 테스트가 제시되었으며, 대화형 AI 및 사이버 보안 강화 AI 같은 경우 사용자에게 이익이 되는 서비스라면 ‘정당한 이익’을 기반으로 운영될 수도 있음.
      단, 데이터 처리가 ‘엄격히 필요’하다는 점을 입증해야 하며, 개인의 권리와 이익의 균형을 맞춰야 한다.
    3. AI 모델이 사용자의 개인 데이터를 처리할 수 있는지에 대한 기준
      사용자가 자신의 데이터가 AI 모델에 의해 사용될 것이라고 ‘합리적으로 예상할 수 있는지’를 평가하는 기준을 제시함.
      개인 데이터가 공개적으로 이용 가능한 정보인지 여부
      데이터가 어떤 맥락에서 수집되었으며, 이후 어떻게 활용될 가능성이 있는지
      개인이 자신의 데이터가 온라인에 공개되어 있다는 사실을 알고 있는지
    4. 불법적으로 수집된 데이터로 개발된 AI 모델의 적법성
      AI 모델이 불법적으로 수집된 개인 데이터를 활용해 개발되었다면, 해당 모델의 사용이 적법하지 않을 수 있다.
      단, 모델이 완전히 익명화되었다면 이러한 문제를 회피할 수 있음.

  • 아폴로, 동영상 이해 모델

    Apollo: An Exploration of Video Understanding in Large Multimodal Models

    대규모 멀티모달 모델(LMM)에서 비디오 이해에 초점을 맞춘 모델 아폴로. 1시간 분량의 동영상을 효율적으로 인식할 수 있다고 말한다. 아래는 초록.

    대규모 멀티모달 모델(LMM)에 비디오 인식 기능을 빠르게 통합했음에도 불구하고, 비디오 이해를 주도하는 기본 메커니즘은 여전히 ​​잘 이해되지 않았습니다. 결과적으로 이 도메인의 많은 설계 결정은 적절한 정당화나 분석 없이 내려집니다. 이러한 모델을 훈련하고 평가하는 데 드는 높은 연산 비용과 제한된 공개 연구가 결합되어 비디오 LMM의 개발을 방해합니다. 이를 해결하기 위해 LMM에서 비디오 이해를 효과적으로 주도하는 요소를 파악하는 데 도움이 되는 포괄적인 연구를 제시합니다. 비디오 LMM 연구와 관련된 높은 연산 요구 사항에 대한 주요 기여 요인을 비판적으로 검토하고, 더 작은 모델과 데이터 세트(최대 임계 크기)에서 내린 설계 및 훈련 결정이 더 큰 모델로 효과적으로 전환되는 스케일링 일관성을 발견합니다. 이러한 통찰력을 활용하여 비디오 샘플링, 아키텍처, 데이터 구성, 훈련 일정 등을 포함한 비디오 LMM의 많은 비디오 관련 측면을 탐구했습니다. 예를 들어, 훈련 중 fps 샘플링이 균일한 프레임 샘플링보다 훨씬 바람직하고 어떤 비전 인코더가 비디오 표현에 가장 적합한지 보여주었습니다. 이러한 결과를 바탕으로 다양한 모델 크기에서 우수한 성능을 달성하는 최첨단 LMM 제품군인 Apollo를 소개합니다. 당사 모델은 1시간 분량의 비디오를 효율적으로 인식할 수 있으며, Apollo-3B는 LongVideoBench에서 인상적인 55.1을 기록하여 대부분의 기존 7B 모델을 앞지릅니다. Apollo-7B는 MLVU에서 70.9, Video-MME에서 63.3을 기록한 7B LMM과 비교했을 때 최첨단입니다.

  • 인스타의 비디오 생성기

    링크

    인스타그램은 메타의 비디오 생성기를 통합할 예정으로, 링크에서 보는 것 같은 기능을 선보인다.

  • 동영상 모델 비교

    Google의 새로운 동영상 생성기인 Veo 2, OpenAI의 Sora보다 앞서 있다고 평가받는다. 레딧에 올라온 여러 동영상 생성기 비교 영상

  • 미국 10대의 소셜미디어 이용 통계

    Teens, Social Media and Technology 2024
    Pew Research

    좀 하락한 소셜 미디어도 있으나 유튜브, 틱톡, 인스타그램, 스냅챗이 여전하다.

    A line chart showing that YouTube, TikTok, Instagram and Snapchat top the list for teens
  • TV에서 유튜브 소비 통계

    Smash that replay button: A 2024 recap of YouTube on TV
    YouTube Blog

    유튜브는 TV에서의 콘텐츠 소비에 대한 몇 가지 통계를 공개했다.

    • 전 세계적으로 시청자들은 하루에 10억 시간 이상의 콘텐츠를 TV에서 스트리밍했다.
    • TV에서 스포츠 콘텐츠 시청 시간이 전년 대비 30% 이상 증가했다.
    • 거실 기기(예: TV)에서 매달 4억 시간 이상의 팟캐스트가 시청되었다.
    • 유튜브에 업로드된 4K 영상 비율이 전년 대비 35% 이상 증가했다.
    • TV에서 대부분의 수익을 창출하는 크리에이터 수가 전년 대비 30% 이상 증가했다.
    • 초기 테스트 결과, TV에서 직접 구독할 수 있는 버튼 추가 후 순 구독자 수가 40% 이상 증가했다.
  • 소셜앱 Mozi

    Making “Social” Social Again
    Medium

    에반 윌리엄스가 출시했다는 새로운 소셜 서비스. 그는 블로거, 트위터, 미디엄의 창립자이다. 모지는 “아는 사람과 같은 장소(도시 또는 이벤트)에 있을 때 알려줍니다”라는게 모토이다.

    Mozi의 주요 가치 제안(오늘날)은 간단합니다. 아는 사람과 같은 장소(도시 또는 이벤트)에 있을 때 알려줍니다. 그리고 목표는 간단합니다. 더 자주—그리고 
    직접— 당신이 아끼는 사람들과 연결하는 것입니다.

    소셜 서비스가 성공할 수 있는건 단순 아이디어는 아닌 것 같다. 어려운 시장. BeReal의 사례도 그렇지만 과거 Dopplr라는 서비스도 있었다.

  • 광고 산업, 창의성에서 기술로

    Sorry, Mad Men. The Ad Revolution Is Here.
    WSJ

    과거 광고 업계는 창의성과 감성적 접근을 기반으로 한 ‘Mad Men(매드맨, 1960년대 전통 광고인들)’의 시대였지만, 현재는 AI, 알고리즘, 데이터 분석을 활용한 ‘Math Men & Women’ 시대로 변모하고 있다고 말한다.

    “우리가 원하든 원하지 않든, ‘Mad Men’ 시대는 우리의 백미러 속에서 점점 멀어지고 있으며, 우리는 전속력으로 ‘Math Men과 Women’의 시대를 향해 달려가고 있습니다.”라고 디지털 미디어 베테랑이자 인터퍼블릭 이사회 멤버인 존 밀러(Jon Miller)는 말했다.

  • 사전학습 시대의 끝

    (당연한 이야기처럼 보이지만) 그는 사전 학습이 AI 발전을 주도했지만, 컴퓨팅의 성장에도 불구하고 데이터 성장의 한계로 인해 궁극적으로 끝날 것이라고 예측했다. 아래는 기계요약

    Ilya Sutskever: Sequence to Sequence Learning with Neural Networks at NeurIPS 2024 – 5가지 핵심 요약

    1. 딥러닝의 발전과 확장
      Ilya Sutskever는 10년 전 NeurIPS 2014에서 발표했던 연구를 되돌아보며, 대규모 신경망과 데이터가 성능을 보장한다는 “스케일링 가설”이 실제로 유효했음을 강조했다. 초기에는 10층짜리 신경망을 사용하여 인간이 순간적으로 수행할 수 있는 작업을 재현하는 것을 목표로 삼았으며, 현재는 이를 넘어 초대형 신경망과 사전 학습(pre-training)이 AI 발전의 핵심이 되었다고 평가했다.
    2. Auto-Regressive 모델과 기계 번역
      그의 연구는 Auto-Regressive 모델을 통해 다음 토큰을 효과적으로 예측하면 올바른 확률 분포를 포착할 수 있다는 개념을 발전시켰다. 이를 기반으로 초기 신경망 번역 모델이 등장했으며, 이후 Transformer 모델이 발전하면서 자연어 처리의 핵심 기술이 되었다.
    3. 사전 학습의 한계와 미래 전망
      그는 사전 학습이 AI 발전을 주도했지만, 데이터 성장의 한계로 인해 궁극적으로 끝날 것이라고 예측했다. 인터넷에 존재하는 데이터는 유한하며, AI가 학습할 새로운 데이터가 부족해질 가능성이 높다. 이에 따라 “Synthetic Data(합성 데이터)”, “Inference-time Computation(추론 시 계산)”, “AI Agents(자율 에이전트)”와 같은 새로운 연구 방향이 필요하다고 제안했다.
    4. 초지능(Superintelligence)과 AI의 예측 불가능성
      현재 AI 모델은 매우 뛰어난 성능을 보이지만 여전히 불완전하며, 진정한 의미의 ‘에이전트(agentic)’가 아니다. 그러나 앞으로는 AI가 실제로 추론(reasoning)을 수행하고, 자기 인식(self-awareness)을 갖춘 시스템으로 발전할 가능성이 있다. 그는 AI가 논리적으로 사고할수록 예측이 어려워질 것이며, 결국 인간보다 더 높은 수준의 지능을 가지게 될 것이라고 주장했다.
    5. AI의 인권과 존재 방식에 대한 철학적 논의
      AI가 인간과 공존하는 방식, 나아가 AI에게 권리를 부여할 것인가에 대한 논의가 필요하다고 강조했다. 현재로서는 AI가 독립적인 존재로 성장할 것인지, 인간과 어떤 관계를 맺을 것인지 예측하기 어려우나, 사회적, 철학적, 정책적 논의가 활발하게 이루어져야 한다고 지적했다.