Blog

  • 추론 모델의 강점과 한계

    The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity
    Apple

    연구는 추론하는 AI 모델들이 실제로는 진짜 추론을 하는 게 아닐 수 있다는 중요한 의문을 제기. 겉보기에는 복잡한 사고 과정을 보여주지만, 실제로는 패턴 매칭이나 기억된 해법을 재조합하는 수준일 가능성을 시사함.

    최근 최첨단 언어 모델들은 답변을 제공하기 전에 상세한 사고 과정을 생성하는 대형 추론 모델(LRM)을 도입했습니다. 이러한 모델들이 추론 벤치마크에서 향상된 성능을 보여주고 있지만, 그들의 근본적인 능력, 확장 특성, 그리고 한계는 여전히 충분히 이해되지 않고 있습니다. 현재의 평가는 주로 기존의 수학 및 코딩 벤치마크에 초점을 맞추고 있으며, 최종 답안의 정확성을 강조합니다. 그러나 이러한 평가 패러다임은 종종 데이터 오염 문제를 겪고 있으며, 추론 과정의 구조와 품질에 대한 통찰을 제공하지 못합니다. 본 연구에서는 일관된 논리적 구조를 유지하면서 구성적 복잡성을 정밀하게 조작할 수 있는 제어 가능한 퍼즐 환경을 활용하여 이러한 격차를 체계적으로 조사합니다. 이러한 설정은 최종 답안뿐만 아니라 내부 추론 과정의 분석을 가능하게 하여, LRM이 어떻게 “생각”하는지에 대한 통찰을 제공합니다. 다양한 퍼즐에 대한 광범위한 실험을 통해, 우리는 최첨단 LRM들이 특정 복잡도를 넘어서면 완전한 정확도 붕괴에 직면한다는 것을 보여줍니다. 더욱이, 이들은 직관에 반하는 확장 한계를 보입니다: 추론 노력이 문제 복잡도와 함께 어느 지점까지 증가하다가, 충분한 토큰 예산이 있음에도 불구하고 그 이후에는 감소합니다. 동등한 추론 계산 하에서 LRM을 표준 LLM 대응 모델과 비교함으로써, 우리는 세 가지 성능 영역을 식별했습니다: (1) 표준 모델이 놀랍게도 LRM을 능가하는 낮은 복잡도 작업, (2) LRM의 추가적인 사고가 이점을 보여주는 중간 복잡도 작업, (3) 두 모델 모두 완전한 붕괴를 경험하는 높은 복잡도 작업. 우리는 LRM이 정확한 계산에서 한계를 가지고 있음을 발견했습니다: 이들은 명시적인 알고리즘을 사용하지 못하고 퍼즐 전반에 걸쳐 일관성 없이 추론합니다. 또한 추론 과정을 더 깊이 조사하여, 탐색된 해결책의 패턴을 연구하고 모델의 계산 행동을 분석함으로써, 그들의 강점과 한계를 밝히고 궁극적으로 그들의 진정한 추론 능력에 대한 중요한 질문을 제기합니다.

  • 메타의 광고자동화

    Meta Aims to Fully Automate Ad Creation Using AI
    WSJ

    중소기업 광고주의 진입장벽과 최적화 부담을 낮추고 싶기 때문

    메타가 개발 중인 도구를 쓰면 이렇게 됩니다. 브랜드가 홍보할 제품 이미지와 예산 목표만 입력하면, AI가 이미지, 영상, 텍스트까지 포함한 광고 전체를 만들어냅니다. 여기서 끝이 아닙니다. 시스템이 어떤 페이스북, 인스타그램 사용자에게 보여줄지 결정하고 예산 배분 방안까지 제안해줄 예정이라고 관계자들은 설명했습니다.

    메타는 또 AI를 활용한 광고 개인화도 계획하고 있습니다. 같은 광고라도 사용자 위치 등에 따라 실시간으로 다른 버전을 보여주겠다는 겁니다. 예를 들어 눈 내리는 지역 사용자에게는 자동차가 산길을 오르는 장면을, 도심 지역 사용자에게는 시내를 달리는 장면을 보여주는 식입니다.

  • 지역 TV 뉴스, 지역사회의 공백을 메울 수 있을까

    Can They Do Good and Still Do Well? Local TV Stations and Communities’ Information Needs
    Shorenstein Center

    학술지에 정식 게재된 논문은 아니라 Harvard Kennedy School 산하 Shorenstein Center에서 발간한 Discussion Paper

    지난 20년간 미국 지역 신문의 쇠퇴는 지역 뉴스 보도에 상당한 공백을 만들어냈으며, 그 결과는 단순히 지역 신문의 부재나 축소를 넘어선다. 그 영향은 심각하여 시민 참여 감소, 정부 책임성 저하, 사회적 결속 약화로 이어지고 있다.

    지역 텔레비전 방송국을 대상으로 한 포괄적 조사에 기반해, 이 연구는 지역 TV 뉴스 매체들이 신문 쇠퇴로 생긴 정보 격차를 메우는 데 더 실질적인 역할을 담당할 수 있는지 조사했다. 연구 결과 그들이 그럴 수 있다는 것을 시사한다. 하지만 그들은 뿌리깊은 편집 관행과 빠듯한 예산을 포함한 상당한 장벽에 직면하고 있으며, 후자는 특히 중소 규모 시장의 방송국들에게 어려운 과제다—바로 신문 약화로 가장 많은 영향을 받은 지역들이다.

    지역 텔레비전 방송국들은 전통적으로 속보, 날씨, 범죄에 광범위하게 집중해왔다. 이는 검증된 마케팅 전략이다. 하지만 이 연구의 결과는 이것이 시청자를 끌어들이는 유일한 방법이 아님을 보여준다. 지역 거버넌스와 지역사회 이슈에 집중하는 것이 타당한 대안일 뿐만 아니라 강력한 대안으로 부상하고 있다. 뉴스 콘텐츠를 지역 거버넌스와 지역사회 이슈에 집중하는 방송국들이 대부분의 방송국들보다 더 좋은 성과를 보이고 있다.

    지역 TV 방송국들 사이에는 전통적 형태를 넘어 뉴스 제공을 다양화하는 추세가 있다. 뉴스 구성에 더 많은 기획, 지역사회, 탐사 저널리즘을 포함함으로써 방송국들은 지역사회 기여를 확대할 수 있다. 증거는 또한 그렇게 함으로써 경쟁 우위를 얻는다는 것을 보여준다.

    시청자들이 뉴스를 위해 점점 온라인으로 이동함에 따라, 디지털 콘텐츠 확장은 단지 유리할 뿐만 아니라 지역 방송국들에게 필수적이다. 하지만 견고한 디지털 플랫폼으로의 전환은 상당한 자원 배분을 요구하며, 더 빠듯한 예산에 제약받는 TV 방송국들에게 주요 도전 과제를 제시한다. 이 영역에서의 상당한 투자 필요성은 절대적이다. 방송국들은 앞으로 몇 년을 대비해 자신들을 포지셔닝하기 위해 지금 선투자해야 한다.

    자금과 인력의 지속적인 제한은 뉴스 보도 확장 노력을 복잡하게 만든다. 이러한 제약은 종종 뉴스팀들이 자원을 부족하게 활용하도록 강요하여, 그들이 제작하는 콘텐츠의 질과 깊이에 악영향을 미친다. 자금의 현저한 증가 없이는—대부분 소유주 그룹에 의해 제공되는 것이 가장 실현 가능하다—방송국들은 시청자를 구축하고 지역사회의 정보 필요에 기여할 잠재력에 미치지 못할 위험이 있다.

    전반적으로, 미디어 환경이 계속 변화함에 따라 지역 TV 방송국들은 지역 신문의 감소하는 존재로 인해 생긴 뉴스 공백을 메우는 데 도움을 줄 좋은 위치에 있다. 거버넌스 및 지역사회 중심 보도를 포함하고 디지털 전환을 가속화하는 편집 전략을 수용함으로써, 이들 방송국은 양질의 지역 뉴스의 핵심 원천으로서의 지위를 강화할 수 있다.

  • 왜 AI는 여전히 사실을 꾸며내는가

    Why AI is still making things up
    Axios

    최근의 사례들 몇 가지. 그리고 환각은 줄일 수 있음에도 속도와 확장성을 우선시 한다는 지적을 하고 있다.

    매주 사용자들이 이런 경고에 귀 기울이지 않는다는 고통스러운 새로운 증거들이 나타나고 있다.

    • 지난주에는 로버트 F. 케네디 주니어의 보건복지부에서 존재하지 않는 연구들을 인용한 보고서가 나왔다. 전문가들은 OpenAI의 도구들이 관련되었다는 증거를 발견했다.
    • 그 전주에는 시카고 선타임스가 실제 작가들의 이름은 맞지만 환각으로 만들어진 책 제목들로 가득한 여름 독서 목록이 담긴 인쇄 부록을 발행했다.
    • AI 법률 전문가 다미엔 샤를로틴은 변호사들이 AI 환각이 포함된 증거를 사용한 법적 결정들을 추적하고 있다. 그의 데이터베이스는 2025년 5월에만 30건 이상의 사례를 상세히 기록하고 있다. 법조계 관찰자들은 전체 수치가 훨씬 더 높을 것이라고 우려하고 있다.
  • NYT AI 팀 인터뷰

    How a Five-Person AI Team Is Powering Innovation at The New York Times: In Conversation with Zach Seward
    Newsroom Robots

    뉴욕타임스의 5인 AI 팀이 혁신을 이끄는 방법에 관해 이야기하고 3가지 내용으로 정리. 자세한 내용은 링크에

    • “AI 로드쇼”: 2,000명 저널리스트의 절반과 개별 대화
    • 문제 중심 개발: 기술에서 시작하지 않고 현실적 필요(요약)에서 시작
    • 내부 도구: Echo 같은 맞춤형 도구로 일상 업무 개선
  • 구글제로

    Neil Vogel on Google Zero
    The Rebooting

    Dotdash Meredith의 CEO 닐 보겔이 “구글 제로” 상황에 어떻게 대비하고 있는지 이야기. 대비라고 이야기하는게 사실은 별다른건 없는 느낌…

    “우리는 말 그대로 이것을 구글 제로라고 부른다”고 Dotdash Meredith CEO 닐 보겔이 최근 Media Product Forum에서 말했다. “구글이 아예 트래픽 전송을 중단하면 어떻게 될까? 이건 종말론적 계획이 아니다—작업 시나리오다.”

    구글의 AI 오버뷰는 이미 Dotdash Meredith 검색 쿼리의 3분의 1에 나타나고 있다. 회사는 그런 결과들의 클릭률 감소를 보고 있다. 이는 도전이지, 일을 정리할 이유는 아니다. “우리가 정말 오랫동안 알고 있었던 것은 궁극적으로 사용자들과의 직접적인 관계가 필요하다는 것”이라고 그는 말했다.

  • 순다르 피차이, 구글 제로에 대한 인터뷰

    Google CEO Sundar Pichai on the future of search, AI agents, and selling Chrome
    The Verge

    질문:
    퍼블리셔들이 늘 그렇듯이 구글 I/O 발표에 반응했습니다. 뉴스 미디어 얼라이언스는 어제 AI 모드가 발표된 후 매우 화가 났다고 말할 수 있습니다. 뉴스 미디어 얼라이언스 회장의 성명을 보면, “링크는 퍼블리셔들에게 트래픽과 수익을 주는 검색의 마지막 구원의 품질이었다. 이제 구글은 콘텐츠를 강제로 가져가서 아무런 대가도, 경제적 대가도 없이 사용한다. 그것이 바로 도둑질의 정의다”라고 했습니다. 그리고 법무부와 소송이 이를 다뤄야 한다고 계속 말하고 있습니다. 이는 매우 분노한 반응입니다. 이건 협상이 아니죠? 이건 “우리는 그냥 이것을 중단하길 원한다”는 것입니다. “좋아, 어딘가에서는 늘어나고 있을지 모르지만, 우리에게는 사업을 파괴하고 있다”고 말하는 이 목소리 큰 사람들에게 어떻게 응답하시겠습니까?

    답변:
    우선, 모든 제품에서 AI 모드는 출처를 제공할 것입니다. 그리고 우리는 제품 방향으로서 이것을 만들겠다는 방향에 매우 확고히 전념하고 있습니다… 사람들이 구글에 오는 이유 중 하나는 웹의 그 폭넓음을 경험하고 자신이 원하는 방향으로 가는 것이라고 생각합니다. 그래서 저는 우리가 더 많은 맥락을 제공한다고 봅니다. 네, 바로 답변을 얻을 수 있는 특정 질문들이 있을 것입니다. 하지만 전반적으로… 그리고 그것이 오늘날 우리가 보고 있는 패턴입니다. 지난 1년간 무엇보다도 우리가 사람들을 보내는 영역의 폭이 늘어나고 있다는 것이 분명해졌습니다. 그래서 AI 모드에서도 그럴 것이라고 기대합니다.

  • 할리우드 적극적 AI 활용

    The Great Pivot: How Hollywood Studios Are Moving Beyond AI Experimentation
    The Wrap

    할리우드가 AI를 받아들이게 만든 핵심 요인은 “클린 모델”의 등장이었다 – 웹에서 스크래핑한 콘텐츠가 아닌 검증 가능한 라이선스 데이터로 훈련된 AI 시스템이다. 세 번의 AI on the Lot 컨퍼런스에 모두 참석한 AI 스튜디오 FBRC AI의 공동 창립자인 레이첼 조이-빅터는 이것이 업계 도입에 중요하다고 본다.
    이러한 모델들은 명확한 라이선스 계약이 있는 훈련 데이터를 사용하여 저작권 문제를 해결한다. 예로는 라이선스를 받은 YouTube 콘텐츠로 훈련된 구글의 Veo 3, Adobe Stock 이미지를 사용하는 Adobe의 Firefly가 있다. Moon Valley와 같은 독립적인 대안도 클린 옵션으로 부상하고 있어, 스튜디오들에게 법적 위험 신호를 일으키지 않는 AI 도구를 제공하고 있다.

  • 직장에서 비밀AI 사용

    Keeping AI secret
    Axios

    비밀리에 생성형 AI 사용이 확산되는 이유는 회사에 가이드라인이 없거나, 즐겨 쓰는 도구가 금지되었거나, 동료보다 경쟁 우위를 차지하려는 욕구 때문이다. 또한 사용 사실이 들킬 경우 “대체 가능한 인력”으로 보일까 두려워하는 심리도 크다.

  • 감정 정리부터 거절 메시지까지: 데이팅 속 AI의 새로운 역할

    How AI is changing the face of dating
    DAZED

    데이트 상황이 아니더라도 문자를 요청하게 된다.

    이와 별개로 미국에서 신규 연인의 절반 이상이 온라인에서 시작한다는 이야기가 있고, 매칭 방식에서부터 서비스 운영에 이르기까지 데이팅 앱에 AI가 다양하게 적용되고 있다.

    더욱 흥미로운 점은 사람들이 ChatGPT에 어려운 감정 노동을 아웃소싱하는 방식입니다. 28세 아르샨은 ChatGPT에 마음을 털어놓고 상황을 요약해 달라고 요청하는 것이 실제로 감정을 정리하는 데 도움이 된다고 말합니다. “사귀고 있던 남자에 대한 생각과 감정을 요약하는 데 어려움을 겪었어요. 그래서 ChatGPT에 그 상황에 대한 제 생각을 이야기했죠.”라고 그들은 설명합니다. “그 덕분에 저는 그저 관심을 받고 싶었고, 차라리 헤어지는 게 낫다는 걸 깨달았어요. 저는 스스로에게 마무리를 짓는 걸 좋아해요.”

    TikTok의 여러 영상에서 알 수 있듯이, 많은 사람들이 ChatGPT를 사용하여 이별 문자나 “친구가 되자”라는 끔찍한 메시지를 작성해 왔습니다. COSRT 공인 심리성애 및 관계 치료사인 케이트 캠벨은 잠재적인 데이트 상대(혹은 관계)와의 관계를 끊기 위해 AI 도구를 사용하는 것은 우리가 동시에 만날 수 있는 사람들의 수가 너무 많기 때문일 수 있으며, 2010년대 후반과 2020년대 초반, 소통 부족이 많은 사람들의 온라인 데이트를 결정지었던 고스팅 시대에 대한 반작용일 수도 있다고 설명합니다.