Blog

어려운 콘텐츠 조정

Substack says it will not remove or demonetize Nazi content
Verge

서브스택 설립자 맥킨지는 나치 게시물과 관련된 사람들의 질문에 다음과 같이 답변하며 언론의 자유를 옹호하는듯한 발언을 했다.

저희도 나치를 좋아하지 않는다는 점을 분명히 말씀드리고 싶습니다. 아무도 그런 견해를 갖지 않기를 바랍니다. 하지만 일부 사람들은 나치나 다른 극단적인 견해를 갖고 있습니다. 그런 점을 고려할 때, (수익 창출 게시물을 포함한) 검열이 문제를 해결한다고 생각하지 않으며, 오히려 문제를 더 악화시킬 수 있습니다.

하지만 이러한 기준을 일관되게 세우는 것은 쉽지 않은 일이고 그렇기 때문에 콘텐츠 조정이란 어려운 일이다. 아래는 Verge 기사의 한 단락.

그의 답변은 ‘나치에 반대하는 서브스택’ 작성자의 다른 질문, 즉 왜 이러한 정책이 성 노동자의 스팸과 뉴스 레터에는 적용되지만 나치는 적용하지 않는지에 대한 질문에는 답하지 않았습니다.

베네딕트 에반스는 “인터넷이 시작된 이래로 플랫폼과 도구는 ‘유해하지만 합법적인’ 콘텐츠와 고객을 어떻게 처리할지 고민해 왔지만, 서브스택은 ‘광고’와 ‘알고리즘’이 있을 때만 이러한 문제가 발생하기 때문에 이러한 모든 문제에서 벗어날 수 있다는 다소 성스러운 발언을 한 적이 있습니다.”라고 언급했다.

10월 29, 2025
철회 논문의 증가

The Lithium Boom, Retractions, Real Estate, and Skateboarding

철회된 논문이 급증했다는 네이처 그래프

출판사가 논문 심사나 편집 방식에 너무 신경 쓰지 않고도 돈을 버는 비즈니스를 구축했다는 것입니다. 이력서를 채우기 위해 더 많은 논문을 발표하고 싶어하는 연구자들은 기꺼이 논문을 발표했고, 학부에서는 연구자들이 논문을 발표하는 것을 보고 기뻐했고, 그렇게 많은 논문이 기껏해야 모호하고 최악의 경우 명백한 사기라는 것이 드러날 때까지는 그렇게 진행되었습니다.

10월 29, 2025
생산성 기적의 함의

Assessing the Implications of a Productivity Miracle
Bridgewater

생산성 부문에서 인공지능의 잠재적 영향에 대해 논의하는 글.

기존 복잡한 인지 작업 수행에서 발생하는 병목현상의 대부분을 해결할 수 있다고 본다. 따라서 사무직 업무의 상당 부분을 낮은 또는 제로 한계 비용으로 수행하게 될 것이라고 하고 있다.

우리는 1990년대와 2000년대 IT 혁명으로 인해 정보의 생산과 유통에 관여하는 많은 비즈니스의 생산 또는 유통 한계 비용이 0이 된 것을 목격했습니다. 무료 및 저가 제품의 범람으로 혜택을 본 소비자 외에도, 유통 비용이 전혀 들지 않는 제품에 프리미엄을 부과하여 눈에 띄는 마진을 올린 소프트웨어 회사도 ‘승자’에 포함되었습니다. 신문사나 카메라 회사 같은 ‘패자’들은 한계 비용 기준으로 제로와 경쟁할 수 없었고, 소비자들이 훨씬 더 저렴한(종종 무료) 대안을 선택하면서 급격히 위축되었습니다.

‘모델 T 효과 ‘를 이야기하기도 한다. 이전에는 감당할 수 없었던 제품의 가격이 인하되면 소비자들이 더 많이 구매하여 완전히 새로운 산업이 생겨나는 현상으로, 포드 모델 T 생산성 혁신이 완전히 새로운 대중 시장 자동차 시장을 탄생시킨 사례를 이야기한다. 가장 최근의 사례는 소셜 미디어.

사진의 디지털화는 일부 AI 기능에도 적용 가능한 선례가 될 수 있습니다. 사진 제작이 사실상 무료가 되면서 소비는 사실상 무한대로 증가했고, 당장의 잉여의 대부분은 기존 사진 회사들의 희생으로 소비자에게 돌아갔습니다. 그러나 얼마 지나지 않아 무한한 무료 사진에 의존하는 매우 수익성이 높은 새로운 회사(예: 소셜 미디어)가 생겨났습니다.

10월 29, 2025
언론에 관한 선입견

Opinion Actually, people don’t hate the media as much as you think
Washington Post

언론에 대해 가지는 몇 가지 선입견이 그렇지 않은 경우가 많다는 것을 보여주는 오피니언 글. 조사 방법에 따라 언론 신뢰도 달라지며, 보수와 진보의 차이도 생각보다 크지 않을 수 있다는 언급을 한다.

갤럽의 조사에 따르면 미국인의 34%만이 언론이 뉴스를 “완전하고 정확하며 공정하게” 보도한다고 “어느 정도” 신뢰하고 확신하고 있습니다. 하지만 같은 질문을 약간만 달리해서 물어보면 결과는 상당히 달라집니다. 시카고 대학교의 리서치 회사인 NORC에서는 사람들에게 갤럽이 사용하는 4점 척도가 아닌 5점 척도, 즉 5개의 가능한 답변을 제공합니다. 이 방법을 사용하면 미국인의 절반 이상(55%)이 언론의 정확성을 신뢰합니다. 퓨 리서치 센터는 여전히 다른 방식으로 질문한 결과, 61%가 국가 뉴스 기관에서 얻는 정보를 “매우” 또는 “어느 정도” 신뢰한다고 답했습니다.

“요점은 책임 있는 언론의 인프라를 재구축하는 방법과 언론의 운영 방식에 대해 생각할 때 일반화나 획일적인 가정을 경계해야 한다는 것입니다. 우리는 아직 모르는 것이 많습니다.”라고 말한다.

10월 29, 2025
BBC의 지역뉴스 확대

Why BBC is ‘the neighbour from hell’ for leading regional newsbrand editors
PressGazzette

지역 뉴스를 강화하려는 BBC 계획에 지역 언론이 반대한다는 기사. 지역언론은 BBC가 현재 지역 뉴스 전략을 버리고 기존 지역 뉴스 퍼블리셔와 연계하는 방향을 할 것을 주장

구글, 메타 등과 달리 BBC의 자금은 수신료로 보장되기 때문에 영국 대중은 지역 저널리즘이 직면한 가장 큰 위협을 감수하고 있습니다. 지역 뉴스 웹사이트에 현금을 쏟아 붓고 있으며, 자랑스러운 독립 뉴스 사이트가 장기적으로 생존하는 것을 점점 더 어렵게 만들고 있습니다.

어떻게 진행되고 있나요? 지난 2022년 10월, BBC는 영국 전역의 커뮤니티에서 지역 온라인 뉴스 제공을 강화하기 위한 계획을 발표했습니다. 이 계획에는 130개의 추가 게시물을 만드는 것이 포함됩니다. 일반적으로 더 많은 저널리즘을 제공하는 것은 환영할 만한 일이지만, BBC의 계획으로 인해 수 세대에 걸쳐 지역사회에 알려진 수천 개의 기존 일자리가 위험에 처하게 되었습니다.

우리나라에서 비슷한 일이 발생한다면 지역 뉴스가 살아남을 수 있을까?

10월 29, 2025
인공지능 라벨과 기사 신뢰도

Most readers want publishers to label AI-generated articles — but trust outlets less when they do

대부분의 독자는 퍼블리셔가 AI가 생성한 기사에 라벨을 붙이기를 원하지만, 그렇게 할 경우 언론사에 대한 신뢰도가 떨어진다고 생각하는 것으로 나타났다. 연구진은 뉴스 기사와 함께 출처 목록을 제공했을 때, 인공지능의 사용을 공개하는 라벨이 신뢰도를 떨어뜨리지 않는다는 사실도 발견했다.

인간의 본성을 나타내주는 연구 결과 같아서 흥미롭다. 다른 결과도 흥미로운 부분이 있어 나중에 참고할 부분이 있을 듯.

10월 29, 2025
소셜 미디어의 비인간성

Regretful Accelerationism
Stratechery by Ben Thompson

직업적으로도 개인적으로도 인터넷 발전에서 많은 혜택을 받았던 벤 톰슨이 (기술적) 진보에 관해 마지 못해 가속주의적 관점을 택하고 있는 이유에 관해 설명한다.

레디 플레이어 원에는 이스터에그라는 ‘현재진행형’이 존재했고, 주인공이 이스터에그를 찾는 과정이 전 세계의 관심을 불러일으켰습니다. 하지만 이러한 묘사는 현실과 맞지 않습니다. 우리는 거장 건축가가 설계한 단일 온라인 세계가 오프라인의 관심을 유도하는 것이 아니라, 여러 측면에서 부수적으로 발생하는 집단적 히스테리에 의해 인간성이 결여된 수많은 사용자가 계획 지점을 중심으로 결집하는 것을 볼 수 있습니다. 그 결과는 누구도 통제할 수 없습니다.

레디플레이어원과 달리 인터넷에는 단 하나의 가상세계가 아닌 빅테크 기업이 하위 스택을 모두 통제하는 세계로, HTTP와 같은 프로토콜은 존재하지만 이러한 프로토콜은 온라인에서 돈을 벌 수 있다는 생각 이전에 만들어졌다. 오늘날 API는 모두 상업적 의도를 포함하고 있다.

현재 온라인 세계에서 두 가지 제약이 사라지고 있는데, 하나는 콘텐츠 제작에 필요한 한계비용이 제거되고 있다는 것이고, 다른 하나는 과거에는 이용자 제작 콘텐츠가 지인에 제한되었지만(페이스북처럼), 현재는 전체 네트워크에서 가장 매력적인 콘텐츠를 노출시키고 있다(틱톡처럼).

두 가지 흐름은 모든 사용자를 위해 생성된 맞춤형 콘텐츠에 관한 문제를 제기한다. 대규모 언어 모델을 활용하여 상호작용하는 부분에 관한 논의가 이루어지고 있지만, 결국 이러한 노력도 타인과 상호작용을 더 원활하게 하기 위함이다. 하지만 벤 톰슨이 느끼기에 온라인에서 인간 대 인간의 상호작용은 사라진 것 같다고 말하며, 온라인에서 살아남기 위해서는 어쩌면 온라인을 멀리하는 것이 방법일 수 있다는 말을 한다.

이야기를 한 맥락은 X와 같은 소셜 플랫폼에 관한 회의감에서 시작했을 수 있을 것 같은데, 꽤나 여러가지 이슈를 언급하고 있어 생각해 볼 부분이 많다.

10월 29, 2025
인공지능 예술, 솔츠와 아나돌 논쟁

Art Critic Jerry Saltz Gets Into an Online Skirmish With A.I. Superstar Refik Anadol

2022년 뉴욕 현대미술관 1층에 설치되어 최근 미술관 영구 소장품으로 인수된 24피트 높이의 스크린 기반 작품 인 언수퍼바이즈드(Unsupervised )를 둘러싸고 논쟁이 벌어졌습니다. 이 작품은 MoMA의 전체 온라인 카탈로그에 대한 알고리즘의 해석을 나타내는 다차원적인 색채의 파동으로 구성되어 있으며, 모더니즘의 가장 유명한 사조의 형태를 반영하고 있습니다. 아트넷 뉴스의 비평가인 벤 데이비스는 이 작품이 충분히 유쾌하지만 분명히 과대 포장된 작품이라고 평가했으며, MoMA는 “현대 미술의 역사를 재구성하고 과거를 꿈꾼다”고 대담하게 주장했습니다.

예술 비평가들이 흔히 그렇듯이 솔츠는 아나돌 작품의 문화적 가치를 평가할 때 결코 말을 아끼지 않았습니다. 그는 지난 2월 독수리에 실린 리뷰에서 언수퍼비디드가 관객들에게 큰 인기를 끌었고 심지어 “한 번에 몇 분 동안은 약간 재미있었다”고 인정했지만, 궁극적으로 이 작품이 너무 진부하고 눈에 너무 쉽게 들어왔다고 평가했습니다. “이 극도로 통제되고 방부 처리된 환경에서 예술과 의심은 별개의 침실을 유지합니다.”라고 그는 말했습니다.

가장 기억에 남는 것은 솔츠가 이 작품을 “거대한 테크노 용암 램프”, “50만 달러짜리 스크린 세이버”라고 묘사했다는 점입니다.

다른 몇 개 기사를 참고해보면 작품에 관한 평가가 과장된 것인지 아닌지 생각해 볼 수 있을 듯

10월 29, 2025
딥페이크 스캠
Rob’s Notes 9: Beware Deepfake Scams

유명 연예인을 ‘미끼’로 사용해 사용자의 클릭을 유도하거나(예: 스타의 사망 또는 체포 암시), 해당 연예인이 해당 제품이나 서비스를 사용하거나 보증한 것처럼 가장하는 ‘셀럽 미끼’를 오랫동안 사용해 온 사기성 광고에 대한 내용.
이 비디오는 종종 지역 뉴스 소스의 딥페이크 뉴스 보도(위, BBC 뉴스가 디지털 방식으로 변경된 경우)나 영국의 마틴 루이스와 같은 지역 금융계 유명인의 소개로 시작됩니다. 그런 다음 엘론 머스크가 흐릿한 배경(아마도 유출된 Zoom 통화에서 뜯어낸 것일 수 있음)이나 컨퍼런스에서 연설하거나 거래 이미지를 보여주는 다양한 주식 ‘주식 시장’ 비디오 영상과 함께 연설하는 장면이 등장할 수 있습니다. 가짜 머스크는 다음과 같이 설명합니다:
- 그들은 애플, 구글 등의 엔지니어들과 함께 양자 컴퓨팅 거래 시스템을 개발하는 데 몇 년 동안 10억~50억 달러를 투자했습니다.
- 항상 성공하는 것은 아니지만, 그의 시스템은 “90% 이상의 효율로 거래에서 승리”합니다.
- 250파운드부터 시작하여 하루에 5700파운드 이상을 벌 수 있습니다.
- 루이스 해밀턴, 리처드 브랜슨, 차마스 팔리하피티야 등 많은 유명인들이 이에 참여하고 지지하고 있으며, 때로는 이 계획 자체가 아닌 비트코인에 대해 이야기하는 비디오 영상을 사용하기도 합니다.
- 영국인들이 더 이상 일할 필요가 없을 것이라는 주장과 기타 주장
10월 29, 2025
GAIA, 언어모델 벤치마크
FACEBOOK RESEARCHERS TEST AI’S INTELLIGENCE AND FIND IT IS UNFORTUNATELY QUITE STUPID
The Byte

새로운 대규모 언어 모델 벤치마크에서 기존 모델의 점수가 형편없다는 기사.

AI 대부’이자 메타의 수석 과학자인 얀 르쿤이 포함된 연구팀은 아직 동료 심사를 거치지 않은 논문에 따르면 “인간에게는 개념적으로 간단하지만 대부분의 고급 AI에게는 어려운” 466개의 문항으로 구성된 GAIA라는 시험을 고안해냈습니다.

인간 응답자는 92%의 질문에 정답을 맞힌 반면, 수동으로 선택한 일부 플러그인을 장착한 GPT4는 15%에 불과했습니다. 이 팀이 발표한 GAIA 순위표에 따르면 OpenAI가 최근 출시한 GPT4 Turbo의 점수는 10% 미만이었습니다.

GAIA 목표가 무엇인지 해당 아카이브 논문의 일부 내용.
인간에게는 어려운 작업 대신, 개념적으로는 간단하지만 조합 공간이 큰 복잡한 작업 시퀀스를 정확하게 실행해야 하는 작업을 AI 시스템에 요청할 수 있습니다. 컴퓨터에게 해결책을 쉽게 검증할 수 있는 복잡한 문제를 풀도록 요청하는 작업 증명 알고리즘(Jakobsson and Juels, 1999; Dwork and Naor, 1993)과 유사하게, 작업을 성공적으로 완료해야만 결과를 얻을 수 있고 검증이 용이해야 합니다. 다양하고 불확실한 세계에 접근해야 하는 인공지능 비서를 위한 작업은 본질적으로 실제 사용 사례에 뿌리를 두면서 이 기준을 충족해야 합니다.

우리는 이러한 방향으로 나아가기 위해 466개의 세심하게 만들어진 질문과 그에 대한 답변, 그리고 관련 설계 방법론으로 구성된 일반 AI 어시스턴트의 벤치마크인 GAIA를 제안합니다. 우리의 질문은 만들기도 쉽고, AI 시스템(LLM의 경우 대부분 복잡한 생성이 필요함)에 도전적이지만, 독특하고 사실적인 답변을 인정하여 간단하고 강력한 자동 평가가 가능합니다.

GAIA는 다음과 같은 목표를 통해 현재 LLM 평가의 함정을 피하고자 합니다:
- 실제적이고 도전적인 질문. 예를 들어, LLM은 일반적으로 개방적이고 변화하는 웹을 탐색하거나, 다중 모달리티를 처리하거나, 질문에 답하기 위해 여러 단계를 거쳐 추론해야 합니다. 반대로, 많은 LLM 벤치마크는 매우 구체적이거나 폐쇄적이고 합성된 환경으로 제한되어 있습니다.
- 개념적으로 간단한 작업을 통한 쉬운 해석 가능성(비전문가인 주석가도 만점에 가까운 점수를 나타냄), 관련 추론 추적, 몇 개 되지 않지만 고도로 선별된 질문. 이는 효율성과 신뢰성이 부족한 집계된 벤치마크와는 대조적입니다(Perlitz 외, 2023).
- 비게임성. 질문에 답하려면 몇 가지 단계를 성공적으로 완료해야 하는데, 이러한 단계는 다양하기 때문에 쉽게 강제할 수 없습니다. 추론의 흔적을 확인할 수 있고, 정답에 요구되는 정확성, 인터넷에서 일반 텍스트로 제공되지 않기 때문에 데이터 오염 가능성을 방지할 수 있습니다. 반면, 객관식 답안(예: MMLU)은 잘못된 추론 추적이 정답에 더 쉽게 도달할 수 있기 때문에 오염 평가를 더 어렵게 만듭니다.
- 사용의 단순성. 결정적으로, 질문에 대한 답변은 사실적이고 간결하며 모호하지 않습니다. 이 두 가지 속성은 간단하고 빠르며 사실에 입각한 평가를 가능하게 합니다. 우리의 질문은 제로 샷으로 답을 구하도록 설계되어 평가 설정의 영향을 제한합니다. 반대로 많은 LLM 벤치마크는 프롬프트의 수와 성격(Liang 외, 2022b)(섹션 8.2) 또는 벤치마크 구현과 같은 실험 설정에 민감한 평가를 요구합니다.
10월 29, 2025