Blog

  • 인공지능 예술, 솔츠와 아나돌 논쟁

    Art Critic Jerry Saltz Gets Into an Online Skirmish With A.I. Superstar Refik Anadol

    2022년 뉴욕 현대미술관 1층에 설치되어 최근 미술관 영구 소장품으로 인수된 24피트 높이의 스크린 기반 작품 인 언수퍼바이즈드(Unsupervised )를 둘러싸고 논쟁이 벌어졌습니다. 이 작품은 MoMA의 전체 온라인 카탈로그에 대한 알고리즘의 해석을 나타내는 다차원적인 색채의 파동으로 구성되어 있으며, 모더니즘의 가장 유명한 사조의 형태를 반영하고 있습니다. 아트넷 뉴스의 비평가인 벤 데이비스는 이 작품이 충분히 유쾌하지만 분명히 과대 포장된 작품이라고 평가했으며, MoMA는 “현대 미술의 역사를 재구성하고 과거를 꿈꾼다”고 대담하게 주장했습니다.

    예술 비평가들이 흔히 그렇듯이 솔츠는 아나돌 작품의 문화적 가치를 평가할 때 결코 말을 아끼지 않았습니다. 그는 지난 2월 독수리에 실린 리뷰에서 언수퍼비디드가 관객들에게 큰 인기를 끌었고 심지어 “한 번에 몇 분 동안은 약간 재미있었다”고 인정했지만, 궁극적으로 이 작품이 너무 진부하고 눈에 너무 쉽게 들어왔다고 평가했습니다. “이 극도로 통제되고 방부 처리된 환경에서 예술과 의심은 별개의 침실을 유지합니다.”라고 그는 말했습니다.

    가장 기억에 남는 것은 솔츠가 이 작품을 “거대한 테크노 용암 램프”, “50만 달러짜리 스크린 세이버”라고 묘사했다는 점입니다.

    다른 몇 개 기사를 참고해보면 작품에 관한 평가가 과장된 것인지 아닌지 생각해 볼 수 있을 듯

  • 딥페이크 스캠

    Rob’s Notes 9: Beware Deepfake Scams

    유명 연예인을 ‘미끼’로 사용해 사용자의 클릭을 유도하거나(예: 스타의 사망 또는 체포 암시), 해당 연예인이 해당 제품이나 서비스를 사용하거나 보증한 것처럼 가장하는 ‘셀럽 미끼’를 오랫동안 사용해 온 사기성 광고에 대한 내용.

    이 비디오는 종종 지역 뉴스 소스의 딥페이크 뉴스 보도(위, BBC 뉴스가 디지털 방식으로 변경된 경우)나 영국의 마틴 루이스와 같은 지역 금융계 유명인의 소개로 시작됩니다. 그런 다음 엘론 머스크가 흐릿한 배경(아마도 유출된 Zoom 통화에서 뜯어낸 것일 수 있음)이나 컨퍼런스에서 연설하거나 거래 이미지를 보여주는 다양한 주식 ‘주식 시장’ 비디오 영상과 함께 연설하는 장면이 등장할 수 있습니다. 가짜 머스크는 다음과 같이 설명합니다:

    • 그들은 애플, 구글 등의 엔지니어들과 함께 양자 컴퓨팅 거래 시스템을 개발하는 데 몇 년 동안 10억~50억 달러를 투자했습니다.
    • 항상 성공하는 것은 아니지만, 그의 시스템은 “90% 이상의 효율로 거래에서 승리”합니다.
    • 250파운드부터 시작하여 하루에 5700파운드 이상을 벌 수 있습니다.
    • 루이스 해밀턴, 리처드 브랜슨, 차마스 팔리하피티야 등 많은 유명인들이 이에 참여하고 지지하고 있으며, 때로는 이 계획 자체가 아닌 비트코인에 대해 이야기하는 비디오 영상을 사용하기도 합니다.
    • 영국인들이 더 이상 일할 필요가 없을 것이라는 주장과 기타 주장
  • GAIA, 언어모델 벤치마크

    FACEBOOK RESEARCHERS TEST AI’S INTELLIGENCE AND FIND IT IS UNFORTUNATELY QUITE STUPID
    The Byte

    새로운 대규모 언어 모델 벤치마크에서 기존 모델의 점수가 형편없다는 기사.

    AI 대부’이자 메타의 수석 과학자인 얀 르쿤이 포함된 연구팀은 아직 동료 심사를 거치지 않은 논문에 따르면 “인간에게는 개념적으로 간단하지만 대부분의 고급 AI에게는 어려운” 466개의 문항으로 구성된 GAIA라는 시험을 고안해냈습니다.

    인간 응답자는 92%의 질문에 정답을 맞힌 반면, 수동으로 선택한 일부 플러그인을 장착한 GPT4는 15%에 불과했습니다. 이 팀이 발표한 GAIA 순위표에 따르면 OpenAI가 최근 출시한 GPT4 Turbo의 점수는 10% 미만이었습니다.

    GAIA 목표가 무엇인지 해당 아카이브 논문의 일부 내용.

    인간에게는 어려운 작업 대신, 개념적으로는 간단하지만 조합 공간이 큰 복잡한 작업 시퀀스를 정확하게 실행해야 하는 작업을 AI 시스템에 요청할 수 있습니다. 컴퓨터에게 해결책을 쉽게 검증할 수 있는 복잡한 문제를 풀도록 요청하는 작업 증명 알고리즘(Jakobsson and Juels, 1999; Dwork and Naor, 1993)과 유사하게, 작업을 성공적으로 완료해야만 결과를 얻을 수 있고 검증이 용이해야 합니다. 다양하고 불확실한 세계에 접근해야 하는 인공지능 비서를 위한 작업은 본질적으로 실제 사용 사례에 뿌리를 두면서 이 기준을 충족해야 합니다.

    우리는 이러한 방향으로 나아가기 위해 466개의 세심하게 만들어진 질문과 그에 대한 답변, 그리고 관련 설계 방법론으로 구성된 일반 AI 어시스턴트의 벤치마크인 GAIA를 제안합니다. 우리의 질문은 만들기도 쉽고, AI 시스템(LLM의 경우 대부분 복잡한 생성이 필요함)에 도전적이지만, 독특하고 사실적인 답변을 인정하여 간단하고 강력한 자동 평가가 가능합니다.

    GAIA는 다음과 같은 목표를 통해 현재 LLM 평가의 함정을 피하고자 합니다:

    • 실제적이고 도전적인 질문. 예를 들어, LLM은 일반적으로 개방적이고 변화하는 웹을 탐색하거나, 다중 모달리티를 처리하거나, 질문에 답하기 위해 여러 단계를 거쳐 추론해야 합니다. 반대로, 많은 LLM 벤치마크는 매우 구체적이거나 폐쇄적이고 합성된 환경으로 제한되어 있습니다.
    • 개념적으로 간단한 작업을 통한 쉬운 해석 가능성(비전문가인 주석가도 만점에 가까운 점수를 나타냄), 관련 추론 추적, 몇 개 되지 않지만 고도로 선별된 질문. 이는 효율성과 신뢰성이 부족한 집계된 벤치마크와는 대조적입니다(Perlitz 외, 2023).
    • 비게임성. 질문에 답하려면 몇 가지 단계를 성공적으로 완료해야 하는데, 이러한 단계는 다양하기 때문에 쉽게 강제할 수 없습니다. 추론의 흔적을 확인할 수 있고, 정답에 요구되는 정확성, 인터넷에서 일반 텍스트로 제공되지 않기 때문에 데이터 오염 가능성을 방지할 수 있습니다. 반면, 객관식 답안(예: MMLU)은 잘못된 추론 추적이 정답에 더 쉽게 도달할 수 있기 때문에 오염 평가를 더 어렵게 만듭니다.
    • 사용의 단순성. 결정적으로, 질문에 대한 답변은 사실적이고 간결하며 모호하지 않습니다. 이 두 가지 속성은 간단하고 빠르며 사실에 입각한 평가를 가능하게 합니다. 우리의 질문은 제로 샷으로 답을 구하도록 설계되어 평가 설정의 영향을 제한합니다. 반대로 많은 LLM 벤치마크는 프롬프트의 수와 성격(Liang 외, 2022b)(섹션 8.2) 또는 벤치마크 구현과 같은 실험 설정에 민감한 평가를 요구합니다.

  • 구글, 캐나다 링크세

    Google to pay Canada’s “link tax,” drops threat of removing news from search
    Ars Technica

    지나간 일이지만 기록해놓지 않아서 남기는 글.

    C-18 법에는 대형 검색 엔진 및 소셜 미디어 서비스가 뉴스 사업자 또는 뉴스 사업자 그룹과 지불을 협상하도록 요구하는 ‘교섭 의무’가 포함되어 있다. 법 시행 6개월 전인 지난 6월, 구글은 ‘링크세’를 내지 않는 대신 캐나다에서 구글 서비스에 액세스하는 사용자를 위해 구글 검색과 구글 뉴스에서 캐나다 뉴스 소스에 대한 링크를 삭제하겠다고 밝혔다. 구글은 지불에 합의했으나 페이스북은 여전히 돈을 내는 것에 반대 입장을 고수하고 있다.

    캐나다 문화유산부 장관 파스칼 세인트-옹은 오늘 성명을 통해 “구글은 독립 뉴스 사업자와 원주민 및 공식 언어 소수자 커뮤니티를 포함한 전국의 다양한 뉴스 사업자를 위해 물가 상승률에 연동하여 매년 1억 달러의 재정 지원을 제공할 것입니다.”라고 밝혔습니다.

    캐나다 통화로 1억 달러는 미국 통화로 약 7,400만 달러의 가치가 있습니다. 오늘 합의가 이루어지기 전, 연방 정부는 구글이 연간 1억 7,200만 달러를 지불해야 할 것으로 추정했습니다.

    “광범위한 논의 끝에 캐나다 정부는 캐나다인이 관련성 있고 유용한 정보를 찾을 수 있도록 돕는다는 이유만으로 C-18이 링크에 대한 대가를 요구하고 실행 불가능한 협상 과정을 통해 무제한의 재정적 책임을 발생시킬 것이라는 우리의 깊은 우려를 해결하기 위해 여러 가지 변경 사항에 동의했습니다.”라고 구글은 Ars에 제공한 성명에서 밝혔습니다.

    시니컬한 사람은 브라우저 디폴트를 위해 애플에 구글이 지급하는 비용이 200억 달러(약 26조)라는걸 생각하면 7,400만 달러(996억)은 푼돈일 뿐이라는 말을 하기도 한다.

  • 스포츠일러스트레이티드 가짜 인공지능 기사

    Sports Illustrated Published Articles by Fake, AI-Generated Writers
    Futurism

    생성형 인공지능을 활용하여 기사를 작성하고, 제휴링크를 통해 수익을 얻는 사례는 수없이 보고되고 있다. 기존 저널리즘으로 유명했던 언론사가 하나 둘 몰락하고 있는 상황에서 인공지능을 활용해 비용을 절약하고 수익을 창출하려는 시도가 꾸준히 등장하고 있는 것이다.

    지난 수십 년간 스포츠 저널리즘으로 수많은 내셔널 매거진 어워드를 수상하고 윌리엄 포크너에서 존 업다이크에 이르는 문학적 거장들의 작품을 출판했던 스포츠 일러스트레이티드에게 AI 콘텐츠는 엄청난 몰락을 의미하기도 합니다.하지만 아레나 그룹이 관리하고 있는 지금, 이 잡지의 일부는 독자의 신뢰를 얻기 위해 가짜 작가들이 허공에서 요리되고, 똑같이 가짜 전기와 전문 지식을 갖추고, 독자가 클릭하면 금전적 리베이트를 제공하는 제품에 대한 제휴 링크를 통해 수익을 창출하는 AI 생성 구매 가이드를 쏟아내는 포템킨 마을로 전락한 듯합니다.

    이와 관련해서 다음과 같이 평가한다.

    공개되지 않은 AI 콘텐츠는 미디어 윤리의 근간을 무너뜨리는 행위이며, 독자의 신뢰를 무너뜨리는 완벽한 방법임은 두말할 나위도 없습니다. 결국, 이는 인지도가 높은 언론사가 정상화하기는커녕 어디에서도 볼 수 없는 매우 무책임한 행동일 뿐입니다.

    진짜 시험대는 유통이라는 이야기도 있다. 생성의 문제를 걱정하지만 결국은 사람들에게 도달해야 하기 때문이다. 보고서에서도 비슷하게 썼지만 스팸의 수준을 벗어나기 어려울 것이라고 생각한다.

  • 아르헨티나 인공지능 선거

    Is Argentina the First A.I. Election?

    아르헨티나 선거에서 인공지능이 적극적으로 활용되고 있다는 뉴욕타임스 기사. 마사 후보의 사례를 볼 수 있는 인스타그램 링크는 여기. 이미 국내에서도 윤석열 김건희 생성 인공지능 영상도 쉽게 찾아볼 수 있는데, 과연 총선 기간 어떻게 될지.

    아르헨티나 선거에서 인공지능이 부상하면서 일부 유권자들은 무엇이 진짜인지 의문을 제기하고 있습니다. 지난주 마사 후보가 선거 유세 후 지쳐 보이는 모습이 담긴 동영상이 유포되자, 비판자들은 그가 마약을 하고 있다고 비난했습니다. 그의 지지자들은 이 동영상이 실제로는 딥페이크라고 주장하며 빠르게 반격에 나섰습니다. 그러나 그의 선거 캠프는 이 동영상이 실제로 존재한다고 확인했지만 마사 씨는 마약을 하지 않았다고 말했습니다. 마사 씨는 사람들이 이미 과거의 실수나 스캔들을 은폐하기 위해 인공지능을 사용하고 있다고 말했습니다. 마사 씨는 인터뷰에서 “자신이 원치 않는 말이 나왔을 때 인공지능 뒤에 숨는 것은 매우 쉽다”고 말했습니다.

  • 먹튀당한 넷플릭스

    The Strange $55 Million Saga of a Netflix Series You’ll Never See

    불과 10년 만에 스크립트 TV 프로그램의 수가 200개에서 500개 이상으로 급증했고, 디즈니, Apple, NBC유니버설의 새로운 스트리밍 서비스도 등장했다. 이로 인해 콘텐츠 제작자의 몸값은 급격하게 상승했다. 그 결과의 하나가 바로 아래의 사건.

    넷플릭스는 계약을 성사시켰지만 곧 후회하게 되었습니다. 린쉬와의 프로젝트는 비용이 많이 드는 실패작으로 전락했고, 할리우드 스튜디오들이 이제 끝내려고 애쓰고 있는 방만한 지출 시대의 축소판으로 전락했습니다. 넷플릭스는 린쉬의 쇼에 5,500만 달러 이상을 투자하고 그에게 거의 전액에 가까운 예산과 창작의 자유를 주었지만 완성된 에피소드는 단 한 편도 받지 못했습니다.

    “할리우드 스튜디오들이 이제 끝내려고 애쓰고 있는 방만한 지출 시대의 축소판”이라는 말이 인상적이다.

  • 메타의 독립연구 지원 도구

    New Tools to Support Independent Research

    Meta는 사람들이 플랫폼을 어떻게 사용하는지에 대한 데이터에 외부 연구자들이 접근할 수 있는 새로운 도구와 플랫폼을 제공한다.

    • 연구자들이 Facebook과 Instagram에서 더 많은 공개 콘텐츠에 액세스할 수 있는 새로운 도구를 출시합니다.
    • 저희는 정치 및 사회 연구를 위한 대학 간 컨소시엄(ICPSR)과 최초의 파트너십을 체결하여 연구자들이 ICPSR의 안전한 가상 데이터 영역에서 데이터를 분석할 수 있도록 했습니다.
    • 전 세계 경제 이동성의 동인을 더 잘 이해하기 위해 사회적 자본 연구를 확대하고 있습니다.

    이와 관련된 MIT Technology Review의 기사

    연구자들은 특히 플랫폼이 공개를 원치 않을 수 있는 데이터에 접근하는 것과 관련하여 과거에 소셜 미디어 회사와 불편한 관계를 맺어 왔습니다. (예를 들어, 2021년에 페이스북은 웹 스크래핑을 통한 플랫폼의 정치 광고 타겟팅을 조사하던 뉴욕대학교의 투명성 프로젝트 연구진에게 사용자 개인정보를 침해한다는 이유로 연구 중단 서한을 보낸 바 있습니다.)

    클레그는 이 제품이 무엇보다도 “의미 있는” 연구를 가능하게 하기를 원한다고 말하며, 현재 소셜 미디어의 정확한 영향에 대한 연구자들 간의 합의가 부족하며, 이는 소셜 미디어 기업의 공개 데이터 부족으로 인해 더욱 어려워졌다고 강조했습니다.

    새로운 라이브러리는 주로 검색 엔진과 유사한 웹 인터페이스 또는 연구자가 직접 쿼리를 코딩하여 대량의 데이터를 반환할 수 있는 API를 통해 액세스할 수 있는 데이터베이스입니다. 예를 들어, 연구자들은 2023년 2월 14일에 생성형 AI에 관한 모든 공개 게시물을 가장 많이 본 순서부터 가장 적게 본 순서로 정렬하여 보여 달라고 요청할 수 있습니다.

  • 퓨리서치: 소셜미디어 뉴스소비(틱톡)

    Social Media and News Fact Sheet

    예전에 보고 기록해놨던 것 같기는 한데 (아니면 자료 확인하고 글만 작성했는지) 없는 것 같아 남겨놓는다. 소셜 미디어 뉴스 소비는 이미 (미국에서) 중요한 부분이 되었다고 평가하는데 어떤 플랫폼을 통해 뉴스를 접하는지 관련하여 눈에 띄는 답변이 있다. 이미 국내도 숏폼이 주요 추세가 되어가고 있다. 자세한 내용은 위 링크.

    A series of line charts showing that TikTok has had the most growth since 2020 in the share of users who regularly get news on the site
  • 스크린타임과 아동 인지발달

    No evidence screen time is negative for children’s cognitive development and well-being: Oxford Study

    옥스포드 인터넷 연구소, 옥스포드 대학교, 오레곤 대학교, 틸버그 대학교, 캠브리지 대학교의 연구진은 미국에서 뇌 발달과 아동 건강에 관한 최대 규모의 장기 연구인 청소년 뇌 인지 발달 (ABCD) 연구의 데이터를 사용하여 9~12세 아동의 인지 기능과 자가 보고한 스크린 시간 사용 현황을 분석했습니다 .

    Cortex저널에 게재된 이 연구는 2년에 걸쳐 참여 어린이들이 매일 디지털 활동에 소비하는 시간을 추정하는 방식으로 진행되었습니다. 아이들의 응답은 전혀 시간이 없다는 답변부터 하루에 4시간 이상이라는 답변까지 다양했습니다.

    스크린 타임 활동에는 TV 프로그램이나 영화 시청 , YouTube와 같은 디지털 플랫폼을 이용한 동영상 시청과같은 ‘전통적인’ 스크린 활동뿐만 아니라 비디오 게임과 같은 인터랙티브 활동도포함되었습니다. 또한 앱, 전화, 화상 통화, 소셜 미디어를 통해 다른 사람들과 소통하는 것에 대해서도 질문했습니다.

    디지털 참여율이 높은 참가자의 경우에도 아동의 뇌 발달에 장애가 있다는 증거는 발견되지 않았습니다.

    우리는 여전히 잘못된 원인에 기대서 세상을 살아가고 있는지도 모른다.