[작성자:] haeyeop

  • 메타의 독립연구 지원 도구

    New Tools to Support Independent Research

    Meta는 사람들이 플랫폼을 어떻게 사용하는지에 대한 데이터에 외부 연구자들이 접근할 수 있는 새로운 도구와 플랫폼을 제공한다.

    • 연구자들이 Facebook과 Instagram에서 더 많은 공개 콘텐츠에 액세스할 수 있는 새로운 도구를 출시합니다.
    • 저희는 정치 및 사회 연구를 위한 대학 간 컨소시엄(ICPSR)과 최초의 파트너십을 체결하여 연구자들이 ICPSR의 안전한 가상 데이터 영역에서 데이터를 분석할 수 있도록 했습니다.
    • 전 세계 경제 이동성의 동인을 더 잘 이해하기 위해 사회적 자본 연구를 확대하고 있습니다.

    이와 관련된 MIT Technology Review의 기사

    연구자들은 특히 플랫폼이 공개를 원치 않을 수 있는 데이터에 접근하는 것과 관련하여 과거에 소셜 미디어 회사와 불편한 관계를 맺어 왔습니다. (예를 들어, 2021년에 페이스북은 웹 스크래핑을 통한 플랫폼의 정치 광고 타겟팅을 조사하던 뉴욕대학교의 투명성 프로젝트 연구진에게 사용자 개인정보를 침해한다는 이유로 연구 중단 서한을 보낸 바 있습니다.)

    클레그는 이 제품이 무엇보다도 “의미 있는” 연구를 가능하게 하기를 원한다고 말하며, 현재 소셜 미디어의 정확한 영향에 대한 연구자들 간의 합의가 부족하며, 이는 소셜 미디어 기업의 공개 데이터 부족으로 인해 더욱 어려워졌다고 강조했습니다.

    새로운 라이브러리는 주로 검색 엔진과 유사한 웹 인터페이스 또는 연구자가 직접 쿼리를 코딩하여 대량의 데이터를 반환할 수 있는 API를 통해 액세스할 수 있는 데이터베이스입니다. 예를 들어, 연구자들은 2023년 2월 14일에 생성형 AI에 관한 모든 공개 게시물을 가장 많이 본 순서부터 가장 적게 본 순서로 정렬하여 보여 달라고 요청할 수 있습니다.

  • 먹튀당한 넷플릭스

    The Strange $55 Million Saga of a Netflix Series You’ll Never See

    불과 10년 만에 스크립트 TV 프로그램의 수가 200개에서 500개 이상으로 급증했고, 디즈니, Apple, NBC유니버설의 새로운 스트리밍 서비스도 등장했다. 이로 인해 콘텐츠 제작자의 몸값은 급격하게 상승했다. 그 결과의 하나가 바로 아래의 사건.

    넷플릭스는 계약을 성사시켰지만 곧 후회하게 되었습니다. 린쉬와의 프로젝트는 비용이 많이 드는 실패작으로 전락했고, 할리우드 스튜디오들이 이제 끝내려고 애쓰고 있는 방만한 지출 시대의 축소판으로 전락했습니다. 넷플릭스는 린쉬의 쇼에 5,500만 달러 이상을 투자하고 그에게 거의 전액에 가까운 예산과 창작의 자유를 주었지만 완성된 에피소드는 단 한 편도 받지 못했습니다.

    “할리우드 스튜디오들이 이제 끝내려고 애쓰고 있는 방만한 지출 시대의 축소판”이라는 말이 인상적이다.

  • 아르헨티나 인공지능 선거

    Is Argentina the First A.I. Election?

    아르헨티나 선거에서 인공지능이 적극적으로 활용되고 있다는 뉴욕타임스 기사. 마사 후보의 사례를 볼 수 있는 인스타그램 링크는 여기. 이미 국내에서도 윤석열 김건희 생성 인공지능 영상도 쉽게 찾아볼 수 있는데, 과연 총선 기간 어떻게 될지.

    아르헨티나 선거에서 인공지능이 부상하면서 일부 유권자들은 무엇이 진짜인지 의문을 제기하고 있습니다. 지난주 마사 후보가 선거 유세 후 지쳐 보이는 모습이 담긴 동영상이 유포되자, 비판자들은 그가 마약을 하고 있다고 비난했습니다. 그의 지지자들은 이 동영상이 실제로는 딥페이크라고 주장하며 빠르게 반격에 나섰습니다. 그러나 그의 선거 캠프는 이 동영상이 실제로 존재한다고 확인했지만 마사 씨는 마약을 하지 않았다고 말했습니다. 마사 씨는 사람들이 이미 과거의 실수나 스캔들을 은폐하기 위해 인공지능을 사용하고 있다고 말했습니다. 마사 씨는 인터뷰에서 “자신이 원치 않는 말이 나왔을 때 인공지능 뒤에 숨는 것은 매우 쉽다”고 말했습니다.

  • 스포츠일러스트레이티드 가짜 인공지능 기사

    Sports Illustrated Published Articles by Fake, AI-Generated Writers
    Futurism

    생성형 인공지능을 활용하여 기사를 작성하고, 제휴링크를 통해 수익을 얻는 사례는 수없이 보고되고 있다. 기존 저널리즘으로 유명했던 언론사가 하나 둘 몰락하고 있는 상황에서 인공지능을 활용해 비용을 절약하고 수익을 창출하려는 시도가 꾸준히 등장하고 있는 것이다.

    지난 수십 년간 스포츠 저널리즘으로 수많은 내셔널 매거진 어워드를 수상하고 윌리엄 포크너에서 존 업다이크에 이르는 문학적 거장들의 작품을 출판했던 스포츠 일러스트레이티드에게 AI 콘텐츠는 엄청난 몰락을 의미하기도 합니다.하지만 아레나 그룹이 관리하고 있는 지금, 이 잡지의 일부는 독자의 신뢰를 얻기 위해 가짜 작가들이 허공에서 요리되고, 똑같이 가짜 전기와 전문 지식을 갖추고, 독자가 클릭하면 금전적 리베이트를 제공하는 제품에 대한 제휴 링크를 통해 수익을 창출하는 AI 생성 구매 가이드를 쏟아내는 포템킨 마을로 전락한 듯합니다.

    이와 관련해서 다음과 같이 평가한다.

    공개되지 않은 AI 콘텐츠는 미디어 윤리의 근간을 무너뜨리는 행위이며, 독자의 신뢰를 무너뜨리는 완벽한 방법임은 두말할 나위도 없습니다. 결국, 이는 인지도가 높은 언론사가 정상화하기는커녕 어디에서도 볼 수 없는 매우 무책임한 행동일 뿐입니다.

    진짜 시험대는 유통이라는 이야기도 있다. 생성의 문제를 걱정하지만 결국은 사람들에게 도달해야 하기 때문이다. 보고서에서도 비슷하게 썼지만 스팸의 수준을 벗어나기 어려울 것이라고 생각한다.

  • 구글, 캐나다 링크세

    Google to pay Canada’s “link tax,” drops threat of removing news from search
    Ars Technica

    지나간 일이지만 기록해놓지 않아서 남기는 글.

    C-18 법에는 대형 검색 엔진 및 소셜 미디어 서비스가 뉴스 사업자 또는 뉴스 사업자 그룹과 지불을 협상하도록 요구하는 ‘교섭 의무’가 포함되어 있다. 법 시행 6개월 전인 지난 6월, 구글은 ‘링크세’를 내지 않는 대신 캐나다에서 구글 서비스에 액세스하는 사용자를 위해 구글 검색과 구글 뉴스에서 캐나다 뉴스 소스에 대한 링크를 삭제하겠다고 밝혔다. 구글은 지불에 합의했으나 페이스북은 여전히 돈을 내는 것에 반대 입장을 고수하고 있다.

    캐나다 문화유산부 장관 파스칼 세인트-옹은 오늘 성명을 통해 “구글은 독립 뉴스 사업자와 원주민 및 공식 언어 소수자 커뮤니티를 포함한 전국의 다양한 뉴스 사업자를 위해 물가 상승률에 연동하여 매년 1억 달러의 재정 지원을 제공할 것입니다.”라고 밝혔습니다.

    캐나다 통화로 1억 달러는 미국 통화로 약 7,400만 달러의 가치가 있습니다. 오늘 합의가 이루어지기 전, 연방 정부는 구글이 연간 1억 7,200만 달러를 지불해야 할 것으로 추정했습니다.

    “광범위한 논의 끝에 캐나다 정부는 캐나다인이 관련성 있고 유용한 정보를 찾을 수 있도록 돕는다는 이유만으로 C-18이 링크에 대한 대가를 요구하고 실행 불가능한 협상 과정을 통해 무제한의 재정적 책임을 발생시킬 것이라는 우리의 깊은 우려를 해결하기 위해 여러 가지 변경 사항에 동의했습니다.”라고 구글은 Ars에 제공한 성명에서 밝혔습니다.

    시니컬한 사람은 브라우저 디폴트를 위해 애플에 구글이 지급하는 비용이 200억 달러(약 26조)라는걸 생각하면 7,400만 달러(996억)은 푼돈일 뿐이라는 말을 하기도 한다.

  • GAIA, 언어모델 벤치마크

    FACEBOOK RESEARCHERS TEST AI’S INTELLIGENCE AND FIND IT IS UNFORTUNATELY QUITE STUPID
    The Byte

    새로운 대규모 언어 모델 벤치마크에서 기존 모델의 점수가 형편없다는 기사.

    AI 대부’이자 메타의 수석 과학자인 얀 르쿤이 포함된 연구팀은 아직 동료 심사를 거치지 않은 논문에 따르면 “인간에게는 개념적으로 간단하지만 대부분의 고급 AI에게는 어려운” 466개의 문항으로 구성된 GAIA라는 시험을 고안해냈습니다.

    인간 응답자는 92%의 질문에 정답을 맞힌 반면, 수동으로 선택한 일부 플러그인을 장착한 GPT4는 15%에 불과했습니다. 이 팀이 발표한 GAIA 순위표에 따르면 OpenAI가 최근 출시한 GPT4 Turbo의 점수는 10% 미만이었습니다.

    GAIA 목표가 무엇인지 해당 아카이브 논문의 일부 내용.

    인간에게는 어려운 작업 대신, 개념적으로는 간단하지만 조합 공간이 큰 복잡한 작업 시퀀스를 정확하게 실행해야 하는 작업을 AI 시스템에 요청할 수 있습니다. 컴퓨터에게 해결책을 쉽게 검증할 수 있는 복잡한 문제를 풀도록 요청하는 작업 증명 알고리즘(Jakobsson and Juels, 1999; Dwork and Naor, 1993)과 유사하게, 작업을 성공적으로 완료해야만 결과를 얻을 수 있고 검증이 용이해야 합니다. 다양하고 불확실한 세계에 접근해야 하는 인공지능 비서를 위한 작업은 본질적으로 실제 사용 사례에 뿌리를 두면서 이 기준을 충족해야 합니다.

    우리는 이러한 방향으로 나아가기 위해 466개의 세심하게 만들어진 질문과 그에 대한 답변, 그리고 관련 설계 방법론으로 구성된 일반 AI 어시스턴트의 벤치마크인 GAIA를 제안합니다. 우리의 질문은 만들기도 쉽고, AI 시스템(LLM의 경우 대부분 복잡한 생성이 필요함)에 도전적이지만, 독특하고 사실적인 답변을 인정하여 간단하고 강력한 자동 평가가 가능합니다.

    GAIA는 다음과 같은 목표를 통해 현재 LLM 평가의 함정을 피하고자 합니다:

    • 실제적이고 도전적인 질문. 예를 들어, LLM은 일반적으로 개방적이고 변화하는 웹을 탐색하거나, 다중 모달리티를 처리하거나, 질문에 답하기 위해 여러 단계를 거쳐 추론해야 합니다. 반대로, 많은 LLM 벤치마크는 매우 구체적이거나 폐쇄적이고 합성된 환경으로 제한되어 있습니다.
    • 개념적으로 간단한 작업을 통한 쉬운 해석 가능성(비전문가인 주석가도 만점에 가까운 점수를 나타냄), 관련 추론 추적, 몇 개 되지 않지만 고도로 선별된 질문. 이는 효율성과 신뢰성이 부족한 집계된 벤치마크와는 대조적입니다(Perlitz 외, 2023).
    • 비게임성. 질문에 답하려면 몇 가지 단계를 성공적으로 완료해야 하는데, 이러한 단계는 다양하기 때문에 쉽게 강제할 수 없습니다. 추론의 흔적을 확인할 수 있고, 정답에 요구되는 정확성, 인터넷에서 일반 텍스트로 제공되지 않기 때문에 데이터 오염 가능성을 방지할 수 있습니다. 반면, 객관식 답안(예: MMLU)은 잘못된 추론 추적이 정답에 더 쉽게 도달할 수 있기 때문에 오염 평가를 더 어렵게 만듭니다.
    • 사용의 단순성. 결정적으로, 질문에 대한 답변은 사실적이고 간결하며 모호하지 않습니다. 이 두 가지 속성은 간단하고 빠르며 사실에 입각한 평가를 가능하게 합니다. 우리의 질문은 제로 샷으로 답을 구하도록 설계되어 평가 설정의 영향을 제한합니다. 반대로 많은 LLM 벤치마크는 프롬프트의 수와 성격(Liang 외, 2022b)(섹션 8.2) 또는 벤치마크 구현과 같은 실험 설정에 민감한 평가를 요구합니다.

  • 소셜 미디어의 비인간성

    Regretful Accelerationism
    Stratechery by Ben Thompson

    직업적으로도 개인적으로도 인터넷 발전에서 많은 혜택을 받았던 벤 톰슨이 (기술적) 진보에 관해 마지 못해 가속주의적 관점을 택하고 있는 이유에 관해 설명한다.

    레디 플레이어 원에는 이스터에그라는 ‘현재진행형’이 존재했고, 주인공이 이스터에그를 찾는 과정이 전 세계의 관심을 불러일으켰습니다. 하지만 이러한 묘사는 현실과 맞지 않습니다. 우리는 거장 건축가가 설계한 단일 온라인 세계가 오프라인의 관심을 유도하는 것이 아니라, 여러 측면에서 부수적으로 발생하는 집단적 히스테리에 의해 인간성이 결여된 수많은 사용자가 계획 지점을 중심으로 결집하는 것을 볼 수 있습니다. 그 결과는 누구도 통제할 수 없습니다.

    레디플레이어원과 달리 인터넷에는 단 하나의 가상세계가 아닌 빅테크 기업이 하위 스택을 모두 통제하는 세계로, HTTP와 같은 프로토콜은 존재하지만 이러한 프로토콜은 온라인에서 돈을 벌 수 있다는 생각 이전에 만들어졌다. 오늘날 API는 모두 상업적 의도를 포함하고 있다.

    현재 온라인 세계에서 두 가지 제약이 사라지고 있는데, 하나는 콘텐츠 제작에 필요한 한계비용이 제거되고 있다는 것이고, 다른 하나는 과거에는 이용자 제작 콘텐츠가 지인에 제한되었지만(페이스북처럼), 현재는 전체 네트워크에서 가장 매력적인 콘텐츠를 노출시키고 있다(틱톡처럼).

    두 가지 흐름은 모든 사용자를 위해 생성된 맞춤형 콘텐츠에 관한 문제를 제기한다. 대규모 언어 모델을 활용하여 상호작용하는 부분에 관한 논의가 이루어지고 있지만, 결국 이러한 노력도 타인과 상호작용을 더 원활하게 하기 위함이다. 하지만 벤 톰슨이 느끼기에 온라인에서 인간 대 인간의 상호작용은 사라진 것 같다고 말하며, 온라인에서 살아남기 위해서는 어쩌면 온라인을 멀리하는 것이 방법일 수 있다는 말을 한다.

    이야기를 한 맥락은 X와 같은 소셜 플랫폼에 관한 회의감에서 시작했을 수 있을 것 같은데, 꽤나 여러가지 이슈를 언급하고 있어 생각해 볼 부분이 많다.

  • 인공지능 예술, 솔츠와 아나돌 논쟁

    Art Critic Jerry Saltz Gets Into an Online Skirmish With A.I. Superstar Refik Anadol

    2022년 뉴욕 현대미술관 1층에 설치되어 최근 미술관 영구 소장품으로 인수된 24피트 높이의 스크린 기반 작품 인 언수퍼바이즈드(Unsupervised )를 둘러싸고 논쟁이 벌어졌습니다. 이 작품은 MoMA의 전체 온라인 카탈로그에 대한 알고리즘의 해석을 나타내는 다차원적인 색채의 파동으로 구성되어 있으며, 모더니즘의 가장 유명한 사조의 형태를 반영하고 있습니다. 아트넷 뉴스의 비평가인 벤 데이비스는 이 작품이 충분히 유쾌하지만 분명히 과대 포장된 작품이라고 평가했으며, MoMA는 “현대 미술의 역사를 재구성하고 과거를 꿈꾼다”고 대담하게 주장했습니다.

    예술 비평가들이 흔히 그렇듯이 솔츠는 아나돌 작품의 문화적 가치를 평가할 때 결코 말을 아끼지 않았습니다. 그는 지난 2월 독수리에 실린 리뷰에서 언수퍼비디드가 관객들에게 큰 인기를 끌었고 심지어 “한 번에 몇 분 동안은 약간 재미있었다”고 인정했지만, 궁극적으로 이 작품이 너무 진부하고 눈에 너무 쉽게 들어왔다고 평가했습니다. “이 극도로 통제되고 방부 처리된 환경에서 예술과 의심은 별개의 침실을 유지합니다.”라고 그는 말했습니다.

    가장 기억에 남는 것은 솔츠가 이 작품을 “거대한 테크노 용암 램프”, “50만 달러짜리 스크린 세이버”라고 묘사했다는 점입니다.

    다른 몇 개 기사를 참고해보면 작품에 관한 평가가 과장된 것인지 아닌지 생각해 볼 수 있을 듯

  • 인공지능 라벨과 기사 신뢰도

    Most readers want publishers to label AI-generated articles — but trust outlets less when they do

    대부분의 독자는 퍼블리셔가 AI가 생성한 기사에 라벨을 붙이기를 원하지만, 그렇게 할 경우 언론사에 대한 신뢰도가 떨어진다고 생각하는 것으로 나타났다. 연구진은 뉴스 기사와 함께 출처 목록을 제공했을 때, 인공지능의 사용을 공개하는 라벨이 신뢰도를 떨어뜨리지 않는다는 사실도 발견했다.

    인간의 본성을 나타내주는 연구 결과 같아서 흥미롭다. 다른 결과도 흥미로운 부분이 있어 나중에 참고할 부분이 있을 듯.

  • BBC의 지역뉴스 확대

    Why BBC is ‘the neighbour from hell’ for leading regional newsbrand editors
    PressGazzette

    지역 뉴스를 강화하려는 BBC 계획에 지역 언론이 반대한다는 기사. 지역언론은 BBC가 현재 지역 뉴스 전략을 버리고 기존 지역 뉴스 퍼블리셔와 연계하는 방향을 할 것을 주장

    구글, 메타 등과 달리 BBC의 자금은 수신료로 보장되기 때문에 영국 대중은 지역 저널리즘이 직면한 가장 큰 위협을 감수하고 있습니다. 지역 뉴스 웹사이트에 현금을 쏟아 붓고 있으며, 자랑스러운 독립 뉴스 사이트가 장기적으로 생존하는 것을 점점 더 어렵게 만들고 있습니다.

    어떻게 진행되고 있나요? 지난 2022년 10월, BBC는 영국 전역의 커뮤니티에서 지역 온라인 뉴스 제공을 강화하기 위한 계획을 발표했습니다. 이 계획에는 130개의 추가 게시물을 만드는 것이 포함됩니다. 일반적으로 더 많은 저널리즘을 제공하는 것은 환영할 만한 일이지만, BBC의 계획으로 인해 수 세대에 걸쳐 지역사회에 알려진 수천 개의 기존 일자리가 위험에 처하게 되었습니다.

    우리나라에서 비슷한 일이 발생한다면 지역 뉴스가 살아남을 수 있을까?