[작성자:] haeyeop

  • 가짜뉴스 조사하기

    Asking people to “do the research” on fake news stories makes them seem more believable, not less
    Niemanlab

    미디어리터러시에서 흔히 이야기하는 방법은 정보를 직접 확인해보라는 것이다. 하지만 네이처 연구는 온라인에서 정보를 검색하는 행위가 잘못된 정보를 더 확산시킬 수 있는 가능성이 있다는 결과를 보여준다.

    연구는 단순히 온라인에서 정보를 검색하는 행위 자체가 잘못된 정보를 더욱 확산시킬 수 있다는 사실을 밝혔습니다. 사용자가 온라인에서 직접 정보의 진실성을 평가하려 할 때, 자주 저품질의 정보원으로 인도되어 오히려 잘못된 정보를 더 신뢰하게 되는 경향이 있다는 것입니다. 이는 검색 엔진이 때때로 저품질 정보를 반환할 때 더욱 두드러집니다.

    이런 현상은 ‘데이터 공백’이라는 용어로 설명될 수 있습니다. 이는 특정 검색어에 대해 신뢰할 수 있는 정보원이 부족하여, 자동적으로 저품질 또는 편향된 정보원이 상위에 노출되는 경우를 말합니다. 이러한 문제는 검색 엔진이 주로 사용되는 뉴스 평가 방식(SOTEN)에서 더욱 문제가 되는데, 이 방식이 실제로 잘못된 정보에 대한 믿음을 증가시키는 결과를 낳았습니다.

  • PR 분야 AI 활용, Muck Rack 보고서

    PR professionals flock to AI tools
    Axios

    시각화가 인상적이기도 해서 남기는 글. Axios와 처음 공유한 새로운 Muck Rack 보고서에 따르면, 2023년 3월 이후 PR 전문가들의 제너레이티브 AI 사용은 두 배 이상 증가했다.

    설문 응답자의 72%는 AI가 업무의 질을 향상시켰다고 답했으며, 89%는 AI가 생산성과 속도를 향상시켰다고 답했습니다. … AI 도구 사용에 관심이 없는 응답자 중 43%는 결과물이 너무 예측 불가능하다고 답했고, 40%는 개인정보 보호에 대한 우려가 있으며, 3명 중 1명은 AI가 업무 개선에 도움이 될 수 있다고 생각하지 않는다고 답했습니다.

  • 2024 도서출판의 미래

    The Future of Book Publishing – 2024 and Beyond
    Andrew Rhomberg, Linkedin

    요즘 대학 교재를 살펴보면 출판 분야는 아에 빠져버리는 경우가 종종 있다. 이 글은 올해 초에 작성된 것이고, 어찌 보면 당연한 이야기를 담고 있지만 출판 분야 관심이 적다면 가볍게 읽어볼만하다.

    1. 인공지능 (AI): 인공지능은 출판 산업 전반에 걸쳐 깊숙이 영향을 미치고 있으며, 교육, 훈련, 자기계발 분야에서 특히 중요한 역할을 할 것으로 보입니다.
    2. 아마존: 아마존은 점차 로지스틱스와 광고 플랫폼으로 변모하고 있으며, 종이책과 전자책 판매에서의 영향력이 약화되고 있습니다.
    3. 오디오북: 오디오북 시장은 계속 성장하고 있으며, AI의 발전으로 인해 제작 비용이 절감되고, 접근성이 높아지고 있습니다.
    4. 산업 합병: 출판 산업에서는 대형 출판사들이 더욱 합병을 통해 규모의 경제를 실현하고 있습니다.
    5. 비용 압박: 종이, 잉크, 인쇄, 운송 비용의 상승이 출판 산업에 많은 압박을 주고 있으며, 이는 전자책 시장의 성장을 촉진할 수 있습니다.
    6. 글로벌화: 글로벌 시장에서 영어 책의 판매가 증가하고 있으며, 글로벌화 추세는 계속해서 출판 산업에 영향을 미칠 것입니다.
    7. 럭셔리 아이템: 고급판 책의 수요가 증가하고 있으며, 독특하고 매력적인 디자인의 책이 인기를 얻고 있습니다.
    8. 규모와 크기의 중요성: 큰 출판사와 소매업체가 시장에서 우위를 점하고 있으며, 규모가 더 큰 회사들이 더 많은 시장 점유율을 확보하고 있습니다.
    9. 스트리밍: 디지털 콘텐츠의 스트리밍이 증가하고 있으며, 이는 새로운 비즈니스 모델의 등장으로 이어질 수 있습니다.
    10. TikTok: TikTok과 같은 소셜 미디어 플랫폼이 출판 산업, 특히 영어판 책의 판매에 큰 영향을 미치고 있습니다.

    7번이나 10번 이야기가 조금 새롭게 느껴질 수도 있겠다.

  • 메타의 독립연구 지원 도구

    New Tools to Support Independent Research

    Meta는 사람들이 플랫폼을 어떻게 사용하는지에 대한 데이터에 외부 연구자들이 접근할 수 있는 새로운 도구와 플랫폼을 제공한다.

    • 연구자들이 Facebook과 Instagram에서 더 많은 공개 콘텐츠에 액세스할 수 있는 새로운 도구를 출시합니다.
    • 저희는 정치 및 사회 연구를 위한 대학 간 컨소시엄(ICPSR)과 최초의 파트너십을 체결하여 연구자들이 ICPSR의 안전한 가상 데이터 영역에서 데이터를 분석할 수 있도록 했습니다.
    • 전 세계 경제 이동성의 동인을 더 잘 이해하기 위해 사회적 자본 연구를 확대하고 있습니다.

    이와 관련된 MIT Technology Review의 기사

    연구자들은 특히 플랫폼이 공개를 원치 않을 수 있는 데이터에 접근하는 것과 관련하여 과거에 소셜 미디어 회사와 불편한 관계를 맺어 왔습니다. (예를 들어, 2021년에 페이스북은 웹 스크래핑을 통한 플랫폼의 정치 광고 타겟팅을 조사하던 뉴욕대학교의 투명성 프로젝트 연구진에게 사용자 개인정보를 침해한다는 이유로 연구 중단 서한을 보낸 바 있습니다.)

    클레그는 이 제품이 무엇보다도 “의미 있는” 연구를 가능하게 하기를 원한다고 말하며, 현재 소셜 미디어의 정확한 영향에 대한 연구자들 간의 합의가 부족하며, 이는 소셜 미디어 기업의 공개 데이터 부족으로 인해 더욱 어려워졌다고 강조했습니다.

    새로운 라이브러리는 주로 검색 엔진과 유사한 웹 인터페이스 또는 연구자가 직접 쿼리를 코딩하여 대량의 데이터를 반환할 수 있는 API를 통해 액세스할 수 있는 데이터베이스입니다. 예를 들어, 연구자들은 2023년 2월 14일에 생성형 AI에 관한 모든 공개 게시물을 가장 많이 본 순서부터 가장 적게 본 순서로 정렬하여 보여 달라고 요청할 수 있습니다.

  • GAIA, 언어모델 벤치마크

    FACEBOOK RESEARCHERS TEST AI’S INTELLIGENCE AND FIND IT IS UNFORTUNATELY QUITE STUPID
    The Byte

    새로운 대규모 언어 모델 벤치마크에서 기존 모델의 점수가 형편없다는 기사.

    AI 대부’이자 메타의 수석 과학자인 얀 르쿤이 포함된 연구팀은 아직 동료 심사를 거치지 않은 논문에 따르면 “인간에게는 개념적으로 간단하지만 대부분의 고급 AI에게는 어려운” 466개의 문항으로 구성된 GAIA라는 시험을 고안해냈습니다.

    인간 응답자는 92%의 질문에 정답을 맞힌 반면, 수동으로 선택한 일부 플러그인을 장착한 GPT4는 15%에 불과했습니다. 이 팀이 발표한 GAIA 순위표에 따르면 OpenAI가 최근 출시한 GPT4 Turbo의 점수는 10% 미만이었습니다.

    GAIA 목표가 무엇인지 해당 아카이브 논문의 일부 내용.

    인간에게는 어려운 작업 대신, 개념적으로는 간단하지만 조합 공간이 큰 복잡한 작업 시퀀스를 정확하게 실행해야 하는 작업을 AI 시스템에 요청할 수 있습니다. 컴퓨터에게 해결책을 쉽게 검증할 수 있는 복잡한 문제를 풀도록 요청하는 작업 증명 알고리즘(Jakobsson and Juels, 1999; Dwork and Naor, 1993)과 유사하게, 작업을 성공적으로 완료해야만 결과를 얻을 수 있고 검증이 용이해야 합니다. 다양하고 불확실한 세계에 접근해야 하는 인공지능 비서를 위한 작업은 본질적으로 실제 사용 사례에 뿌리를 두면서 이 기준을 충족해야 합니다.

    우리는 이러한 방향으로 나아가기 위해 466개의 세심하게 만들어진 질문과 그에 대한 답변, 그리고 관련 설계 방법론으로 구성된 일반 AI 어시스턴트의 벤치마크인 GAIA를 제안합니다. 우리의 질문은 만들기도 쉽고, AI 시스템(LLM의 경우 대부분 복잡한 생성이 필요함)에 도전적이지만, 독특하고 사실적인 답변을 인정하여 간단하고 강력한 자동 평가가 가능합니다.

    GAIA는 다음과 같은 목표를 통해 현재 LLM 평가의 함정을 피하고자 합니다:

    • 실제적이고 도전적인 질문. 예를 들어, LLM은 일반적으로 개방적이고 변화하는 웹을 탐색하거나, 다중 모달리티를 처리하거나, 질문에 답하기 위해 여러 단계를 거쳐 추론해야 합니다. 반대로, 많은 LLM 벤치마크는 매우 구체적이거나 폐쇄적이고 합성된 환경으로 제한되어 있습니다.
    • 개념적으로 간단한 작업을 통한 쉬운 해석 가능성(비전문가인 주석가도 만점에 가까운 점수를 나타냄), 관련 추론 추적, 몇 개 되지 않지만 고도로 선별된 질문. 이는 효율성과 신뢰성이 부족한 집계된 벤치마크와는 대조적입니다(Perlitz 외, 2023).
    • 비게임성. 질문에 답하려면 몇 가지 단계를 성공적으로 완료해야 하는데, 이러한 단계는 다양하기 때문에 쉽게 강제할 수 없습니다. 추론의 흔적을 확인할 수 있고, 정답에 요구되는 정확성, 인터넷에서 일반 텍스트로 제공되지 않기 때문에 데이터 오염 가능성을 방지할 수 있습니다. 반면, 객관식 답안(예: MMLU)은 잘못된 추론 추적이 정답에 더 쉽게 도달할 수 있기 때문에 오염 평가를 더 어렵게 만듭니다.
    • 사용의 단순성. 결정적으로, 질문에 대한 답변은 사실적이고 간결하며 모호하지 않습니다. 이 두 가지 속성은 간단하고 빠르며 사실에 입각한 평가를 가능하게 합니다. 우리의 질문은 제로 샷으로 답을 구하도록 설계되어 평가 설정의 영향을 제한합니다. 반대로 많은 LLM 벤치마크는 프롬프트의 수와 성격(Liang 외, 2022b)(섹션 8.2) 또는 벤치마크 구현과 같은 실험 설정에 민감한 평가를 요구합니다.

  • 딥페이크 스캠

    Rob’s Notes 9: Beware Deepfake Scams

    유명 연예인을 ‘미끼’로 사용해 사용자의 클릭을 유도하거나(예: 스타의 사망 또는 체포 암시), 해당 연예인이 해당 제품이나 서비스를 사용하거나 보증한 것처럼 가장하는 ‘셀럽 미끼’를 오랫동안 사용해 온 사기성 광고에 대한 내용.

    이 비디오는 종종 지역 뉴스 소스의 딥페이크 뉴스 보도(위, BBC 뉴스가 디지털 방식으로 변경된 경우)나 영국의 마틴 루이스와 같은 지역 금융계 유명인의 소개로 시작됩니다. 그런 다음 엘론 머스크가 흐릿한 배경(아마도 유출된 Zoom 통화에서 뜯어낸 것일 수 있음)이나 컨퍼런스에서 연설하거나 거래 이미지를 보여주는 다양한 주식 ‘주식 시장’ 비디오 영상과 함께 연설하는 장면이 등장할 수 있습니다. 가짜 머스크는 다음과 같이 설명합니다:

    • 그들은 애플, 구글 등의 엔지니어들과 함께 양자 컴퓨팅 거래 시스템을 개발하는 데 몇 년 동안 10억~50억 달러를 투자했습니다.
    • 항상 성공하는 것은 아니지만, 그의 시스템은 “90% 이상의 효율로 거래에서 승리”합니다.
    • 250파운드부터 시작하여 하루에 5700파운드 이상을 벌 수 있습니다.
    • 루이스 해밀턴, 리처드 브랜슨, 차마스 팔리하피티야 등 많은 유명인들이 이에 참여하고 지지하고 있으며, 때로는 이 계획 자체가 아닌 비트코인에 대해 이야기하는 비디오 영상을 사용하기도 합니다.
    • 영국인들이 더 이상 일할 필요가 없을 것이라는 주장과 기타 주장
  • 인공지능 예술, 솔츠와 아나돌 논쟁

    Art Critic Jerry Saltz Gets Into an Online Skirmish With A.I. Superstar Refik Anadol

    2022년 뉴욕 현대미술관 1층에 설치되어 최근 미술관 영구 소장품으로 인수된 24피트 높이의 스크린 기반 작품 인 언수퍼바이즈드(Unsupervised )를 둘러싸고 논쟁이 벌어졌습니다. 이 작품은 MoMA의 전체 온라인 카탈로그에 대한 알고리즘의 해석을 나타내는 다차원적인 색채의 파동으로 구성되어 있으며, 모더니즘의 가장 유명한 사조의 형태를 반영하고 있습니다. 아트넷 뉴스의 비평가인 벤 데이비스는 이 작품이 충분히 유쾌하지만 분명히 과대 포장된 작품이라고 평가했으며, MoMA는 “현대 미술의 역사를 재구성하고 과거를 꿈꾼다”고 대담하게 주장했습니다.

    예술 비평가들이 흔히 그렇듯이 솔츠는 아나돌 작품의 문화적 가치를 평가할 때 결코 말을 아끼지 않았습니다. 그는 지난 2월 독수리에 실린 리뷰에서 언수퍼비디드가 관객들에게 큰 인기를 끌었고 심지어 “한 번에 몇 분 동안은 약간 재미있었다”고 인정했지만, 궁극적으로 이 작품이 너무 진부하고 눈에 너무 쉽게 들어왔다고 평가했습니다. “이 극도로 통제되고 방부 처리된 환경에서 예술과 의심은 별개의 침실을 유지합니다.”라고 그는 말했습니다.

    가장 기억에 남는 것은 솔츠가 이 작품을 “거대한 테크노 용암 램프”, “50만 달러짜리 스크린 세이버”라고 묘사했다는 점입니다.

    다른 몇 개 기사를 참고해보면 작품에 관한 평가가 과장된 것인지 아닌지 생각해 볼 수 있을 듯

  • 인공지능 라벨과 기사 신뢰도

    Most readers want publishers to label AI-generated articles — but trust outlets less when they do

    대부분의 독자는 퍼블리셔가 AI가 생성한 기사에 라벨을 붙이기를 원하지만, 그렇게 할 경우 언론사에 대한 신뢰도가 떨어진다고 생각하는 것으로 나타났다. 연구진은 뉴스 기사와 함께 출처 목록을 제공했을 때, 인공지능의 사용을 공개하는 라벨이 신뢰도를 떨어뜨리지 않는다는 사실도 발견했다.

    인간의 본성을 나타내주는 연구 결과 같아서 흥미롭다. 다른 결과도 흥미로운 부분이 있어 나중에 참고할 부분이 있을 듯.

  • BBC의 지역뉴스 확대

    Why BBC is ‘the neighbour from hell’ for leading regional newsbrand editors
    PressGazzette

    지역 뉴스를 강화하려는 BBC 계획에 지역 언론이 반대한다는 기사. 지역언론은 BBC가 현재 지역 뉴스 전략을 버리고 기존 지역 뉴스 퍼블리셔와 연계하는 방향을 할 것을 주장

    구글, 메타 등과 달리 BBC의 자금은 수신료로 보장되기 때문에 영국 대중은 지역 저널리즘이 직면한 가장 큰 위협을 감수하고 있습니다. 지역 뉴스 웹사이트에 현금을 쏟아 붓고 있으며, 자랑스러운 독립 뉴스 사이트가 장기적으로 생존하는 것을 점점 더 어렵게 만들고 있습니다.

    어떻게 진행되고 있나요? 지난 2022년 10월, BBC는 영국 전역의 커뮤니티에서 지역 온라인 뉴스 제공을 강화하기 위한 계획을 발표했습니다. 이 계획에는 130개의 추가 게시물을 만드는 것이 포함됩니다. 일반적으로 더 많은 저널리즘을 제공하는 것은 환영할 만한 일이지만, BBC의 계획으로 인해 수 세대에 걸쳐 지역사회에 알려진 수천 개의 기존 일자리가 위험에 처하게 되었습니다.

    우리나라에서 비슷한 일이 발생한다면 지역 뉴스가 살아남을 수 있을까?

  • 언론에 관한 선입견

    Opinion Actually, people don’t hate the media as much as you think
    Washington Post

    언론에 대해 가지는 몇 가지 선입견이 그렇지 않은 경우가 많다는 것을 보여주는 오피니언 글. 조사 방법에 따라 언론 신뢰도 달라지며, 보수와 진보의 차이도 생각보다 크지 않을 수 있다는 언급을 한다.

    갤럽의 조사에 따르면 미국인의 34%만이 언론이 뉴스를 “완전하고 정확하며 공정하게” 보도한다고 “어느 정도” 신뢰하고 확신하고 있습니다. 하지만 같은 질문을 약간만 달리해서 물어보면 결과는 상당히 달라집니다. 시카고 대학교의 리서치 회사인 NORC에서는 사람들에게 갤럽이 사용하는 4점 척도가 아닌 5점 척도, 즉 5개의 가능한 답변을 제공합니다. 이 방법을 사용하면 미국인의 절반 이상(55%)이 언론의 정확성을 신뢰합니다. 퓨 리서치 센터는 여전히 다른 방식으로 질문한 결과, 61%가 국가 뉴스 기관에서 얻는 정보를 “매우” 또는 “어느 정도” 신뢰한다고 답했습니다.

    “요점은 책임 있는 언론의 인프라를 재구축하는 방법과 언론의 운영 방식에 대해 생각할 때 일반화나 획일적인 가정을 경계해야 한다는 것입니다. 우리는 아직 모르는 것이 많습니다.”라고 말한다.