[작성자:] haeyeop

  • 트위터 추천알고리즘 일부 공개

    Twitter reveals some of its source code, including its recommendation algorithm
    TechCrunch, by Kyle Wiggers

    트위터 추천 알고리즘 공개와 오픈소스에 대한 논쟁이 있었는데, 트위터가 소스코드 일부를 깃허브에 공개했다. 트위터는 “더 투명해지기 위한 첫 번째 단계”라고 밝혔다. 일부 공개된 내용으로 인해 언급되고 있는 것은 공개되지 않은 부분에 관한 내용이다. 주요 내용 중 하나는 소스에 따라 트윗을 다르게 취급하고 있다는 점이다. 파워유저인지 아닌지에 따라, 정치적 성향(공화당인지 민주당인지)에 따라 트윗을 다르게 취급할 수 있다는 가능성이 제기되었다.

    Gizmodo는 공개되지 않은 것으로 보이는 한 가지는 Twitter가 사용자에게 푸시하는 VIP 목록이라고 말합니다. 이번 주 Platformer는 트위터가 유튜버 미스터 비스트(Mr. Beast)와 데일리 와이어(Daily Wire) 설립자 벤 샤피로(Ben Shapiro)를 포함해 주목할 만한 사용자 목록을 돌아가며 쓰고 있다고 보도했습니다.
    알고리즘이 소스에 따라 트윗을 다르게 취급할 수 있다는 더 많은 증거가 있습니다. Jane Manchun Wong 연구원은 Twitter의 알고리즘이 트윗 작성자가 Elon Musk인지 여부를 구체적으로 표시하고 작성자가 “파워 유저”인지, 공화당원인지 민주당원인지를 나타내는 다른 레이블을 가지고 있다고 언급했습니다.
    오늘 오후 Spaces 세션에서 Twitter 엔지니어는 레이블이 메트릭에만 사용되었다고 말했습니다. 그러나 오늘 이전에는 라벨을 몰랐다고 말한 머스크는 라벨이 있으면 안 된다고 말했습니다.[expand title=eng]
    Gizmodo notes that one thing that doesn’t appear to have been made public is the list of VIPs that Twitter pushes to users. This week, Platformer reported that Twitter has a rotating list of noteworthy users, including YouTuber Mr. Beast and Daily Wire founder Ben Shapiro, that it uses to monitor changes to the recommendation algorithm by increasing the visibility of these “power users” seemingly at will.
    There’s more evidence that the algorithm may treat tweets differently depending on the source. Researcher Jane Manchun Wong noted that Twitter’s algorithm specifically labels whether the tweet author is Elon Musk and has others labels indicating whether the author is a “power user” as well as whether they’re a Republican or Democrat.
    During the Spaces session this afternoon, a Twitter engineer said that the labels were used only for metrics. But Musk — who said he wasn’t aware of the labels prior to today — said that they shouldn’t be there.[/expand]

  • 리바이스의 AI 모델

    Levi’s will test AI-generated clothing models to ‘increase diversity’ / The denim brand claims the tech will be used to ‘supplement human models’ rather than completely replace them.
    By Jess Weatherbed

    A realistic-looking young female model wears Levi's overalls and looks into the camera.

    생성AI로 인해 사라지게 될 직업이 무엇이 있는지에 대해 많은 이야기가 있는데 모델은 그래도 다른 창작 작업을 하는 사람들에 비해 영향을 덜 받지 않을까 하는 의견도 있었다. 아무래도 옷의 핏이나 질감 같은걸 정확하게 표현하는게 어렵지 않을까 하는 의견을 이야기한 사람들도 있었는데 리바이스가 AI 모델을 사용한다고 발표했고 꽤 많은 논란이 있었다. 논란의 이유는 인간 모델을 (비용상 이유로) 완전 대체하는 것 아닌지에 관한 우려이다.

    현재 Levi’s 앱이나 웹사이트에서 광고하는 대부분의 제품은 단일 의류 모델에서만 볼 수 있습니다. 이 파트너십으로 생성된 AI 의류 모델은 보다 신체를 포괄적으로 포함할 수 있으므로 고객은 다양한 신체 유형, 연령, 크기 및 피부 색조에 걸친 다양한 모델에서 의류가 어떻게 보이는지 볼 수 있습니다. 이론상으로는 의류 품목이 자신의 신체와 닮은 모델이 아닐 때 좌절하는 소비자에게 도움이 될 것입니다.[expand title=eng]
    Currently, most products advertised on the Levi’s app or website can only be viewed on a single clothing model. The AI clothing models created by this partnership could be more body-inclusive, allowing customers to view what an article of clothing would look like on a multitude of models spanning a wide range of body types, ages, sizes, and skin tones. In theory, that should help consumers who are frustrated when clothing items aren’t modeled on a body that resembles their own.[/expand]

    기사제목에서 이야기한 것처럼 인간 모델을 완전히 대체하는 것은 아니라고 했으나 미래에 어떻게 변화할지는 고민해 볼 일이다. 퀄리티가 몇 년 전과 비교하기에는 급격하게 향상되었다.

  • 발렌시아가 입은 교황

    AI Images Like the “Balenciaga Pope” Are Getting Harder to Spot
    By Billy Perrigo

    교황이 발렌시아가 패딩을 입은 사진이 온라인에서 바이럴 된 바 있다. 딥페이크에 관한 논의에서 이미지가 어색한 부분을 확인하는 방법 또는 이미지를 직접 검색해보는 방법을 활용해 진위여부를 판별할 수 있다는 이야기들을 했다. 이 사진도 진짜같지만 십자가 목걸이, 손모양 등을 참고하면 아직까지 조금 어색한 부분들을 발견할 수 있다. 그럼에도 불구하고 얼핏 보면 이 사진이 어색하다는 걸 발견할 수 있을까?

    출처 이미지 제공: Instagram을 통한 @art_is_2_inspire

    딥페이크 비디오를 감지하는 데 96% 정확하다고 말하는 Intel의 제품을 포함하여 딥페이크를 감지할 수 있다고 주장하는 판매용 소프트웨어가 많이 있습니다. 그러나 이미지가 AI로 생성되었는지 여부를 안정적으로 알려줄 수 있는 무료 온라인 도구는 거의 없습니다. AI 플랫폼 Hugging Face에서 호스팅되는 무료 AI 이미지 감지기 1개 는 Balenciaga Pope의 이미지가 AI로 생성되었음을 69%의 확실성으로 정확하게 감지할 수 있었습니다. 그러나 최신 버전의 Midjourney에서 제작한 Elon Musk의 AI 생성 이미지를 제시 한 이 도구는 이미지가 진짜라고 54% 확신한다고 말하면서 잘못된 대답을 했습니다.

  • 금융을 위한 BloombergGPT

    Introducing BloombergGPT, Bloomberg’s 50-billion parameter large language model, purpose-built from scratch for finance

    Bloomberg의 ML 제품 및 연구 그룹은 회사의 AI 엔지니어링 팀과 협력하여 회사의 기존 데이터 생성, 수집 및 큐레이션 리소스를 활용하여 지금까지 가장 큰 도메인별 데이터 세트 중 하나를 구성했습니다. 금융 데이터 회사로서 Bloomberg의 데이터 분석가들은 40년 동안 금융 언어 문서를 수집하고 유지해 왔습니다. 팀은 이 광범위한 재무 데이터 아카이브에서 영어 재무 문서로 구성된 포괄적인 3,630억 개의 토큰 데이터 세트를 생성했습니다. 이 데이터는 3,450억 개의 토큰 공개 데이터 세트로 보강되어 7,000억 개가 넘는 토큰이 있는 대규모 교육 코퍼스를 생성했습니다. 이 훈련 코퍼스의 일부를 사용하여 팀은 500억 개의 매개변수 디코더 전용 인과 언어 모델을 훈련했습니다. 결과 모델은 기존 금융 관련 NLP 벤치마크, Bloomberg 내부 벤치마크 모음 및 널리 사용되는 벤치마크(예: BIG-bench Hard, Knowledge Assessments, Reading Comprehension 및 Linguistic Tasks)의 광범위한 범용 NLP 작업 범주에서 검증되었습니다. . 특히, BloombergGPT 모델은 일반 NLP 벤치마크에서 동등 이상의 성능을 유지하면서 재무 작업에 대해 비슷한 크기의 기존 개방형 모델보다 큰 차이로 성능이 뛰어납니다.

    LLM 배포로 인해 여러 분야에서 발생하고 있는 일. 얼마전에는 LLaMA를 가지고 자기가 가진 데이터를 활용해 세무상담 챗봇을 만들었다는 세무사도 보았다. 뉴스를 가지고 비슷한 작업을 했을때도 가치있는 무언가를 만들어낼 수 있을까 하는 생각을 해봤다.

  • 구글 광고투명성센터

    메타(메타 광고 라이브러리)에 이어 구글도 자사 플랫폼에 게재된 모든 광고를 볼 수 있는 도구를 공개했다.

    광고 투명성 센터는 인증된 광고주가 제공하는 모든 광고의 검색 가능한 허브입니다.

    이 원스톱 상점은 Google에서 표시되는 광고에 대한 정보에 쉽게 액세스할 수 있도록 사용자를 염두에 두고 설계되었습니다. 광고 투명성 센터를 통해 다음을 이해할 수 있습니다.

    • 광고주가 실행한 광고
    • 특정 지역에 게재된 광고
    • 광고가 실행된 마지막 날짜 및 광고 형식.
    https://blog.google/technology/ads/announcing-the-launch-of-the-new-ads-transparency-center/

  • GenAI의 인터페이스 문제

    Unpredictable Black Boxes are Terrible Interfaces

    프롬프트에 텍스트를 입력하여 결과물을 출력하는 생성인공지능이 왜 끔찍한 인터페이스를 가지고 있는지에 관한 글. 실제로 결과물을 얻기위해서는 수십차례의 시행착오를 겪어야하며, 이로 인해 프롬프트를 거래하는 프롬프트베이스와 같은 서비스도 생긴 상황. 해당 글에서는 몇 가지 논문을 바탕으로 다른 방식에 대한 이야기를 하기도 함.

    제너레이티브 AI 모델은 놀랍지만 끔찍한 인터페이스입니다. 사용자가 입력 제어가 출력에 미치는 영향을 예측할 수 없으면 시행 착오에 의존해야 하는데 이는 실망스러운 일입니다. 이것은 새로운 콘텐츠를 생성하기 위해 생성 AI를 사용할 때 중요한 문제이며 입력 컨트롤과 출력 간의 매핑이 명확하지 않은 한 문제로 남을 것입니다. 그러나 우리는 사용자가 AI와 공통 기반/공유 의미론을 설정할 수 있고 그러한 공유 의미론이 누락되었을 때 복구 메커니즘을 제공할 수 있는 대화형 상호 작용을 활성화하여 AI 인터페이스를 개선할 수 있습니다.

    결론 부분만 짧게 옮겨놓았지만 읽어볼만한 글이다.

  • 와이어드의 생성 인공지능 사용규칙

    How WIRED Will Use Generative AI Tools

    와이어드 가 생성인공지능 정책을 공개했다. 간단히 이야기하자면 대부분의 경우에 생성 인공지능을 사용하지 않는 것으로 결정한 것 같다. 인공지능이 발전할 것이라고 생각하고 이후 변할 수는 있다고 보지만 지금 현재 상태에서의 결정은 아래와 같다.

    AI 텍스트 생성기 (예: LaMDA, ChatGPT)

    • 트위터에서는 AI가 생성한 텍스트가 포함된 스토리를 게시하지 않습니다.
    • 짧은 소셜 미디어 게시물의 헤드라인이나 텍스트를 추천하기 위해 AI를 사용할 수 있습니다.
    • 우리는 연구 또는 분석 도구로 AI를 사용하는 실험을 할 수 있습니다.

    이미지 생성기(예: Dall-E, 미드저니, 스테이블 디퓨전)

    • 트위터에서는 AI가 생성한 이미지나 동영상을 게시하지 않습니다.
    • 특히 스톡 사진 대신 AI가 생성한 이미지는 사용하지 않습니다.
    • 당사 또는 당사가 의뢰한 아티스트는 AI 도구를 사용하여 아이디어를 촉발할 수 있습니다.

  • 엑티베이트 컨설팅 테크놀로지 미디어 아웃록 2023

    ACTIVATE TECHNOLOGY & MEDIA OUTLOOK 2023

    엑티베이트에서 매년 나오는 테크놀로지 미디어 아웃룩. 주요 키워드로 제시된 내용을 간략하게 요약했다. 스포츠 베팅, 디지털 피트니스, 수퍼 유저라는 키워드가 눈에 띈다.

    팬데믹으로 인해 소비자들이 기술과 미디어에 소비하는 시간이 늘어났으며, 이러한 추세는 계속될 것으로 예상됩니다. 성장과 기회를 위한 주요 영역은 다음과 같습니다:

    1. 이커머스 및 마켓플레이스: 2026년까지 미국 소매 판매의 20%가 이커머스를 통해 이루어질 것으로 예상되며, 이는 주요 업체, 카테고리 중심 비즈니스, 리커머스, 라이브 스트리밍 쇼핑, BNPL 및 쇼핑 멤버십과 같은 트렌드에 의해 주도될 것입니다.
    2. 비디오: TikTok은 비디오, 메시징, 검색, 이커머스 등 다양한 분야에 지각변동을 일으킬 것입니다. 스트리밍 및 소셜 비디오는 TV를 추월할 것이며, 스트리밍 전쟁은 번들 서비스, 오리지널 콘텐츠에 대한 투자 증가, 광고 지원 계층, 국제적인 성장으로 이어질 것입니다.
    3. 게임과 e스포츠: 비디오 게임은 주류 활동이 되었으며, 습관적인 게이머가 메타버스의 얼리 어답터가 될 것으로 예상됩니다.
    4. 대체 불가능한 토큰: 대체 불가능한 토큰에 대한 소비자 사용 사례는 투기에서 보다 실질적인 애플리케이션으로 전환될 것이며, 대체 불가능한 토큰의 수익은 계속 증가할 것으로 예상됩니다.
    5. 메타버스: 기본 요소는 이미 비디오 게임에 존재하며, 기업은 “상호운용성 계층”에서 기회를 포착하기 위해 지금 개발 및 실제 애플리케이션에 투자해야 합니다.
    6. 오디오: 디지털 오디오는 음악과 팟캐스트 광고에 대한 시간과 지출을 증가시킬 것입니다. 틱톡은 음악 검색을 재편할 것이며, 대면 및 가상 라이브 이벤트는 계속 성장할 것입니다.
    7. 스포츠 및 스포츠 베팅: 새로운 소비자 세대가 등장하고, 라이브 스포츠가 스트리밍으로 전환되며, 스포츠 베팅이 점점 더 보편화되는 등 스포츠 산업은 전환기에 있습니다.
    8. 디지털 피트니스: 디지털 피트니스 기술의 채택이 크게 증가하여 2026년까지 시장 규모가 300억 달러에 달할 것으로 예상됩니다. 가상 현실은 메타버스에서 디지털 피트니스 경험을 향상시킬 것입니다.
    9. 슈퍼 유저: 기업은 ‘메타버스 네이티브’로서 기술 및 미디어에 대한 시간과 비용 지출에 큰 영향을 미치는 슈퍼 유저를 파악하고 이들을 만족시켜야 합니다.
    10. 기술 및 미디어 수익: 경제 불확실성에도 불구하고 2026년까지 전 세계 지출은 4,000억 달러 이상에 달할 것으로 예상됩니다.
  • 인공지능, 검증, 저작권

    AI, NIL, and Zero Trust Authenticity
    By Stratechery

    드레이크와 더위켄드의 콜라보레이션이 인공지능으로 만들어진 곡이었던 것과 관련해 작성한 벤 톰슨의 글이다. 소셜미디어에서 인기를 끌었던 영상은 저작권자 유니버셜뮤직의 신고로 삭제되었다. 아래는 해당 글에 대한 간략한 요약.

    이 사건과 관련해서 벤 톰슨은 인공지능이 음악 창작에 미칠 영향과 음원 업계가 대처하는 방식에 대해 다룬다. 음원 업계는 AI가 저작권을 침해하거나 인기 아티스트의 음악을 모방하여 유사한 곡을 만드는 것이 점차 많아질 것이다. 이러한 문제를 해결하기 위해 음원 업계는 스트리밍 플랫폼에서 AI가 음원을 수집하거나 가공하는 것을 막도록 요청하고 있다.

    AI가 창작하는 콘텐츠가 늘어남에 따라 콘텐츠의 진짜 출처와 정체성이 중요해지고 있다. 음악 레이블은 AI가 저작권을 침해하거나 인기 아티스트의 스타일을 모방하여 AI에 의해 창작된 노래를 제거하도록 요청하고 있지만, 다양한 콘텐츠가 창출될 수 있는 AI 생성 콘텐츠의 정체성을 보장하는 것이 중요하다 제시한다. 이를 위해, 콘텐츠의 출처와 정체성을 검증하는 ‘제로 트러스트 신뢰성’ 모델이 필요하다 말한다. 이 모델은 기존 보안 방식인 ‘성벽-해자’ 모델을 버리고 모든 사용자와 콘텐츠를 ‘신뢰하지 않는 것’으로 시작하는 것이 필요하고 본다.

    벤 톰슨이 언급한 내용은 이미 잘한다는 생각이 드는 크리에이터 커뮤니티에서 흔하게 볼 수 있는 방법이지만 글에서 몇 가지 인상적인 내용이 있다. 우선, 잘못된 정보를 검열하려는 시도는 실패할 수밖에 없다는 이야기를 하며 제로 트러스트 신뢰성을 언급하는데 1) 아마도 인공지능 생성 콘텐츠가 급격하게 증가하면 지금의 이러한 방식은 완전히 불가능해질 것이라는 점, 그리고 2)이미 사람들은 온라인에서 읽는 내용에 대체로 회의적이라는 것이다. 마지막으로 3) 본질적 가치가 어디에서 오는지에 대해 생각해볼 필요가 있다는 점이다.

    트위터의 최근 시도, 그동안 관심을 좀 덜 가지던 블록체인이 왜 중요한 이슈가 될 수 있는지 생각해볼만 하다.

  • 로봇용 인공지능

    최근에 과연 내가 할 수 있는 일이 무엇인지에 대해 생각해보게 되는데, 예전에 낮은 수준의 자동화에 관해 논의하던 시절과는 확실히 다른 분위기가 있는 것 같다. 대규모 언어 모델이 등장한 이후에 그동안 매달리던 문제들이 한꺼번에 해결되었다고 말하는 사람들이 꽤나 있고, 개발자 커뮤니티에서 목수일을 배울까 고민중이라고 글을 쓰는 사람도 보았다.

    대규모 언어 모델 등장 이후에 육체노동자보다 일부 전문직 노동자가 대체될 가능성이 높다는 이야기 때문인 듯 하다. 한국언론진흥재단 일반 이용자 대상의 설문조사를 보면 생성 인공지능의 직업 대체 가능성을 보았을 때, 번역가/통역사(90.9%), 데이터분석 전문가(86.9%), 자산관리사/보험설계사 (79.2%), 회계사/세무사(74.0%)로 나타난다. 10개 직업군이 대부분 전문직종에 속하기 때문에 육체노동자와 비교하여 보기는 어렵지만 일반인들의 인식 경향을 확인해볼 수 있는 자료다.

    하지만 육체노동자라도 크게 다르지 않을 것 같다. 올해 주식시장에서 가장 주목받은 섹터를 뽑으라면 2차전지와 로봇이라고 할 수 있는데 로봇의 성능향상도 급격하게 이루어질 가능성이 커보인다. 아마존과 구글은 이와 관련된 연구를 거의 비슷한 시기에 발표했다.

    Amazon releases largest dataset for training “pick and place” robots
    아마존은 창고에서 제품을 선택, 분류 및 포장하는 로봇의 성능을 개선하기 위한 노력의 일환으로 산업용 제품 분류 환경에서 캡처한 가장 큰 이미지 데이터 세트를 공개했습니다 . 산업 이미지의 가장 큰 이전 데이터 세트가 대략 100개 객체에 대해 특징을 나타낸 반면 ARMBench라고 하는 Amazon 데이터 세트는 190,000개 이상의 개체를 특징으로 합니다. 따라서 새로운 제품과 컨텍스트에 더 잘 일반화할 수 있는 “선택 및 배치” 로봇을 훈련하는 데 사용할 수 있습니다.

    RT-1: Robotics Transformer: for Real-World Control at Scale
    다중 작업 시연의 대규모 데이터 세트를 교육하고 새 작업으로 일반화하는 방법, 환경 변화에 대한 견고성 및 방법을 보여주는 Transformer 기반 모델인 Robotics Transformer, RT-1을 제시합니다. 

    Deep RL at Scale: Sorting Waste in Office Buildings with a Fleet of Mobile Manipulators
    사무실 건물에서 재활용품과 쓰레기를 분류하는 대규모 실제 작업에 적용된 로봇 조작 기술의 심층 강화 학습 시스템에 대해 설명합니다.