[카테고리:] Media

  • 리바이스의 AI 모델

    Levi’s will test AI-generated clothing models to ‘increase diversity’ / The denim brand claims the tech will be used to ‘supplement human models’ rather than completely replace them.
    By Jess Weatherbed

    A realistic-looking young female model wears Levi's overalls and looks into the camera.

    생성AI로 인해 사라지게 될 직업이 무엇이 있는지에 대해 많은 이야기가 있는데 모델은 그래도 다른 창작 작업을 하는 사람들에 비해 영향을 덜 받지 않을까 하는 의견도 있었다. 아무래도 옷의 핏이나 질감 같은걸 정확하게 표현하는게 어렵지 않을까 하는 의견을 이야기한 사람들도 있었는데 리바이스가 AI 모델을 사용한다고 발표했고 꽤 많은 논란이 있었다. 논란의 이유는 인간 모델을 (비용상 이유로) 완전 대체하는 것 아닌지에 관한 우려이다.

    현재 Levi’s 앱이나 웹사이트에서 광고하는 대부분의 제품은 단일 의류 모델에서만 볼 수 있습니다. 이 파트너십으로 생성된 AI 의류 모델은 보다 신체를 포괄적으로 포함할 수 있으므로 고객은 다양한 신체 유형, 연령, 크기 및 피부 색조에 걸친 다양한 모델에서 의류가 어떻게 보이는지 볼 수 있습니다. 이론상으로는 의류 품목이 자신의 신체와 닮은 모델이 아닐 때 좌절하는 소비자에게 도움이 될 것입니다.[expand title=eng]
    Currently, most products advertised on the Levi’s app or website can only be viewed on a single clothing model. The AI clothing models created by this partnership could be more body-inclusive, allowing customers to view what an article of clothing would look like on a multitude of models spanning a wide range of body types, ages, sizes, and skin tones. In theory, that should help consumers who are frustrated when clothing items aren’t modeled on a body that resembles their own.[/expand]

    기사제목에서 이야기한 것처럼 인간 모델을 완전히 대체하는 것은 아니라고 했으나 미래에 어떻게 변화할지는 고민해 볼 일이다. 퀄리티가 몇 년 전과 비교하기에는 급격하게 향상되었다.

  • 금융을 위한 BloombergGPT

    Introducing BloombergGPT, Bloomberg’s 50-billion parameter large language model, purpose-built from scratch for finance

    Bloomberg의 ML 제품 및 연구 그룹은 회사의 AI 엔지니어링 팀과 협력하여 회사의 기존 데이터 생성, 수집 및 큐레이션 리소스를 활용하여 지금까지 가장 큰 도메인별 데이터 세트 중 하나를 구성했습니다. 금융 데이터 회사로서 Bloomberg의 데이터 분석가들은 40년 동안 금융 언어 문서를 수집하고 유지해 왔습니다. 팀은 이 광범위한 재무 데이터 아카이브에서 영어 재무 문서로 구성된 포괄적인 3,630억 개의 토큰 데이터 세트를 생성했습니다. 이 데이터는 3,450억 개의 토큰 공개 데이터 세트로 보강되어 7,000억 개가 넘는 토큰이 있는 대규모 교육 코퍼스를 생성했습니다. 이 훈련 코퍼스의 일부를 사용하여 팀은 500억 개의 매개변수 디코더 전용 인과 언어 모델을 훈련했습니다. 결과 모델은 기존 금융 관련 NLP 벤치마크, Bloomberg 내부 벤치마크 모음 및 널리 사용되는 벤치마크(예: BIG-bench Hard, Knowledge Assessments, Reading Comprehension 및 Linguistic Tasks)의 광범위한 범용 NLP 작업 범주에서 검증되었습니다. . 특히, BloombergGPT 모델은 일반 NLP 벤치마크에서 동등 이상의 성능을 유지하면서 재무 작업에 대해 비슷한 크기의 기존 개방형 모델보다 큰 차이로 성능이 뛰어납니다.

    LLM 배포로 인해 여러 분야에서 발생하고 있는 일. 얼마전에는 LLaMA를 가지고 자기가 가진 데이터를 활용해 세무상담 챗봇을 만들었다는 세무사도 보았다. 뉴스를 가지고 비슷한 작업을 했을때도 가치있는 무언가를 만들어낼 수 있을까 하는 생각을 해봤다.

  • 구글 광고투명성센터

    메타(메타 광고 라이브러리)에 이어 구글도 자사 플랫폼에 게재된 모든 광고를 볼 수 있는 도구를 공개했다.

    광고 투명성 센터는 인증된 광고주가 제공하는 모든 광고의 검색 가능한 허브입니다.

    이 원스톱 상점은 Google에서 표시되는 광고에 대한 정보에 쉽게 액세스할 수 있도록 사용자를 염두에 두고 설계되었습니다. 광고 투명성 센터를 통해 다음을 이해할 수 있습니다.

    • 광고주가 실행한 광고
    • 특정 지역에 게재된 광고
    • 광고가 실행된 마지막 날짜 및 광고 형식.
    https://blog.google/technology/ads/announcing-the-launch-of-the-new-ads-transparency-center/

  • 와이어드의 생성 인공지능 사용규칙

    How WIRED Will Use Generative AI Tools

    와이어드 가 생성인공지능 정책을 공개했다. 간단히 이야기하자면 대부분의 경우에 생성 인공지능을 사용하지 않는 것으로 결정한 것 같다. 인공지능이 발전할 것이라고 생각하고 이후 변할 수는 있다고 보지만 지금 현재 상태에서의 결정은 아래와 같다.

    AI 텍스트 생성기 (예: LaMDA, ChatGPT)

    • 트위터에서는 AI가 생성한 텍스트가 포함된 스토리를 게시하지 않습니다.
    • 짧은 소셜 미디어 게시물의 헤드라인이나 텍스트를 추천하기 위해 AI를 사용할 수 있습니다.
    • 우리는 연구 또는 분석 도구로 AI를 사용하는 실험을 할 수 있습니다.

    이미지 생성기(예: Dall-E, 미드저니, 스테이블 디퓨전)

    • 트위터에서는 AI가 생성한 이미지나 동영상을 게시하지 않습니다.
    • 특히 스톡 사진 대신 AI가 생성한 이미지는 사용하지 않습니다.
    • 당사 또는 당사가 의뢰한 아티스트는 AI 도구를 사용하여 아이디어를 촉발할 수 있습니다.

  • 페이스북 “많이 본 콘텐츠” 보고서

    Widely Viewed Content Report: What People See on Facebook

    페이스북이 투명성을 위한 노력의 하나로 널리 본 콘텐츠에 대한 보고서를 공개했다. 사람들이 뉴스피드에서 많이 본 콘텐츠 출처에 대한 내용이다. 유튜브나 아마존이 사람들이 가장 많이 방문하는 도메인이라고 밝혔으나 허위정보에 대한 우려와 달리 대부분 콘텐츠는 링크가 포함되어 있지 않다. 하지만 이러한 보고서의 내용이 실제 허위정보를 예방하고 실제로 제기되고 있는 위험에 대처하기 위한 정보 제공과는 거리가 멀다는 비판이 있다. 콘텐츠가 어떤 과정을 통해 사람들에게 도달하는지에 대한 자세한 내용은 빠져있다는 것이다.

    보고서를 보면 확인할 수 있는 것처럼 가볍게 시간 때울 수 있는 콘텐츠가 가장 높은 조회수를 기록하고 있다. 흥미로운 점은 NYT에서 동일한 형식의 1분기 보고서도 발견했는데, 거기에서 가장 많이 노출된 콘텐츠는 코로나 백신의 부작용 우려에 대한 기사라는 점이다. 부정적인 인식 때문에 페이스북이 이를 공개하지 않았다는 비판을 했다. 하지만 문제는 이러한 내용은 NYT에서도 동일하게 보도한 내용이라는 점이다. 플랫폼의 문제에 대해 이야기하지만 언론이 스스로 작성했던 기사라는 점에 대해서는 말하지 않는다는 사실이다.

    실질적으로 도움이 되는 내용은 빠져 있어서 아쉬움이 있지만 국내 사업자에게서도 이러한 형태의 보고서가 나올 수 있을까?

  • 5개 테크기업, 글로벌 광고시장 절반이상 점유

    5 giants own half the global ad market
    by Sara Fischer, Axios

    구글, 메타, 알리바바, 바이트댄스, 아마존

    Axios의 Sara Fischer에 따르면 세계 최대 기술 회사 중 5곳이 작년 전 세계 광고 수익의 절반 이상(53%)을 차지했으며 이는 작년의 46%에서 증가한 수치입니다. … 세계 상위 25개 광고 제공업체가 현재 전 세계 광고 지출의 74%를 차지합니다. 이는 작년 68%에서 2016년 43%로 증가한 수치입니다. [expand title=eng]

    Five of the world’s largest tech companies owned more than half (53%) of all global ad revenues last year, up from 46% last year, Axios’ Sara Fischer reports. … The world’s top 25 ad providers now account for 74% of global advertising spend, up from 68% last year and just 43% in 2016. [/expand]

  • 트위터의 포르노 문제

    How Twitter’s child porn problem ruined its plans for an OnlyFans competitor
    By Zoe Schiffer and Casey Newton, The Verge

    트위터가 성인용 서비스를 기획하다가 내부적인 문제로 철회한 것과 관련된 기사이다. 트위터는 지속적인 경영상 어려움을 겪어왔고, 이러한 문제의 해결방안으로 생각했던 것이 성인 콘텐츠 수익화이다. 트위터는 ACM(Adult Content Monetization)이라는 프로젝트를 운영하며 내부 레드팀에서 다양한 검토를 거쳤으나, 콘텐츠 조정과 관련된 문제로 프로젝트를 무기한 연기했다.

    트위터는 아동 성 착취(Child Sexual Exploit, CSE) 콘텐츠를 탐지할 자원이 부족하고, 직원들은 이를 위한 충분한 리소스가 투입되어야 한다고 이야기했으나 받아들여지지 않았다는 내용이다.

    오랜 기간 부실경영의 역사를 가지고 있기에 트위터는 구글과 페이스북 같은 테크 기업 대비 상대적으로 콘텐츠 조정 및 사용자 안전에 훨씬 적은 금액을 투자했다. PhotoDNA 방식의 필터링에서 적발되지 않는 콘텐츠 탐지를 위해 인공지능을 사용하는 추세이지만 여전히 많은 부분 수작업으로 이루어지고 있다는 이야기이다.

    2021년 보고서에 따르면 Twitter에서 CSE를 식별하고 제거하는 데 사용하는 프로세스는 매우 부적절합니다. 대규모 회사가 PhotoDNA에 의해 표시되지 않은 자료를 잡을 수 있는 자동화 시스템으로 점점 더 많이 전환하는 시기에 대부분 수동입니다. 보고서에 따르면 Twitter의 주요 시행 소프트웨어는 RedPanda라는 “지원되지 않는 레거시 도구”입니다. 보고서에서 인용한 한 엔지니어는 “RedPanda는 지금까지 우리가 제공하는 도구 중 가장 취약하고 비효율적이며 지원이 부족한 도구 중 하나입니다.[expand title=eng]
    The 2021 report found that the processes Twitter uses to identify and remove CSE are woefully inadequate — largely manual at a time when larger companies have increasingly turned to automated systems that can catch material that isn’t flagged by PhotoDNA. Twitter’s primary enforcement software is “a legacy, unsupported tool” called RedPanda, according to the report. “RedPanda is by far one of the most fragile, inefficient, and under-supported tools we have on offer,” one engineer quoted in the report said.[/expand]

    인공지능 기술을 가진 회사와 그렇지 않은 회사 간 격차가 점차 심해질 것이라는 이야기를 확인할 수 있는 사례가 아닌가 싶다.

  • 유튜브, 쇼츠 크리에이터와 수익 공유

    YouTube will share ad revenue with Shorts creators
    K. Bell, Engadget

    유튜브 쇼츠는 조회수에 비해 수익모델이 적절하지 않아 문제가 되었으나 변경되는 새로운 수익 공유 프로그램에서 쇼츠를 통한 수익도 지원할 예정. 추가로 Super Thanks라고 부르는 팁 기능도 시험중이라고 한다.

    새로운 수익 공유 프로그램을 통해 구독자가 1,000명 이상이고 90일 동안 Shorts의 조회수가 1,000만 회인 크리에이터는 파트너 프로그램 가입을 신청할 수 있습니다. TikTok과 마찬가지로 Shorts의 광고는 피드의 동영상 사이에 표시됩니다. (회사는 5월에 Shorts에 대한 광고를 실험하기 시작했습니다 .) 광고 수익은 합산되어 제작자에게 분배될 것이라고 말했습니다. 제작자는 음악 사용 여부에 관계없이 광고의 45%를 받습니다. [expand title = eng]

    With the new revenue sharing program, creators with at least 1,000 subscribers who get 10 million views on Shorts in a 90-day period can apply to join the Partner Program. Like TikTok, ads on Shorts appear between videos in the feed. (The company began experimenting with ads on Shorts in May.) Revenue from the ads will be pooled and split among creators, Mohan said. Creators will get a 45 percent cut of the ads, regardless of whether they use music. [/expand]

  • 구글 프로젝트 스타라인

    구글I/O에서 안드로이드12, 웨어러블 지원, 구글포토나 닥스의 새로운 기능들이 소개되었는데 가장 인상적이었던 것은 프로젝트 스타라인. 하이엔드 카메라, 심도 센서, 새로운 종류의 디스플레이를 사용하여 마치 사람이 바로 앞에 앉아있는 것처럼 보여주는 기술이다. 교도소 면회온 것처럼 보이기도 하고 인터넷 대역폭을 비롯해 다른 부가적인 것들이 얼마나 필요할지 모르겠지만 재미있어 보인다.

  • 뉴스과잉과 뉴스다이어트

    What’s the healthiest news diet? Probably traditional media, but don’t gorge yourself: Too much can leave you less informed

    By JOSHUA BENTON, Nieman Lab

    International Journal of Press / Politics가 유럽 17개 국가의 뉴스 이용을 조사하여 기존 미디어 이용이 정치적 IQ에 적합하다는 결과를 제시했다. 뉴스 이용자를 뉴스 미니멀리스트 , 소셜 미디어 뉴스 사용자 , 전통 주의자 , 온라인 뉴스 탐색자 및 하이퍼 뉴스 소비자로 구분하고 정치적 지식과 관계를 살펴보았다.

    … 주요 발견은 두 개의 이용자 프로필 (전통 주의자 및 온라인 뉴스 탐색자)만이 나머지 이용자 프로필과 비교하여 정치적 지식과 긍정적이고 일관되게 상호 연관되어 있다는 것입니다.

    구체적으로, 결과는 더 선택적이고 풍부한 온라인 뉴스 다이어트를 한 사람(온라인 뉴스 탐색자)이 전통 및 공적 미디어를 사용하는 사람들을 제외하고 모든 뉴스 사용자 그룹에 비해 더 높은 수준의 감시 지식을 보유 할 가능성이 더 높다는 것을 보여줍니다. 나머지 모든 사람들보다 상대적으로 더 잘 알고 있습니다.

    놀랍게도 뉴스 프로필의 하이퍼 소비자는 정치적 지식과의 중요하지 않은 연관성을 보여 주거나 (전통적이고 온라인 뉴스를 찾는 사람들과 비교할 때) 심지어 음의 상관 관계를 보입니다. 우리는 논문의 마지막 섹션에서 더 광범위하게 논의 하듯이 가장 그럴듯한 설명은 정보 과부하에서 비롯 될 것으로 예상합니다.[expand title=eng]

    …a key finding is that only two user profiles (traditionalists and online news seekers) are positively and consistently correlated with political knowledge compared to the rest of the user profiles…

    More specifically, the results show that those having a more selective and richer online news diet (online news seekers) are more likely to hold higher levels of surveillance knowledge compared to all groups of news users with the exception of those using traditional and public media, who are comparatively better informed than all the rest.

    Strikingly enough, the hyper consumer of news profile shows either nonsignificant associations with political knowledge or (when compared with traditional and online news seekers) even negative correlations. We anticipate the most plausible explanation thereof stems from information overloads, as we more extensively discuss in the final section of the paper.[/expand]

    연구 결과는 하이퍼 뉴스 소비자와 정치적 지식의 상관관계가 부정적 결과로 나온 것을 정보과잉으로 설명하고 전통 미디어가 가장 좋은 방법이라고 이야기하는데 국내에서 같은 방식의 조사를 해도 비슷한 결과를 보일지 궁금하다. 극단적인 이용자를 제외하면 역시나 같은 결과가 나올까.