Blog

  • 구글 광고투명성센터

    메타(메타 광고 라이브러리)에 이어 구글도 자사 플랫폼에 게재된 모든 광고를 볼 수 있는 도구를 공개했다.

    광고 투명성 센터는 인증된 광고주가 제공하는 모든 광고의 검색 가능한 허브입니다.

    이 원스톱 상점은 Google에서 표시되는 광고에 대한 정보에 쉽게 액세스할 수 있도록 사용자를 염두에 두고 설계되었습니다. 광고 투명성 센터를 통해 다음을 이해할 수 있습니다.

    • 광고주가 실행한 광고
    • 특정 지역에 게재된 광고
    • 광고가 실행된 마지막 날짜 및 광고 형식.
    https://blog.google/technology/ads/announcing-the-launch-of-the-new-ads-transparency-center/

  • 금융을 위한 BloombergGPT

    Introducing BloombergGPT, Bloomberg’s 50-billion parameter large language model, purpose-built from scratch for finance

    Bloomberg의 ML 제품 및 연구 그룹은 회사의 AI 엔지니어링 팀과 협력하여 회사의 기존 데이터 생성, 수집 및 큐레이션 리소스를 활용하여 지금까지 가장 큰 도메인별 데이터 세트 중 하나를 구성했습니다. 금융 데이터 회사로서 Bloomberg의 데이터 분석가들은 40년 동안 금융 언어 문서를 수집하고 유지해 왔습니다. 팀은 이 광범위한 재무 데이터 아카이브에서 영어 재무 문서로 구성된 포괄적인 3,630억 개의 토큰 데이터 세트를 생성했습니다. 이 데이터는 3,450억 개의 토큰 공개 데이터 세트로 보강되어 7,000억 개가 넘는 토큰이 있는 대규모 교육 코퍼스를 생성했습니다. 이 훈련 코퍼스의 일부를 사용하여 팀은 500억 개의 매개변수 디코더 전용 인과 언어 모델을 훈련했습니다. 결과 모델은 기존 금융 관련 NLP 벤치마크, Bloomberg 내부 벤치마크 모음 및 널리 사용되는 벤치마크(예: BIG-bench Hard, Knowledge Assessments, Reading Comprehension 및 Linguistic Tasks)의 광범위한 범용 NLP 작업 범주에서 검증되었습니다. . 특히, BloombergGPT 모델은 일반 NLP 벤치마크에서 동등 이상의 성능을 유지하면서 재무 작업에 대해 비슷한 크기의 기존 개방형 모델보다 큰 차이로 성능이 뛰어납니다.

    LLM 배포로 인해 여러 분야에서 발생하고 있는 일. 얼마전에는 LLaMA를 가지고 자기가 가진 데이터를 활용해 세무상담 챗봇을 만들었다는 세무사도 보았다. 뉴스를 가지고 비슷한 작업을 했을때도 가치있는 무언가를 만들어낼 수 있을까 하는 생각을 해봤다.

  • 발렌시아가 입은 교황

    AI Images Like the “Balenciaga Pope” Are Getting Harder to Spot
    By Billy Perrigo

    교황이 발렌시아가 패딩을 입은 사진이 온라인에서 바이럴 된 바 있다. 딥페이크에 관한 논의에서 이미지가 어색한 부분을 확인하는 방법 또는 이미지를 직접 검색해보는 방법을 활용해 진위여부를 판별할 수 있다는 이야기들을 했다. 이 사진도 진짜같지만 십자가 목걸이, 손모양 등을 참고하면 아직까지 조금 어색한 부분들을 발견할 수 있다. 그럼에도 불구하고 얼핏 보면 이 사진이 어색하다는 걸 발견할 수 있을까?

    출처 이미지 제공: Instagram을 통한 @art_is_2_inspire

    딥페이크 비디오를 감지하는 데 96% 정확하다고 말하는 Intel의 제품을 포함하여 딥페이크를 감지할 수 있다고 주장하는 판매용 소프트웨어가 많이 있습니다. 그러나 이미지가 AI로 생성되었는지 여부를 안정적으로 알려줄 수 있는 무료 온라인 도구는 거의 없습니다. AI 플랫폼 Hugging Face에서 호스팅되는 무료 AI 이미지 감지기 1개 는 Balenciaga Pope의 이미지가 AI로 생성되었음을 69%의 확실성으로 정확하게 감지할 수 있었습니다. 그러나 최신 버전의 Midjourney에서 제작한 Elon Musk의 AI 생성 이미지를 제시 한 이 도구는 이미지가 진짜라고 54% 확신한다고 말하면서 잘못된 대답을 했습니다.

  • 리바이스의 AI 모델

    Levi’s will test AI-generated clothing models to ‘increase diversity’ / The denim brand claims the tech will be used to ‘supplement human models’ rather than completely replace them.
    By Jess Weatherbed

    A realistic-looking young female model wears Levi's overalls and looks into the camera.

    생성AI로 인해 사라지게 될 직업이 무엇이 있는지에 대해 많은 이야기가 있는데 모델은 그래도 다른 창작 작업을 하는 사람들에 비해 영향을 덜 받지 않을까 하는 의견도 있었다. 아무래도 옷의 핏이나 질감 같은걸 정확하게 표현하는게 어렵지 않을까 하는 의견을 이야기한 사람들도 있었는데 리바이스가 AI 모델을 사용한다고 발표했고 꽤 많은 논란이 있었다. 논란의 이유는 인간 모델을 (비용상 이유로) 완전 대체하는 것 아닌지에 관한 우려이다.

    현재 Levi’s 앱이나 웹사이트에서 광고하는 대부분의 제품은 단일 의류 모델에서만 볼 수 있습니다. 이 파트너십으로 생성된 AI 의류 모델은 보다 신체를 포괄적으로 포함할 수 있으므로 고객은 다양한 신체 유형, 연령, 크기 및 피부 색조에 걸친 다양한 모델에서 의류가 어떻게 보이는지 볼 수 있습니다. 이론상으로는 의류 품목이 자신의 신체와 닮은 모델이 아닐 때 좌절하는 소비자에게 도움이 될 것입니다.[expand title=eng]
    Currently, most products advertised on the Levi’s app or website can only be viewed on a single clothing model. The AI clothing models created by this partnership could be more body-inclusive, allowing customers to view what an article of clothing would look like on a multitude of models spanning a wide range of body types, ages, sizes, and skin tones. In theory, that should help consumers who are frustrated when clothing items aren’t modeled on a body that resembles their own.[/expand]

    기사제목에서 이야기한 것처럼 인간 모델을 완전히 대체하는 것은 아니라고 했으나 미래에 어떻게 변화할지는 고민해 볼 일이다. 퀄리티가 몇 년 전과 비교하기에는 급격하게 향상되었다.

  • 트위터 추천알고리즘 일부 공개

    Twitter reveals some of its source code, including its recommendation algorithm
    TechCrunch, by Kyle Wiggers

    트위터 추천 알고리즘 공개와 오픈소스에 대한 논쟁이 있었는데, 트위터가 소스코드 일부를 깃허브에 공개했다. 트위터는 “더 투명해지기 위한 첫 번째 단계”라고 밝혔다. 일부 공개된 내용으로 인해 언급되고 있는 것은 공개되지 않은 부분에 관한 내용이다. 주요 내용 중 하나는 소스에 따라 트윗을 다르게 취급하고 있다는 점이다. 파워유저인지 아닌지에 따라, 정치적 성향(공화당인지 민주당인지)에 따라 트윗을 다르게 취급할 수 있다는 가능성이 제기되었다.

    Gizmodo는 공개되지 않은 것으로 보이는 한 가지는 Twitter가 사용자에게 푸시하는 VIP 목록이라고 말합니다. 이번 주 Platformer는 트위터가 유튜버 미스터 비스트(Mr. Beast)와 데일리 와이어(Daily Wire) 설립자 벤 샤피로(Ben Shapiro)를 포함해 주목할 만한 사용자 목록을 돌아가며 쓰고 있다고 보도했습니다.
    알고리즘이 소스에 따라 트윗을 다르게 취급할 수 있다는 더 많은 증거가 있습니다. Jane Manchun Wong 연구원은 Twitter의 알고리즘이 트윗 작성자가 Elon Musk인지 여부를 구체적으로 표시하고 작성자가 “파워 유저”인지, 공화당원인지 민주당원인지를 나타내는 다른 레이블을 가지고 있다고 언급했습니다.
    오늘 오후 Spaces 세션에서 Twitter 엔지니어는 레이블이 메트릭에만 사용되었다고 말했습니다. 그러나 오늘 이전에는 라벨을 몰랐다고 말한 머스크는 라벨이 있으면 안 된다고 말했습니다.[expand title=eng]
    Gizmodo notes that one thing that doesn’t appear to have been made public is the list of VIPs that Twitter pushes to users. This week, Platformer reported that Twitter has a rotating list of noteworthy users, including YouTuber Mr. Beast and Daily Wire founder Ben Shapiro, that it uses to monitor changes to the recommendation algorithm by increasing the visibility of these “power users” seemingly at will.
    There’s more evidence that the algorithm may treat tweets differently depending on the source. Researcher Jane Manchun Wong noted that Twitter’s algorithm specifically labels whether the tweet author is Elon Musk and has others labels indicating whether the author is a “power user” as well as whether they’re a Republican or Democrat.
    During the Spaces session this afternoon, a Twitter engineer said that the labels were used only for metrics. But Musk — who said he wasn’t aware of the labels prior to today — said that they shouldn’t be there.[/expand]

  • 이탈리아 ChatGPT 금지

    Italian privacy regulator bans ChatGPT
    by Clothilde Goujard, POLITICO

    이탈리아 개인정보 보고 규제 기관이 개인정보 침해를 이유로 ChatGPT 새로운 버전 릴리즈를 일시 중단할 것을 요청했다고 한다. 이유는 “알고리즘을 훈련하기 위해 개인 데이터의 대량 수집 및 저장”을 정당화하는 법적 근거가 부족하다는 이유이다.

    ChatGPT도 지난 주 데이터 유출로 사용자 대화와 사용자의 지불 정보를 노출했다고 이탈리아 당국이 밝혔습니다. OpenAI는 사용자의 연령을 확인하지 않으며 “미성년자는 발달 및 자기 인식 정도에 비해 절대적으로 부적절한 답변”을 노출한다고 덧붙였습니다.[expand title=eng]
    ChatGPT also suffered a data breach and exposed users conversations and payment information of its users last week, the Italian authority said. It added OpenAI does not verify the age of users and exposes “minors to absolutely unsuitable answers compared to the their degree of development and self-awareness.”[/expand]

    해당 기사에서 언급하는 내용은 2023년 3월 22일 ChatGPT 다운 이후로 유료 버전 사용자의 결제 정보가 유출되었다는 것이다. (관련 기사). 아마 정상적인 상황에서는 이런 일들은 발생하지 않는 것으로 보이기는 하지만 GDPR을 준수한다는 내용을 20일 이내에 알리지 않으면 최대 4%에 달하는 벌금을 부과할 수 있다는 내용.

  • 엑티베이트 컨설팅 테크놀로지 미디어 아웃록 2023

    ACTIVATE TECHNOLOGY & MEDIA OUTLOOK 2023

    엑티베이트에서 매년 나오는 테크놀로지 미디어 아웃룩. 주요 키워드로 제시된 내용을 간략하게 요약했다. 스포츠 베팅, 디지털 피트니스, 수퍼 유저라는 키워드가 눈에 띈다.

    팬데믹으로 인해 소비자들이 기술과 미디어에 소비하는 시간이 늘어났으며, 이러한 추세는 계속될 것으로 예상됩니다. 성장과 기회를 위한 주요 영역은 다음과 같습니다:

    1. 이커머스 및 마켓플레이스: 2026년까지 미국 소매 판매의 20%가 이커머스를 통해 이루어질 것으로 예상되며, 이는 주요 업체, 카테고리 중심 비즈니스, 리커머스, 라이브 스트리밍 쇼핑, BNPL 및 쇼핑 멤버십과 같은 트렌드에 의해 주도될 것입니다.
    2. 비디오: TikTok은 비디오, 메시징, 검색, 이커머스 등 다양한 분야에 지각변동을 일으킬 것입니다. 스트리밍 및 소셜 비디오는 TV를 추월할 것이며, 스트리밍 전쟁은 번들 서비스, 오리지널 콘텐츠에 대한 투자 증가, 광고 지원 계층, 국제적인 성장으로 이어질 것입니다.
    3. 게임과 e스포츠: 비디오 게임은 주류 활동이 되었으며, 습관적인 게이머가 메타버스의 얼리 어답터가 될 것으로 예상됩니다.
    4. 대체 불가능한 토큰: 대체 불가능한 토큰에 대한 소비자 사용 사례는 투기에서 보다 실질적인 애플리케이션으로 전환될 것이며, 대체 불가능한 토큰의 수익은 계속 증가할 것으로 예상됩니다.
    5. 메타버스: 기본 요소는 이미 비디오 게임에 존재하며, 기업은 “상호운용성 계층”에서 기회를 포착하기 위해 지금 개발 및 실제 애플리케이션에 투자해야 합니다.
    6. 오디오: 디지털 오디오는 음악과 팟캐스트 광고에 대한 시간과 지출을 증가시킬 것입니다. 틱톡은 음악 검색을 재편할 것이며, 대면 및 가상 라이브 이벤트는 계속 성장할 것입니다.
    7. 스포츠 및 스포츠 베팅: 새로운 소비자 세대가 등장하고, 라이브 스포츠가 스트리밍으로 전환되며, 스포츠 베팅이 점점 더 보편화되는 등 스포츠 산업은 전환기에 있습니다.
    8. 디지털 피트니스: 디지털 피트니스 기술의 채택이 크게 증가하여 2026년까지 시장 규모가 300억 달러에 달할 것으로 예상됩니다. 가상 현실은 메타버스에서 디지털 피트니스 경험을 향상시킬 것입니다.
    9. 슈퍼 유저: 기업은 ‘메타버스 네이티브’로서 기술 및 미디어에 대한 시간과 비용 지출에 큰 영향을 미치는 슈퍼 유저를 파악하고 이들을 만족시켜야 합니다.
    10. 기술 및 미디어 수익: 경제 불확실성에도 불구하고 2026년까지 전 세계 지출은 4,000억 달러 이상에 달할 것으로 예상됩니다.
  • 틱톡 출판 관련 인력채용

    틱톡이 출판 관련된 인원을 채용한다는 공고를 냈다. 출판 관련 마케팅 직무로 보이지만 좀 더 폭넓은 업무를 하는 것 같다. 관련 내용을 보다가 틱톡에 #booktok 이라고 부르는 커뮤니티가 있다는 사실을 이제야 알게 되어 남기는 글

    팀 소개

    온라인 퍼블리싱 팀은 저자의 역량을 강화하고 전 세계 독자들에게 훌륭한 책을 제공하는 것을 목표로 합니다. 데이터의 강점뿐만 아니라 홍보의 이점을 활용하여 작가가 목표 독자를 찾고 온라인과 오프라인에서 책이 입소문을 타도록 돕습니다.

    편집팀은 잠재력이 있는 스토리를 파악하고 비주얼 팀, 디지털 전문가, 비즈니스 개발팀과 협력하여 작업합니다.

    주요 업무는 다음과 같으며 이에 국한되지 않습니다.

    다양한 채널을 통해 잠재력 있는 작가를 발굴하고 계약하여 작가와 좋은 관계를 유지합니다;
    작가에게 원고를 전달하고 소설의 완성도를 보장합니다;
    도서 데이터에 대한 후속 조치를 취하고 데이터 성과를 기반으로 작가에게 글쓰기 지침을 제공합니다;
    다른 팀과 협력하여 작가의 책을 포지셔닝하고 홍보합니다. [expand title = eng]
    About The Team

    The Online Publishing team aims to empower authors and bring great books to a worldwide audience. We use not only our data strength but also our promotional advantages to help writers find their target readers and make their books viral both online and offline.

    The editorial team identifies the stories with potential and works in partnership with our visual team, digital specialists, and Business Development team.

    Job Responsibilities Include, But Are Not Limited To

    Discover and sign authors with potential through multiple channels, maintaining a good relationship with writers;
    Ensure writer delivery and novel completion;
    Follow up on book data and provide writing guidance for writers based on data performance;
    Cooperate with other teams in positioning and promoting writers’ books.[/expand]

    위키피디아 설명에서 “BookTok은 책과 문학에 초점을 맞춘 TikTok 앱의 하위 커뮤니티입니다. 크리에이터는 자신이 읽은 책에 대해 리뷰하고 토론하며 농담을 하는 동영상을 만듭니다. 다양한 장르의 책을 다루지만, 많은 크리에이터가 청소년 소설, 청소년 판타지, 로맨스에 집중하는 경향이 있습니다. 이 커뮤니티는 출판 업계와 도서 판매에 영향을 미치는 것으로 알려져 있습니다. 이 커뮤니티의 크리에이터는 북토커라고도 불립니다.” 라고 적혀있다.

    도서 정가제에 대한 논의도 다시 이루어지고 있고 얼마전 국내 장르문학 갤러리에서도 국내 출판업계에 대한 비판이 이루어진적도 있었다. 여러가지로 변한 출판 시장에 대해서 생각해볼 수 있는 내용 아닌가 싶다.

  • 생성 인공지능 기업 투자급증

    최근 몇 주 사이에 생성 인공지능 관련 회사에 대한 투자가 이어졌다. Stable AI는 40억 달러의 투자 자금을 조달했고, Anthropic은 41억 달러, Character.ai는 10억 달러의 자금을 받았다. 기업이 투자 받았다는 건 크게 관심을 가지는 뉴스는 아나지만 최근 이루어지는 일련의 펀딩은 마치 ML이 처음 등장하던 시기 VC자금 투자되던걸 떠올리게 한다.

    생성 인공지능과 관련해서 이야기되는 몇 가지 주제들이 있다. 과연 이러한 생성 인공지능 모델이 범용 인공지능(Artificial General Intelligence)을 가능하게 할것인지, 할루시네이션(hallucination)이라고 말하는 현상을 제거할 수 있을지, 대규모 언어모델 기반의 생성 인공지능이 비즈니스 해자를 가질 수 있는지.

    마지막에 언급한 주제와 관련해서 실제 생성 인공지능 기술은 빠르게 소비자 제품으로 연결되고 있는 것 같다. 마이크로소프트는 CRM / ERP 부분에 Copilot을 제공하며 비즈니스 라인에 차세대 인공지능을 통합하려는 시도를 하고 있으며, 세일즈포스도 비슷하게 CRM용 생성 인공지능 아인슈타인 GPT를 발표했다.

    제품 전반에 생성 인공지능 기술을 통합해야 한다는 압박을 많이 느끼고 있는 것 같은 모습이다. 플랫폼러 보도에 관한 엑시오스 기사가 이러한 내용을 보도하고 있다.

    플랫폼러가 입수한 오디오에 따르면, 마이크로소프트 부사장 존 몽고메리는 조직 개편 당시 회의에서 팀원들에게 “[최고 기술 책임자] 케빈 [스콧]과 [CEO] 사티아 [나델라]는 최신 오픈AI 모델과 그 뒤를 잇는 모델을 매우 빠른 속도로 고객의 손에 넘겨야 한다는 압박이 매우 높습니다.”라고 말했다고 플랫폼러는 전했습니다. 2020년 구글은 회사의 알고리즘과 관행에 의문을 제기했다는 이유로 해고된 AI 윤리 연구원 팀닛 게브루를 강제 해고했습니다. 몇 달에 걸쳐 해당 팀의 다른 많은 직원이 그만두거나 해고되었습니다.
    Platformer reported Monday that Microsoft has disbanded an Ethics and Society team within its responsible AI team. An October reorganization had already moved most workers into product teams.
    “The pressure from [chief technology officer] Kevin [Scott] and [CEO] Satya [Nadella] is very very high to take these most recent OpenAI models and the ones that come after them and move them into customers’ hands at a very high speed,” Microsoft vice president John Montgomery told the team members at a meeting at the time of the reorganization, per audio obtained by Platformer. In 2020 Google forced out AI ethics researcher Timnit Gebru, who says she was fired for raising questions about the company’s algorithms and practices. Over several months a number of other workers on that team either quit or were fired.

    Microsoft, Google race to bring generative AI to the office

    생각하는 것보다 빠르게 열기가 식지 않을까. 제품에 빠른 속도로 통합되면서 자연스럽게 받아들이는 시기가 금방 오게 되지 않을까. 이러한 인공지능 사용으로 인한 위험을 관리할 기능이 없는 기업이 더 많기에 발생하는 문제들은 많을 수 있을 것 같다. 개인의 경우 이러한 위험은 낮을 수 있지만 윤리와 관련된 문제는 계속해서 이야기되지 않을까.

  • 생성 인공지능 제품화

    아직까지도 여러가지 용어가 혼란스럽게 사용되고 있지만 Generative ML을 활용한 기술이 빠르게 실제 제품으로 출시되고 있다. 온라인에서 발견한 몇 가지 사례들이다.

    인공지능 배우를 통해 비디오 영상 만들기 https://www.colossyan.com/
    원하는 스타일의 아트워크 만들기 jasper.ai/art
    업무용 개인화콘텐츠 만들기 https://www.typeface.ai/
    콘텐츠 제작과정 전반 간소화 https://simplified.com/

    빠르게 제품화가 이루어진다는 사실은 크게 놀라운 일은 아니다. 어떤 의미에서는 진입 장벽이 높지 않다는 뜻이고, 앞으로 더 많은 종류의 제품이 등장함에 따라 자연스럽게 사라지는 제품도 많아질 것이다. 특히, 플랫폼 사업자들이 자체 서비스에 이러한 기능을 통합시키게 된다면 특별한 차별성이 없는 제품은 살아남기 어렵게 될 것이다.

    제품을 살펴보면 알 수 있듯이 대부분 이러한 기술이 콘텐츠 창작을 위한 도구 또는 개인화 맞춤 도구로 사용될 것으로 보인다. 어려운 일이라기보다는 귀찮던 일들이 많은 부분 해결될 수 있을 것이다.