[작성자:] haeyeop

  • GenAI의 인터페이스 문제

    Unpredictable Black Boxes are Terrible Interfaces

    프롬프트에 텍스트를 입력하여 결과물을 출력하는 생성인공지능이 왜 끔찍한 인터페이스를 가지고 있는지에 관한 글. 실제로 결과물을 얻기위해서는 수십차례의 시행착오를 겪어야하며, 이로 인해 프롬프트를 거래하는 프롬프트베이스와 같은 서비스도 생긴 상황. 해당 글에서는 몇 가지 논문을 바탕으로 다른 방식에 대한 이야기를 하기도 함.

    제너레이티브 AI 모델은 놀랍지만 끔찍한 인터페이스입니다. 사용자가 입력 제어가 출력에 미치는 영향을 예측할 수 없으면 시행 착오에 의존해야 하는데 이는 실망스러운 일입니다. 이것은 새로운 콘텐츠를 생성하기 위해 생성 AI를 사용할 때 중요한 문제이며 입력 컨트롤과 출력 간의 매핑이 명확하지 않은 한 문제로 남을 것입니다. 그러나 우리는 사용자가 AI와 공통 기반/공유 의미론을 설정할 수 있고 그러한 공유 의미론이 누락되었을 때 복구 메커니즘을 제공할 수 있는 대화형 상호 작용을 활성화하여 AI 인터페이스를 개선할 수 있습니다.

    결론 부분만 짧게 옮겨놓았지만 읽어볼만한 글이다.

  • 구글 광고투명성센터

    메타(메타 광고 라이브러리)에 이어 구글도 자사 플랫폼에 게재된 모든 광고를 볼 수 있는 도구를 공개했다.

    광고 투명성 센터는 인증된 광고주가 제공하는 모든 광고의 검색 가능한 허브입니다.

    이 원스톱 상점은 Google에서 표시되는 광고에 대한 정보에 쉽게 액세스할 수 있도록 사용자를 염두에 두고 설계되었습니다. 광고 투명성 센터를 통해 다음을 이해할 수 있습니다.

    • 광고주가 실행한 광고
    • 특정 지역에 게재된 광고
    • 광고가 실행된 마지막 날짜 및 광고 형식.
    https://blog.google/technology/ads/announcing-the-launch-of-the-new-ads-transparency-center/

  • 금융을 위한 BloombergGPT

    Introducing BloombergGPT, Bloomberg’s 50-billion parameter large language model, purpose-built from scratch for finance

    Bloomberg의 ML 제품 및 연구 그룹은 회사의 AI 엔지니어링 팀과 협력하여 회사의 기존 데이터 생성, 수집 및 큐레이션 리소스를 활용하여 지금까지 가장 큰 도메인별 데이터 세트 중 하나를 구성했습니다. 금융 데이터 회사로서 Bloomberg의 데이터 분석가들은 40년 동안 금융 언어 문서를 수집하고 유지해 왔습니다. 팀은 이 광범위한 재무 데이터 아카이브에서 영어 재무 문서로 구성된 포괄적인 3,630억 개의 토큰 데이터 세트를 생성했습니다. 이 데이터는 3,450억 개의 토큰 공개 데이터 세트로 보강되어 7,000억 개가 넘는 토큰이 있는 대규모 교육 코퍼스를 생성했습니다. 이 훈련 코퍼스의 일부를 사용하여 팀은 500억 개의 매개변수 디코더 전용 인과 언어 모델을 훈련했습니다. 결과 모델은 기존 금융 관련 NLP 벤치마크, Bloomberg 내부 벤치마크 모음 및 널리 사용되는 벤치마크(예: BIG-bench Hard, Knowledge Assessments, Reading Comprehension 및 Linguistic Tasks)의 광범위한 범용 NLP 작업 범주에서 검증되었습니다. . 특히, BloombergGPT 모델은 일반 NLP 벤치마크에서 동등 이상의 성능을 유지하면서 재무 작업에 대해 비슷한 크기의 기존 개방형 모델보다 큰 차이로 성능이 뛰어납니다.

    LLM 배포로 인해 여러 분야에서 발생하고 있는 일. 얼마전에는 LLaMA를 가지고 자기가 가진 데이터를 활용해 세무상담 챗봇을 만들었다는 세무사도 보았다. 뉴스를 가지고 비슷한 작업을 했을때도 가치있는 무언가를 만들어낼 수 있을까 하는 생각을 해봤다.

  • 대규모 언어모델의 2차 효과

    미래의 기업을 두 가지, compute rich vs. compute poor 형태로 구분한다. 대규모 언어 모델을 가지지 못한 compute poor 기업은 향후 대규모 언어모델을 보유한 OpenAI/Google에 세금을 부과하게 될 것이며, compute rich 기업의 ML 모델에 점점 더 많이 의존하게 될 것이라고 본다.

    이러한 역량이 미래의 게이트키퍼가 될 수 있는 조건이 될 것이다. 마치 플랫폼을 소유하고 있는 애플이나 페이스북이 생태계에 의존하는 에픽게임즈나 젠가를 쫓아낼 수 있는 것처럼 말이다. 정부는 언어모델을 학습시키기위한 인프라를 보유하는 것이 국가 안보에 중요하다는 점을 인식하게 될 것이고, 검색 알고리즘 최적화(SEO)에 집중하던 마케터도 ML에 최적화하기 위해 노력하게 될 것이라고 말한다. 어쨌든 모든 것이 이상해질 것이라고 말하는 글. 짧지만 흥미로운 스레드이다.

  • 5개 테크기업, 글로벌 광고시장 절반이상 점유

    5 giants own half the global ad market
    by Sara Fischer, Axios

    구글, 메타, 알리바바, 바이트댄스, 아마존

    Axios의 Sara Fischer에 따르면 세계 최대 기술 회사 중 5곳이 작년 전 세계 광고 수익의 절반 이상(53%)을 차지했으며 이는 작년의 46%에서 증가한 수치입니다. … 세계 상위 25개 광고 제공업체가 현재 전 세계 광고 지출의 74%를 차지합니다. 이는 작년 68%에서 2016년 43%로 증가한 수치입니다. [expand title=eng]

    Five of the world’s largest tech companies owned more than half (53%) of all global ad revenues last year, up from 46% last year, Axios’ Sara Fischer reports. … The world’s top 25 ad providers now account for 74% of global advertising spend, up from 68% last year and just 43% in 2016. [/expand]

  • 스마트폰의 위성 연결

    T-Mobile and SpaceX want to connect regular phones to satellites
    Mike Dano, Light Reading

    새로운 아이폰 발표 때 위성통신을 통한 긴급전화 사용에 관한 내용이 있었다. 아무래도 속도면에서 제한이 있기에 크게 관심을 가지지 않았는데 위성 관련 주식이 오르는 걸 보고 반성하며 찾아본 몇 가지 현황.

    지난달 미디어 행사에서 T-Mobile은 판매하는 휴대폰을 Starlink 위성에 연결하는 파트너십을 발표했다. 위성 연결에 관해서는 크게 규제와 기술에 대한 두 가지 이슈가 있는 것 같다. 첫째, 연결을 위해서는 2세대 더 큰 위성을 발사해야 하는데 이를 위한 규제 승인이 필요하다는 점. 또한 FCC는 전화와 위성 연결에 대해 아직 승인하지 않았다는 것. 둘째, 주어진 커버리지 내에서 2~4Mbit/s 서비스를 제공하기 때문에 제한적 용도로만 가능하다는 점.

    일론 머스크의 스타링크만 주목을 받고 있지만 이러한 시도를 하는 회사가 하나가 아니라는 사실이다.

    T-Mobile과 SpaceX는 기존 휴대전화를 위성에 연결하는 가능성을 논의한 최초의 회사가 아닙니다. Startup Lynk는 이미 자체 위성으로 유사한 서비스를 테스트했으며 올해 말까지 상용 서비스를 제공하기 시작할 것으로 예상합니다. 이 회사는 이미 바하마의 Aliv 및 중앙아프리카공화국의 Telecel Centrafrique를 비롯한 글로벌 통신사와 계약을 체결했습니다.
    최근 공기업이 된 AST SpaceMobile도 전화-위성 서비스를 위한 자체 위성 발사를 위해 노력하고 있습니다. 이 회사는 Rakuten, AT&T, Vodafone과 같은 거래를 하고 있습니다.
    2GHz 스펙트럼 라이선스를 소유한 위성 스타트업 옴니스페이스(Omnispace)는 최근 필리핀 모바일 네트워크 사업자인 스마트 커뮤니케이션즈(Smart Communications)와 협력하여 위성 전화 서비스를 제공할 것이라고 밝혔습니다.[expand title=eng]

    T-Mobile and SpaceX are by no means the first companies to discuss the possibility of connecting existing mobile phones to satellites. Startup Lynk has already tested a similar service with its own satellites, and expects to begin offering commercial services by the end of this year. The company has already inked deals with global operators including Aliv in the Bahamas and Telecel Centrafrique in the Central African Republic.

    AST SpaceMobile, which recently became a public company, is also working to launch its own satellites for a phone-to-satellite service. The company has deals with the likes of Rakuten, AT&T and Vodafone.

    And satellite startup Omnispace, which owns 2GHz spectrum licenses, recently said it would work with Philippine mobile network operator Smart Communications for satellite-to-phone services.[/expand]

  • 인공지능 생성 메타이미지 판매시장

    https://promptbase.com/

    얼마 전 콜로라도주에서 개최한 미술경연대회 디지털아트 부문에서 인공지능 생성 이미지가 1등을 수상하고 논란이 있었다. 지난 몇 년 사이 Midjourney, DALL-E와 같은 프로그램이 보여주는 결과물은 놀라울 정도로 발전했다. 이 프로그램들은 텍스트 프롬프트를 이미지로 전환하는데, 올해 초 만들어진 PromptBase는 사용자가 특정 시스템에서 예측 가능한 결과를 얻을 수 있는 프롬프트를 판매하는 마켓플레이스이다.

    프롬프트는 $1.99~$5 사이 가격으로 구성되어 있으며 플랫폼은 각 프롬프트에 대한 20%의 수수료를 받는 형식이다. 미디어 영역에서 인공지능이 유통과 소비단계에 적용되어 왔다면 이제는 생산영역에서 새로운 변화를 가져오고 있다.

  • 트위터의 포르노 문제

    How Twitter’s child porn problem ruined its plans for an OnlyFans competitor
    By Zoe Schiffer and Casey Newton, The Verge

    트위터가 성인용 서비스를 기획하다가 내부적인 문제로 철회한 것과 관련된 기사이다. 트위터는 지속적인 경영상 어려움을 겪어왔고, 이러한 문제의 해결방안으로 생각했던 것이 성인 콘텐츠 수익화이다. 트위터는 ACM(Adult Content Monetization)이라는 프로젝트를 운영하며 내부 레드팀에서 다양한 검토를 거쳤으나, 콘텐츠 조정과 관련된 문제로 프로젝트를 무기한 연기했다.

    트위터는 아동 성 착취(Child Sexual Exploit, CSE) 콘텐츠를 탐지할 자원이 부족하고, 직원들은 이를 위한 충분한 리소스가 투입되어야 한다고 이야기했으나 받아들여지지 않았다는 내용이다.

    오랜 기간 부실경영의 역사를 가지고 있기에 트위터는 구글과 페이스북 같은 테크 기업 대비 상대적으로 콘텐츠 조정 및 사용자 안전에 훨씬 적은 금액을 투자했다. PhotoDNA 방식의 필터링에서 적발되지 않는 콘텐츠 탐지를 위해 인공지능을 사용하는 추세이지만 여전히 많은 부분 수작업으로 이루어지고 있다는 이야기이다.

    2021년 보고서에 따르면 Twitter에서 CSE를 식별하고 제거하는 데 사용하는 프로세스는 매우 부적절합니다. 대규모 회사가 PhotoDNA에 의해 표시되지 않은 자료를 잡을 수 있는 자동화 시스템으로 점점 더 많이 전환하는 시기에 대부분 수동입니다. 보고서에 따르면 Twitter의 주요 시행 소프트웨어는 RedPanda라는 “지원되지 않는 레거시 도구”입니다. 보고서에서 인용한 한 엔지니어는 “RedPanda는 지금까지 우리가 제공하는 도구 중 가장 취약하고 비효율적이며 지원이 부족한 도구 중 하나입니다.[expand title=eng]
    The 2021 report found that the processes Twitter uses to identify and remove CSE are woefully inadequate — largely manual at a time when larger companies have increasingly turned to automated systems that can catch material that isn’t flagged by PhotoDNA. Twitter’s primary enforcement software is “a legacy, unsupported tool” called RedPanda, according to the report. “RedPanda is by far one of the most fragile, inefficient, and under-supported tools we have on offer,” one engineer quoted in the report said.[/expand]

    인공지능 기술을 가진 회사와 그렇지 않은 회사 간 격차가 점차 심해질 것이라는 이야기를 확인할 수 있는 사례가 아닌가 싶다.

  • 노인과 스마트폰

    Smartphones and older users remain an uneasy match
    Peter Allen Clark, AXIOS

    (엄청나게 비싸진 프리미엄 스마트폰 가격을 보면 과연 필수품인지 의구심은 들지만…) 스마트폰은 사치품을 넘어서 삶의 필수품이 되어가고 있음. 하지만 고연령대에서 접근성은 여전히 제한적이라는 기사 내용.

    기사에서 소개한 몇 가지 관련된 통계들.

    AARP가 2021년 12월 에 실시한 설문 조사에 따르면 50세 이상의 4명 중 3명은 연결 상태를 유지하기 위해 기술에 의존한다고 말하지만 그 중 42%는 기술이 모든 연령대를 위해 설계되지 않았다고 말합니다.

    그러나 고령 사용자들은 여전히 ​​스마트폰의 대세에 뛰어드는 것을 주저하고 있습니다. 올해 초 Pew Research Center의 연구에 따르면 18-29세의 미국 성인 중 96%가 스마트폰을 소유하고 있는 반면 65세 이상에서는 61%가 스마트폰을 소유하고 있습니다.

    2월 미시간 대학의 조사에 따르면 50~80세 성인의 28%가 모바일 건강 앱을 한 개 이상 사용한다고 답한 반면 56%는 한 번도 사용해 본 적이 없다고 말했습니다. [expand title = eng]

    A December 2021 survey conducted by AARP found that three in four people over the age of 50 say they rely on technology to stay connected, but 42% of them say that technology is not designed for all ages.

    But older users still show hesitancy to jump on the smartphone bandwagon. A Pew Research Center study earlier this year found that 96% of U.S. adults aged 18-29 own a smartphone, compared with 61% of those 65 and older.

    A University of Michigan survey from February found that 28% of adults aged 50 to 80 said they use at least one mobile health app, while 56% said they’ve never used one.[/expand]

    기사에서도 이야기하고 있지만 새롭게 추가되는 기능은 이용자가 사용하기에 쉽지 않다. 예를 들면, 접근하기 위한 메뉴의 깊이가 너무 깊거나 이해하기 어려운 이름으로 되어 있어 이용자 경험이 그다지 좋지 못하다. 과연 고연령에 대한 문제인가 아니면 나도 고연령이 된 것일까?

  • 외로운 메타버스

    It’s Lonely in the Metaverse: DappRadar Data Suggests Decentraland Has 38 ‘Daily Active’ Users in $1.3B Ecosystem
    By Cameron Thompson, CoinDesk

    지난 달 나온 기사이지만 참고용으로 남긴다. 메타버스에 대한 책에서 밝은 미래까지는 아니지만… 긍정적인 측면을 위주로 이야기했다. 메타버스로 이야기할 때 언급되는 디센트럴랜드와 샌드박스에 대한 데이터에 따르면 각각 10억 달러의 가치를 지니지만 일일활성이용자(MAU)가 1,000명 미만인 것으로 나타났다.

    데이터 조사업체 DappRadar에 따르면 디센트럴랜드는 24시간동안 38명, 샌드박스는 같은 시간동안 522명의 활성ㅎ사용자를 기록했다. 가장 많은 일일 활성 이용자는 각각 675명, 4,503명이었다.

    측정 방식에 대한 논쟁이 있지만 확실한 사실은 이용자가 굉장히 적다는 것이다.

    디지털 자산 투자 회사인 Arca의 포트폴리오 매니저인 Sasha Fleyshman은 메타버스 플랫폼이 실제로 의도한 대로 작동할 때 사용자에게 훨씬 더 가치가 있을 것이라고 CoinDesk에 말했습니다. Fleyshman은 “오늘날 성공한 메타버스가 있다고 말하는 사람은 거짓말을 하는 것입니다. [expand title=eng]
    Sasha Fleyshman, portfolio manager at digital asset investment firm Arca, told CoinDesk that metaverse platforms will be much more valuable to users when they actually operate as intended. “Anyone telling you that there’s a metaverse today that has worked is lying through their teeth,” said Fleyshman. [/expand]