Blog

  • 추론엔진으로서 LLM

    GPT-4 Is a Reasoning Engine
    By Dan Shipper

    GPT 모델을 비판하는 사람들의 주요 이야기 중 하나는 확률적으로 다음 단어를 추정하는 앵무새일 뿐이라는 점이다. 하지만 사고(thinking)에는 추론(reasoning)과 지식(knowledge)이 있다는 점을 생각해본다면 GPT가 어떻게 사용될 수 있을것이라는 점을 다시 생각해볼 수 있다 말한다.

    예를 들면, ChatGPT에서 특정 인물에 대한 정보를 물으면 부정확한 정보를 제공해주지만, 인터넷에 접속할 수 있는 ChatGPT는 추론이 아닌 웹 조사를 통해 정확한 답변을 추출한다. 저자는 이를 통해 모델의 발전만큼 지식 데이터베이스의 발전이 중요하다 말한다. 따라서 자신의 생각을 정리하고 저장하고 분류하는 사람들은 이러한 모델을 통해 더 높은 효용을 가질 수 있을 것이라는 것이 저자의 주요 생각이다.

    우리는 입력의 중요성을 과소평가하는 경향이 있습니다. 이러한 결과를 얻기 위해 입력한 정보가 무엇인지 말입니다. 그 답은 우리가 분석을 위해 제공하는 정보에 크게 좌우됩니다. 시작점만큼 강력합니다.
    우리는 지식의 한계, 즉 얼마나 많은 정보가 잠겨 있고 이러한 시스템에 액세스할 수 없는지에 대해 충분히 주의를 기울이지 않습니다. 또한 정보 소스를 탐색하고 관련 사실을 찾는 데 시간과 컴퓨팅 비용이 얼마나 드는지 잊고 있습니다. 마지막으로 적시에 모델에 대한 관련 정보를 표시하는 것이 어렵다는 점을 과소평가합니다.
    그러나 이러한 종류의 문제를 해결하는 것은 기본 모델의 추론 기능을 해결하는 것만큼이나 근본적입니다.

    벡터 데이터베이스에 대한 부분도 관심을 가져볼만한 내용이 아닌가 싶다.

  • 와이어드의 생성 인공지능 사용규칙

    How WIRED Will Use Generative AI Tools

    와이어드 가 생성인공지능 정책을 공개했다. 간단히 이야기하자면 대부분의 경우에 생성 인공지능을 사용하지 않는 것으로 결정한 것 같다. 인공지능이 발전할 것이라고 생각하고 이후 변할 수는 있다고 보지만 지금 현재 상태에서의 결정은 아래와 같다.

    AI 텍스트 생성기 (예: LaMDA, ChatGPT)

    • 트위터에서는 AI가 생성한 텍스트가 포함된 스토리를 게시하지 않습니다.
    • 짧은 소셜 미디어 게시물의 헤드라인이나 텍스트를 추천하기 위해 AI를 사용할 수 있습니다.
    • 우리는 연구 또는 분석 도구로 AI를 사용하는 실험을 할 수 있습니다.

    이미지 생성기(예: Dall-E, 미드저니, 스테이블 디퓨전)

    • 트위터에서는 AI가 생성한 이미지나 동영상을 게시하지 않습니다.
    • 특히 스톡 사진 대신 AI가 생성한 이미지는 사용하지 않습니다.
    • 당사 또는 당사가 의뢰한 아티스트는 AI 도구를 사용하여 아이디어를 촉발할 수 있습니다.

  • GenAI의 인터페이스 문제

    Unpredictable Black Boxes are Terrible Interfaces

    프롬프트에 텍스트를 입력하여 결과물을 출력하는 생성인공지능이 왜 끔찍한 인터페이스를 가지고 있는지에 관한 글. 실제로 결과물을 얻기위해서는 수십차례의 시행착오를 겪어야하며, 이로 인해 프롬프트를 거래하는 프롬프트베이스와 같은 서비스도 생긴 상황. 해당 글에서는 몇 가지 논문을 바탕으로 다른 방식에 대한 이야기를 하기도 함.

    제너레이티브 AI 모델은 놀랍지만 끔찍한 인터페이스입니다. 사용자가 입력 제어가 출력에 미치는 영향을 예측할 수 없으면 시행 착오에 의존해야 하는데 이는 실망스러운 일입니다. 이것은 새로운 콘텐츠를 생성하기 위해 생성 AI를 사용할 때 중요한 문제이며 입력 컨트롤과 출력 간의 매핑이 명확하지 않은 한 문제로 남을 것입니다. 그러나 우리는 사용자가 AI와 공통 기반/공유 의미론을 설정할 수 있고 그러한 공유 의미론이 누락되었을 때 복구 메커니즘을 제공할 수 있는 대화형 상호 작용을 활성화하여 AI 인터페이스를 개선할 수 있습니다.

    결론 부분만 짧게 옮겨놓았지만 읽어볼만한 글이다.

  • 구글 광고투명성센터

    메타(메타 광고 라이브러리)에 이어 구글도 자사 플랫폼에 게재된 모든 광고를 볼 수 있는 도구를 공개했다.

    광고 투명성 센터는 인증된 광고주가 제공하는 모든 광고의 검색 가능한 허브입니다.

    이 원스톱 상점은 Google에서 표시되는 광고에 대한 정보에 쉽게 액세스할 수 있도록 사용자를 염두에 두고 설계되었습니다. 광고 투명성 센터를 통해 다음을 이해할 수 있습니다.

    • 광고주가 실행한 광고
    • 특정 지역에 게재된 광고
    • 광고가 실행된 마지막 날짜 및 광고 형식.
    https://blog.google/technology/ads/announcing-the-launch-of-the-new-ads-transparency-center/

  • 금융을 위한 BloombergGPT

    Introducing BloombergGPT, Bloomberg’s 50-billion parameter large language model, purpose-built from scratch for finance

    Bloomberg의 ML 제품 및 연구 그룹은 회사의 AI 엔지니어링 팀과 협력하여 회사의 기존 데이터 생성, 수집 및 큐레이션 리소스를 활용하여 지금까지 가장 큰 도메인별 데이터 세트 중 하나를 구성했습니다. 금융 데이터 회사로서 Bloomberg의 데이터 분석가들은 40년 동안 금융 언어 문서를 수집하고 유지해 왔습니다. 팀은 이 광범위한 재무 데이터 아카이브에서 영어 재무 문서로 구성된 포괄적인 3,630억 개의 토큰 데이터 세트를 생성했습니다. 이 데이터는 3,450억 개의 토큰 공개 데이터 세트로 보강되어 7,000억 개가 넘는 토큰이 있는 대규모 교육 코퍼스를 생성했습니다. 이 훈련 코퍼스의 일부를 사용하여 팀은 500억 개의 매개변수 디코더 전용 인과 언어 모델을 훈련했습니다. 결과 모델은 기존 금융 관련 NLP 벤치마크, Bloomberg 내부 벤치마크 모음 및 널리 사용되는 벤치마크(예: BIG-bench Hard, Knowledge Assessments, Reading Comprehension 및 Linguistic Tasks)의 광범위한 범용 NLP 작업 범주에서 검증되었습니다. . 특히, BloombergGPT 모델은 일반 NLP 벤치마크에서 동등 이상의 성능을 유지하면서 재무 작업에 대해 비슷한 크기의 기존 개방형 모델보다 큰 차이로 성능이 뛰어납니다.

    LLM 배포로 인해 여러 분야에서 발생하고 있는 일. 얼마전에는 LLaMA를 가지고 자기가 가진 데이터를 활용해 세무상담 챗봇을 만들었다는 세무사도 보았다. 뉴스를 가지고 비슷한 작업을 했을때도 가치있는 무언가를 만들어낼 수 있을까 하는 생각을 해봤다.

  • 발렌시아가 입은 교황

    AI Images Like the “Balenciaga Pope” Are Getting Harder to Spot
    By Billy Perrigo

    교황이 발렌시아가 패딩을 입은 사진이 온라인에서 바이럴 된 바 있다. 딥페이크에 관한 논의에서 이미지가 어색한 부분을 확인하는 방법 또는 이미지를 직접 검색해보는 방법을 활용해 진위여부를 판별할 수 있다는 이야기들을 했다. 이 사진도 진짜같지만 십자가 목걸이, 손모양 등을 참고하면 아직까지 조금 어색한 부분들을 발견할 수 있다. 그럼에도 불구하고 얼핏 보면 이 사진이 어색하다는 걸 발견할 수 있을까?

    출처 이미지 제공: Instagram을 통한 @art_is_2_inspire

    딥페이크 비디오를 감지하는 데 96% 정확하다고 말하는 Intel의 제품을 포함하여 딥페이크를 감지할 수 있다고 주장하는 판매용 소프트웨어가 많이 있습니다. 그러나 이미지가 AI로 생성되었는지 여부를 안정적으로 알려줄 수 있는 무료 온라인 도구는 거의 없습니다. AI 플랫폼 Hugging Face에서 호스팅되는 무료 AI 이미지 감지기 1개 는 Balenciaga Pope의 이미지가 AI로 생성되었음을 69%의 확실성으로 정확하게 감지할 수 있었습니다. 그러나 최신 버전의 Midjourney에서 제작한 Elon Musk의 AI 생성 이미지를 제시 한 이 도구는 이미지가 진짜라고 54% 확신한다고 말하면서 잘못된 대답을 했습니다.

  • 리바이스의 AI 모델

    Levi’s will test AI-generated clothing models to ‘increase diversity’ / The denim brand claims the tech will be used to ‘supplement human models’ rather than completely replace them.
    By Jess Weatherbed

    A realistic-looking young female model wears Levi's overalls and looks into the camera.

    생성AI로 인해 사라지게 될 직업이 무엇이 있는지에 대해 많은 이야기가 있는데 모델은 그래도 다른 창작 작업을 하는 사람들에 비해 영향을 덜 받지 않을까 하는 의견도 있었다. 아무래도 옷의 핏이나 질감 같은걸 정확하게 표현하는게 어렵지 않을까 하는 의견을 이야기한 사람들도 있었는데 리바이스가 AI 모델을 사용한다고 발표했고 꽤 많은 논란이 있었다. 논란의 이유는 인간 모델을 (비용상 이유로) 완전 대체하는 것 아닌지에 관한 우려이다.

    현재 Levi’s 앱이나 웹사이트에서 광고하는 대부분의 제품은 단일 의류 모델에서만 볼 수 있습니다. 이 파트너십으로 생성된 AI 의류 모델은 보다 신체를 포괄적으로 포함할 수 있으므로 고객은 다양한 신체 유형, 연령, 크기 및 피부 색조에 걸친 다양한 모델에서 의류가 어떻게 보이는지 볼 수 있습니다. 이론상으로는 의류 품목이 자신의 신체와 닮은 모델이 아닐 때 좌절하는 소비자에게 도움이 될 것입니다.[expand title=eng]
    Currently, most products advertised on the Levi’s app or website can only be viewed on a single clothing model. The AI clothing models created by this partnership could be more body-inclusive, allowing customers to view what an article of clothing would look like on a multitude of models spanning a wide range of body types, ages, sizes, and skin tones. In theory, that should help consumers who are frustrated when clothing items aren’t modeled on a body that resembles their own.[/expand]

    기사제목에서 이야기한 것처럼 인간 모델을 완전히 대체하는 것은 아니라고 했으나 미래에 어떻게 변화할지는 고민해 볼 일이다. 퀄리티가 몇 년 전과 비교하기에는 급격하게 향상되었다.

  • 트위터 추천알고리즘 일부 공개

    Twitter reveals some of its source code, including its recommendation algorithm
    TechCrunch, by Kyle Wiggers

    트위터 추천 알고리즘 공개와 오픈소스에 대한 논쟁이 있었는데, 트위터가 소스코드 일부를 깃허브에 공개했다. 트위터는 “더 투명해지기 위한 첫 번째 단계”라고 밝혔다. 일부 공개된 내용으로 인해 언급되고 있는 것은 공개되지 않은 부분에 관한 내용이다. 주요 내용 중 하나는 소스에 따라 트윗을 다르게 취급하고 있다는 점이다. 파워유저인지 아닌지에 따라, 정치적 성향(공화당인지 민주당인지)에 따라 트윗을 다르게 취급할 수 있다는 가능성이 제기되었다.

    Gizmodo는 공개되지 않은 것으로 보이는 한 가지는 Twitter가 사용자에게 푸시하는 VIP 목록이라고 말합니다. 이번 주 Platformer는 트위터가 유튜버 미스터 비스트(Mr. Beast)와 데일리 와이어(Daily Wire) 설립자 벤 샤피로(Ben Shapiro)를 포함해 주목할 만한 사용자 목록을 돌아가며 쓰고 있다고 보도했습니다.
    알고리즘이 소스에 따라 트윗을 다르게 취급할 수 있다는 더 많은 증거가 있습니다. Jane Manchun Wong 연구원은 Twitter의 알고리즘이 트윗 작성자가 Elon Musk인지 여부를 구체적으로 표시하고 작성자가 “파워 유저”인지, 공화당원인지 민주당원인지를 나타내는 다른 레이블을 가지고 있다고 언급했습니다.
    오늘 오후 Spaces 세션에서 Twitter 엔지니어는 레이블이 메트릭에만 사용되었다고 말했습니다. 그러나 오늘 이전에는 라벨을 몰랐다고 말한 머스크는 라벨이 있으면 안 된다고 말했습니다.[expand title=eng]
    Gizmodo notes that one thing that doesn’t appear to have been made public is the list of VIPs that Twitter pushes to users. This week, Platformer reported that Twitter has a rotating list of noteworthy users, including YouTuber Mr. Beast and Daily Wire founder Ben Shapiro, that it uses to monitor changes to the recommendation algorithm by increasing the visibility of these “power users” seemingly at will.
    There’s more evidence that the algorithm may treat tweets differently depending on the source. Researcher Jane Manchun Wong noted that Twitter’s algorithm specifically labels whether the tweet author is Elon Musk and has others labels indicating whether the author is a “power user” as well as whether they’re a Republican or Democrat.
    During the Spaces session this afternoon, a Twitter engineer said that the labels were used only for metrics. But Musk — who said he wasn’t aware of the labels prior to today — said that they shouldn’t be there.[/expand]

  • 이탈리아 ChatGPT 금지

    Italian privacy regulator bans ChatGPT
    by Clothilde Goujard, POLITICO

    이탈리아 개인정보 보고 규제 기관이 개인정보 침해를 이유로 ChatGPT 새로운 버전 릴리즈를 일시 중단할 것을 요청했다고 한다. 이유는 “알고리즘을 훈련하기 위해 개인 데이터의 대량 수집 및 저장”을 정당화하는 법적 근거가 부족하다는 이유이다.

    ChatGPT도 지난 주 데이터 유출로 사용자 대화와 사용자의 지불 정보를 노출했다고 이탈리아 당국이 밝혔습니다. OpenAI는 사용자의 연령을 확인하지 않으며 “미성년자는 발달 및 자기 인식 정도에 비해 절대적으로 부적절한 답변”을 노출한다고 덧붙였습니다.[expand title=eng]
    ChatGPT also suffered a data breach and exposed users conversations and payment information of its users last week, the Italian authority said. It added OpenAI does not verify the age of users and exposes “minors to absolutely unsuitable answers compared to the their degree of development and self-awareness.”[/expand]

    해당 기사에서 언급하는 내용은 2023년 3월 22일 ChatGPT 다운 이후로 유료 버전 사용자의 결제 정보가 유출되었다는 것이다. (관련 기사). 아마 정상적인 상황에서는 이런 일들은 발생하지 않는 것으로 보이기는 하지만 GDPR을 준수한다는 내용을 20일 이내에 알리지 않으면 최대 4%에 달하는 벌금을 부과할 수 있다는 내용.

  • 엑티베이트 컨설팅 테크놀로지 미디어 아웃록 2023

    ACTIVATE TECHNOLOGY & MEDIA OUTLOOK 2023

    엑티베이트에서 매년 나오는 테크놀로지 미디어 아웃룩. 주요 키워드로 제시된 내용을 간략하게 요약했다. 스포츠 베팅, 디지털 피트니스, 수퍼 유저라는 키워드가 눈에 띈다.

    팬데믹으로 인해 소비자들이 기술과 미디어에 소비하는 시간이 늘어났으며, 이러한 추세는 계속될 것으로 예상됩니다. 성장과 기회를 위한 주요 영역은 다음과 같습니다:

    1. 이커머스 및 마켓플레이스: 2026년까지 미국 소매 판매의 20%가 이커머스를 통해 이루어질 것으로 예상되며, 이는 주요 업체, 카테고리 중심 비즈니스, 리커머스, 라이브 스트리밍 쇼핑, BNPL 및 쇼핑 멤버십과 같은 트렌드에 의해 주도될 것입니다.
    2. 비디오: TikTok은 비디오, 메시징, 검색, 이커머스 등 다양한 분야에 지각변동을 일으킬 것입니다. 스트리밍 및 소셜 비디오는 TV를 추월할 것이며, 스트리밍 전쟁은 번들 서비스, 오리지널 콘텐츠에 대한 투자 증가, 광고 지원 계층, 국제적인 성장으로 이어질 것입니다.
    3. 게임과 e스포츠: 비디오 게임은 주류 활동이 되었으며, 습관적인 게이머가 메타버스의 얼리 어답터가 될 것으로 예상됩니다.
    4. 대체 불가능한 토큰: 대체 불가능한 토큰에 대한 소비자 사용 사례는 투기에서 보다 실질적인 애플리케이션으로 전환될 것이며, 대체 불가능한 토큰의 수익은 계속 증가할 것으로 예상됩니다.
    5. 메타버스: 기본 요소는 이미 비디오 게임에 존재하며, 기업은 “상호운용성 계층”에서 기회를 포착하기 위해 지금 개발 및 실제 애플리케이션에 투자해야 합니다.
    6. 오디오: 디지털 오디오는 음악과 팟캐스트 광고에 대한 시간과 지출을 증가시킬 것입니다. 틱톡은 음악 검색을 재편할 것이며, 대면 및 가상 라이브 이벤트는 계속 성장할 것입니다.
    7. 스포츠 및 스포츠 베팅: 새로운 소비자 세대가 등장하고, 라이브 스포츠가 스트리밍으로 전환되며, 스포츠 베팅이 점점 더 보편화되는 등 스포츠 산업은 전환기에 있습니다.
    8. 디지털 피트니스: 디지털 피트니스 기술의 채택이 크게 증가하여 2026년까지 시장 규모가 300억 달러에 달할 것으로 예상됩니다. 가상 현실은 메타버스에서 디지털 피트니스 경험을 향상시킬 것입니다.
    9. 슈퍼 유저: 기업은 ‘메타버스 네이티브’로서 기술 및 미디어에 대한 시간과 비용 지출에 큰 영향을 미치는 슈퍼 유저를 파악하고 이들을 만족시켜야 합니다.
    10. 기술 및 미디어 수익: 경제 불확실성에도 불구하고 2026년까지 전 세계 지출은 4,000억 달러 이상에 달할 것으로 예상됩니다.