[카테고리:] IT

  • 구글 독점과 선택화면

    ‘Choice Screen’ Fever Dream: Enforcers’ New Favorite Remedy Won’t Blunt Google’s Search Monopoly
    techpolicy.press

    규제 기관은 선택화면을 선호하지만 현실적으로 작동하는 방식이라고 보기 어렵다. 인간이 그런 방식으로 행동하지 않기 때문이다.

    Google은 3월에 디지털 시장법 준수를 위해 EU에서 검색 엔진 선택 화면을 출시할 예정입니다. 구글은 선택 화면을 아예 표시하지 않기를 원하지만, 선택 화면이 많으면 그 영향력이 무력화될 수 있다는 사실을 현명하게 깨달았습니다. …… 시행자들은 오늘날에도 다른 상황에서 볼 수 있는 소비자 보호 원칙에 따라 선택 화면을 채택했을 것입니다. 그러나 이러한 원칙은 이제 실패한 모델로 널리 알려져 있습니다. 예를 들어, 유럽의 쿠키 팝업 상자는 이론적인 선택 화면(쿠키를 원하십니까, 원하지 않으십니까?)라는 이론적인 선택 화면으로, 소비자는 원하는 결과를 얻지 못한 채 금방 사라집니다. 마찬가지로 미국의 수많은 법적 고지 사항과 게시된 개인정보 보호정책은 ‘고지 및 동의’ 프레임워크로서 소비자에게 권한을 부여하기보다는 좌절감을 안겨줍니다.

    선택 화면이 실질적인 경쟁 증진 수단이 아니라, 단순히 소비자의 선택을 억제하는 기본 설정과 현 상황을 바탕으로 한 착각에 불과할 수 있다.

  • 생성형 인공지능으로 가치를 창출하고 파괴하는 방법

    How People Can Create—and Destroy—Value with Generative AI
    BCG

    보스턴 컨설팅 그룹에서 나온 생성형 인공지능에 관한 실험 연구. 추가 설명이 조금 필요하기는 하지만 간단한 요약은 아래와 같다.

    최초의 과학적 실험에 따르면 사람들은 제너레이티브 AI가 엄청난 가치를 창출할 수 있는 분야에서는 이를 불신하고, 그렇지 않은 분야에서는 지나치게 신뢰하는 것으로 나타났습니다.

    • 실험 참가자의 약 90%가 창의적인 아이디어 발상을 위해 GenAI를 사용했을 때 업무 성과가 향상되었습니다. 사람들은 GPT-4의 결과물을 편집하려고 시도하지 않았을 때 가장 좋은 성과를 냈습니다.
    • 도구의 현재 역량을 벗어난 비즈니스 문제 해결 작업을 할 때, 많은 참가자가 GPT-4의 잘못된 결과를 액면 그대로 받아들였습니다. 이들의 성과는 이 도구를 전혀 사용하지 않은 사람들에 비해 23% 더 나빴습니다.
    • 제너레이티브 AI를 도입하는 것은 엄청난 변화 관리 노력입니다. 리더의 역할은 사람들이 새로운 기술을 올바른 방식으로 올바른 업무에 사용하도록 돕고, 끊임없이 확장되는 GenAI의 영역에 맞서 지속적으로 조정하고 적응하도록 돕는 것입니다.

    SSRN에 올라온 페이퍼가 자세한 내용을 담고 있다. LLM 관련 연구로 여러 생각할만한 내용을 보여주지 않나 싶다. 조금 더 자세한 설명.

    1. 창의적 과제와 문제해결 과제를 해결하는 실험에서 생성형 인공지능은 창의적 과제에 활용했을 때 작업 효율을 높이는 것으로 나타남(기준 대비 40% 향상)
      설계: 3집단 실험설계 방식. 사전-사후 평가. 과제에 관해 창의성, 설득력, 분석적사고, 전반적 글쓰기 측면에서 10점 척도로 평가하여 평균 활용. 채점은 블라인드 방식으로 BCG컨설턴트와 학업 과제 채점 경험 있는 경영대학생으로 구성
    2. 생성형 인공지능은 성과를 높이기도 하지만 다수 참가자에게서 잘못된 결과를 그대로 받아들이는 경향도 나타남. 그리고 이러한 양날의 검 효과는 모든 수준의 숙련도를 가진 대상에게서 확인됨. 다만 기본 숙력도가 낮을 수록 영향력이 큼
    3. 기술적 한계에 대해 설명했으나 부정적 영향력은 사라지지 않았음. 오히려 교육을 받은 사람은 평균적으로 더 나쁜 성적을 보임
      설계: 30분간 교육. 효과적으로 사용하는 법을 말하고, 보여주고, 실행하는 코스로 설계. 모범 사례와 문제해결 상황에서 활용시 어려움과 함정에 대한 정보, 추론 실패하는 사례를 보여주며 지나치게 의존하지 않도록 주의를 줌
    4. 개인의 성과 분포에 영향을 줌. 즉 전체 분포가 높은 수준의 성과를 향해 이동. GPT-4는 창의적 제품 혁신 과제에서 매우 높은 수준의 성과를 달성하기에 일반인이 이 결과물을 개선하려고 노력하면 오히려 품질이 하락하는 결과가 나타남 (초안과 10%차이가 증가할때마다 품질 순위는 17%p 하락)
    5. 창의성의 함정. 모두가 비슷한 응답을 제공하기에 개인적 결과물은 향상되지만 집단적으로는 창의성이 사라질 수 있음. 생성형 인공지능의 활용은 아이디어의 다양성을 낮추는 결과를 가져올 수 있음. 인터뷰에서도 비슷한 응답을 확인. 기술에 의존하면 창의성을 억제할 수 있을 것이라고 응답. “다른 기술과 마찬가지로 사람들은 기술에 지나치게 의존할 수 있습니다. GPS는 처음 출시되었을 때 내비게이션에 큰 도움을 주었지만, 오늘날 사람들은 GPS 없이는 운전조차 할 수 없습니다. 사람들이 기술에 지나치게 의존하게 되면 예전에 가졌던 능력을 잃게 됩니다.”
  • 스레드 출시에 관한 엔지니어링 블로그

    Threads: The inside story of Meta’s newest social app

    최근 소셜 미디어에 관해 생각해보며 둘러보다보니 페이스북은 촌스러운 느낌이 나는 반면에 스레드는 그래도 좀 깔끔하다는 느낌이 들었다. 찾다가 읽게 된 스레드 출시 관련 내부 이야기.

    페디버스(연합된 우주)라는 개념에 익숙하지 않은 분들도 계시겠지만, 저에게 가장 쉬운 비유는 이메일에 비유하는 것입니다. 누군가는 Gmail을 사용하고 다른 누군가는 야후 메일을 사용한다고 가정해 봅시다. 한 사람은 Google 플랫폼을 사용하고 다른 한 사람은 Yahoo를 사용하더라도 서로 이메일을 주고받을 수 있다는 것은 두 번 생각하지 않습니다. 이메일은 상호 운용이 가능하고 두 회사 모두 이메일 전송을 위한 SMTP 프로토콜을 준수하기 때문입니다. 하지만 오늘날 소셜 미디어에서는 그렇게 할 수 없습니다. 예를 들어 Instagram 사용자는 Tumblr의 다른 크리에이터를 팔로우할 수 없습니다. …(중략)… 스레드에 대한 저의 궁극적인 바람은 스레드가 인터넷의 시대정신이 되는 것입니다. 최신 문화 이벤트에 대해 긍정적인 대화를 나누고 싶을 때 가장 먼저 찾는 곳이 될 것입니다. 크리에이터들 간의 최신 대화나 관심 있는 다른 사람들 간의 대화를 보고 싶을 때 가고 싶은 곳이 될 것입니다. 앞으로 몇 달 동안 여러분 모두를 위해 지속적으로 제품을 개선해 나가면서 이러한 모습을 볼 수 있기를 바랍니다.

    요즘 메타는 언어 모델 개발까지 개방형을 강조하는 방향으로 전환한 느낌이다. 트위터는 인터넷의 시대정신이었다. 스레드가 시대정신이 되고 싶다는 것은 희망이겠지만 그렇게 쉬운 일은 아닐 것 같다.

  • 메타의 독립연구 지원 도구

    New Tools to Support Independent Research

    Meta는 사람들이 플랫폼을 어떻게 사용하는지에 대한 데이터에 외부 연구자들이 접근할 수 있는 새로운 도구와 플랫폼을 제공한다.

    • 연구자들이 Facebook과 Instagram에서 더 많은 공개 콘텐츠에 액세스할 수 있는 새로운 도구를 출시합니다.
    • 저희는 정치 및 사회 연구를 위한 대학 간 컨소시엄(ICPSR)과 최초의 파트너십을 체결하여 연구자들이 ICPSR의 안전한 가상 데이터 영역에서 데이터를 분석할 수 있도록 했습니다.
    • 전 세계 경제 이동성의 동인을 더 잘 이해하기 위해 사회적 자본 연구를 확대하고 있습니다.

    이와 관련된 MIT Technology Review의 기사

    연구자들은 특히 플랫폼이 공개를 원치 않을 수 있는 데이터에 접근하는 것과 관련하여 과거에 소셜 미디어 회사와 불편한 관계를 맺어 왔습니다. (예를 들어, 2021년에 페이스북은 웹 스크래핑을 통한 플랫폼의 정치 광고 타겟팅을 조사하던 뉴욕대학교의 투명성 프로젝트 연구진에게 사용자 개인정보를 침해한다는 이유로 연구 중단 서한을 보낸 바 있습니다.)

    클레그는 이 제품이 무엇보다도 “의미 있는” 연구를 가능하게 하기를 원한다고 말하며, 현재 소셜 미디어의 정확한 영향에 대한 연구자들 간의 합의가 부족하며, 이는 소셜 미디어 기업의 공개 데이터 부족으로 인해 더욱 어려워졌다고 강조했습니다.

    새로운 라이브러리는 주로 검색 엔진과 유사한 웹 인터페이스 또는 연구자가 직접 쿼리를 코딩하여 대량의 데이터를 반환할 수 있는 API를 통해 액세스할 수 있는 데이터베이스입니다. 예를 들어, 연구자들은 2023년 2월 14일에 생성형 AI에 관한 모든 공개 게시물을 가장 많이 본 순서부터 가장 적게 본 순서로 정렬하여 보여 달라고 요청할 수 있습니다.

  • GAIA, 언어모델 벤치마크

    FACEBOOK RESEARCHERS TEST AI’S INTELLIGENCE AND FIND IT IS UNFORTUNATELY QUITE STUPID
    The Byte

    새로운 대규모 언어 모델 벤치마크에서 기존 모델의 점수가 형편없다는 기사.

    AI 대부’이자 메타의 수석 과학자인 얀 르쿤이 포함된 연구팀은 아직 동료 심사를 거치지 않은 논문에 따르면 “인간에게는 개념적으로 간단하지만 대부분의 고급 AI에게는 어려운” 466개의 문항으로 구성된 GAIA라는 시험을 고안해냈습니다.

    인간 응답자는 92%의 질문에 정답을 맞힌 반면, 수동으로 선택한 일부 플러그인을 장착한 GPT4는 15%에 불과했습니다. 이 팀이 발표한 GAIA 순위표에 따르면 OpenAI가 최근 출시한 GPT4 Turbo의 점수는 10% 미만이었습니다.

    GAIA 목표가 무엇인지 해당 아카이브 논문의 일부 내용.

    인간에게는 어려운 작업 대신, 개념적으로는 간단하지만 조합 공간이 큰 복잡한 작업 시퀀스를 정확하게 실행해야 하는 작업을 AI 시스템에 요청할 수 있습니다. 컴퓨터에게 해결책을 쉽게 검증할 수 있는 복잡한 문제를 풀도록 요청하는 작업 증명 알고리즘(Jakobsson and Juels, 1999; Dwork and Naor, 1993)과 유사하게, 작업을 성공적으로 완료해야만 결과를 얻을 수 있고 검증이 용이해야 합니다. 다양하고 불확실한 세계에 접근해야 하는 인공지능 비서를 위한 작업은 본질적으로 실제 사용 사례에 뿌리를 두면서 이 기준을 충족해야 합니다.

    우리는 이러한 방향으로 나아가기 위해 466개의 세심하게 만들어진 질문과 그에 대한 답변, 그리고 관련 설계 방법론으로 구성된 일반 AI 어시스턴트의 벤치마크인 GAIA를 제안합니다. 우리의 질문은 만들기도 쉽고, AI 시스템(LLM의 경우 대부분 복잡한 생성이 필요함)에 도전적이지만, 독특하고 사실적인 답변을 인정하여 간단하고 강력한 자동 평가가 가능합니다.

    GAIA는 다음과 같은 목표를 통해 현재 LLM 평가의 함정을 피하고자 합니다:

    • 실제적이고 도전적인 질문. 예를 들어, LLM은 일반적으로 개방적이고 변화하는 웹을 탐색하거나, 다중 모달리티를 처리하거나, 질문에 답하기 위해 여러 단계를 거쳐 추론해야 합니다. 반대로, 많은 LLM 벤치마크는 매우 구체적이거나 폐쇄적이고 합성된 환경으로 제한되어 있습니다.
    • 개념적으로 간단한 작업을 통한 쉬운 해석 가능성(비전문가인 주석가도 만점에 가까운 점수를 나타냄), 관련 추론 추적, 몇 개 되지 않지만 고도로 선별된 질문. 이는 효율성과 신뢰성이 부족한 집계된 벤치마크와는 대조적입니다(Perlitz 외, 2023).
    • 비게임성. 질문에 답하려면 몇 가지 단계를 성공적으로 완료해야 하는데, 이러한 단계는 다양하기 때문에 쉽게 강제할 수 없습니다. 추론의 흔적을 확인할 수 있고, 정답에 요구되는 정확성, 인터넷에서 일반 텍스트로 제공되지 않기 때문에 데이터 오염 가능성을 방지할 수 있습니다. 반면, 객관식 답안(예: MMLU)은 잘못된 추론 추적이 정답에 더 쉽게 도달할 수 있기 때문에 오염 평가를 더 어렵게 만듭니다.
    • 사용의 단순성. 결정적으로, 질문에 대한 답변은 사실적이고 간결하며 모호하지 않습니다. 이 두 가지 속성은 간단하고 빠르며 사실에 입각한 평가를 가능하게 합니다. 우리의 질문은 제로 샷으로 답을 구하도록 설계되어 평가 설정의 영향을 제한합니다. 반대로 많은 LLM 벤치마크는 프롬프트의 수와 성격(Liang 외, 2022b)(섹션 8.2) 또는 벤치마크 구현과 같은 실험 설정에 민감한 평가를 요구합니다.

  • 생성 인공지능의 2막

    Generative AI’s Act Two
    SEQUOIA

    여러 불확실성에도 불구하고 생성 인공지능은 이미 스타트업에서만 10억 달러 이상의 매출을 올리며 SaaS보다 성공적인 출발을 보였다고 평가한다. 1) 생성 인공지능이 대세이며, 2) 킬러 앱(ChatGPT)이 등장해 가장 빠르게 1억 MAU에 도달했으며, 3) 개발자 엑세스가 이루어지고, 4) 폼 팩터가 진화하고 있다. 하지만 문제는 실질적인 문제는 가치를 입증해야 한다는 점이라고 말한다. 1달 리텐션에서 기존 앱이 평균 63%라면, 인공지능 기업의 평균은 42%에 지나지 않는다.

    그래서 다양한 개발 스택이 등장하고 새로운 제품의 청사진이 등장하고 있다고 말한다.

    • 생각의 사슬, 생각의 나무, 반사와 같은 새로운 추론 기법은 더 풍부하고 복잡한 추론 작업을 수행할 수 있는 모델의 능력을 향상시켜 고객의 기대와 모델 기능 사이의 격차를 좁히고 있습니다. 개발자들은 Langchain과 같은 프레임워크를 사용하여 더 복잡한 멀티체인 시퀀스를 호출하고 디버깅하고 있습니다.
    • 특히 최근 GPT-3.5 및 Llama-2에 대한 미세 조정이 가능해짐에 따라 RLHF 및 미세 조정과 같은 전이 학습 기법에 대한 접근성이 높아지고 있으며, 이는 기업이 특정 도메인에 맞게 기초 모델을 조정하고 사용자 피드백을 통해 개선할 수 있다는 것을 의미합니다. 개발자들은 허깅 페이스에서 오픈 소스 모델을 다운로드하고 이를 미세 조정하여 우수한 성능을 달성하고 있습니다.
    • 검색 증강 세대는 비즈니스 또는 사용자에 대한 컨텍스트를 가져와 환각을 줄이고 진실성과 유용성을 높이고 있습니다. Pinecone과 같은 회사의 벡터 데이터베이스는 RAG의 인프라 중추가 되었습니다.
    • 새로운 개발자 도구와 애플리케이션 프레임워크는 기업이 재사용 가능한 빌딩 블록을 통해 고급 AI 애플리케이션을 만들고, 개발자가 운영 중인 AI 모델의 성능을 평가, 개선 및 모니터링할 수 있도록 지원하며, 여기에는 랭스미스웨이트 앤 바이어스 같은 LLMOps 도구도 포함됩니다.
    • CoreweaveLambda LabsFoundryReplicateModal과 같은 AI 우선 인프라 기업은 퍼블릭 클라우드의 번들링을 해제하고 AI 기업이 가장 필요로 하는 것, 즉 합리적인 비용으로 온디맨드 방식으로 사용할 수 있고 확장성이 뛰어난 풍부한 GPU와 우수한 PaaS 개발자 환경을 제공하고 있습니다.

    관련 서비스가 다양하게 등장하며 자체적으로 비즈니스모델을 만들고 이용하기 쉬운 환경을 만들고 있지만, 아직까지는 여전히 돈이 꽤 드는 작업이라 서비스 개발이 아닌 연구쪽에서는 어떻게 활용할 수 있을지 감이 잘 오지 않는다.

  • 죽은 NFT 시장

    Dead NFTs: The Evolving Landscape of the NFT Market
    dappGambl

    기사를 보고 정리를 안 하고 있었더니 이미 다른 곳에서도 많이 언급된 이야기

    NFT는 상승세를 보이다 폭락했다. 23년 7월 주간 거래액은 약 8천만 달러로, 2021년 8월 최고치의 3%에 불과했다. 과연 미래는 있을 것인가? NFT 스캔에서 제공한 데이터를 사용해 73,257개 이상의 NFT 컬렉션 (정확히 73,257개)에 대한 종합적인 분석을 작성했다. 결과에 따르면 73,257개의 NFT 컬렉션 중 69,795개의 시가총액이 0 이더(ETH)인 것으로 나타났다. 즉, NFT를 보유한 사람의 95%가 현재 가치가 없는 투자자산을 보유하고 있다고 할 수 있다. 또한 전체 NFT 컬렉션의 79%, 즉 5개 중 4개가 미판매 상태로 남아있다. 그러면서 실제 사용사례에 대해 언급한다.

    시장 침체를 극복하고 지속적인 가치를 가지려면 대체 불가능한 토큰은 역사적으로 관련성이 있거나(초판 포켓몬 카드처럼), 진정한 예술품이거나, 진정한 유용성을 제공해야 합니다.

    • 문화유산 보존: 대체 불가능한 토큰은 문화 유물을 디지털화하고 보호하는 데 사용되어 블록체인에서 고유하고 불변하는 지위를 부여할 수 있습니다.
    • 게임: NFT로 표시되는 고유한 게임 내 자산은 다양한 게임 환경에서 구매, 판매 및 사용할 수 있습니다.
    • 토큰 게이트 액세스: NFT는 보유자에게 이벤트, 콘텐츠 또는 서비스에 대한 특별 액세스 권한을 부여할 수 있습니다.
    • 부분 소유권: 기본적으로 단일 자산을 나타내는 대체 불가능한 토큰은 여러 부분으로 분할할 수 있으며, 주식처럼 생각하면 주식과 같습니다. 이를 통해 여러 소유자가 NFT에 지분을 보유할 수 있으므로, 일반인이 자산/예술에 훨씬 더 쉽게 접근할 수 있습니다.
    • 부동산: 소유한 자산을 대체 불가능한 토큰으로 토큰화하여 블록체인 플랫폼에서 자산을 판매할 수 있으며, 이를 통해 훨씬 쉽게 판매할 수 있는 경로를 제공할 수 있습니다.
    • 디지털 신원: 온라인 익명성에는 위험이 따를 수 있으며, NFT는 온라인 페르소나, 자격 증명 또는 자격이 검증 가능하고 고유한지 확인하는 데 사용될 수 있습니다.
  • ChatGPT 설명

    보고서를 쓰면서 읽었던 몇 가지 글. ChatGPT와 같은 언어모델이 어떻게 작동하는지를 설명하는 내용이다. 조금 더 평이한 글로 쓰여진 것도 있고, 약간 수학적인 부분이 포함된 내용도 있다.

    Generative AI exists because of the transformer (FT.com)
    What Is ChatGPT Doing … and Why Does It Work? (Stephen Wolfram)

  • 주커버그 인터뷰

    퀘스트3를 가지고 메타버스에서 인터뷰를 했다.

  • EU, 디지털시장법과 플랫폼규제

    EU Challenges Apple, Microsoft in New Push to Rein in Big Tech Dominance
    Bloomberg

    유럽의 디지털 반독점 규제에 해당하는 22개 서비스 목록이 6일 공개되었고, 포함된 사업자는 6개월 내 규칙을 준수하거나 이의를 제기해야한다.

    지난 7월, 집행위는 몇몇 플랫폼이 소위 게이트키퍼로 지정되기 위한 기준을 충족했다고 발표했는데, 여기에는 블록 전체에서 최소 75억 유로(82억 달러)의 매출 또는 시가총액 750억 유로 이상이 포함된다.

    또한 플랫폼 서비스는 EU에서 월간 활성 최종 사용자 수가 4,500만 명 이상이고 연간 활성 비즈니스 사용자 수가 1만 명 이상이어야 규정을 적용받을 수 있습니다.

    해당 서비스 목록

    기업 이름서비스 목록
    AlphabetGoogle Maps, Google Play, Google Shopping, YouTube, Google Search, Chrome, Android, Google Ads
    AmazonMarketplace, Amazon Ads
    AppleApp Store, Safari, iOS
    BytedanceTikTok
    MetaFacebook, Instagram, WhatsApp, Messenger, Marketplace, Meta Ads
    MicrosoftLinkedIn, Windows