[작성자:] haeyeop

  • 아티팩트의 뉴스요약

    News app Artifact can now summarize stories using AI, including in fun styles

    아티팩트(Artifact)는 인스타그램 만든 사람들이 개발한 뉴스 서비스라는 이야기만 듣고 그다지 주목하지 않았는데, 관련 기사를 읽다가 좀 신기하다 싶은 점이 있어서 남겨놓는다.

    인공지능을 서비스에 활용하는게 일반화되고 있는데, 특정한 톤으로 뉴스를 요약해주는 서비스를 도입했다고 말하고 있다.

    “이 기능을 사용하면 Z세대 말하기 스타일인 ‘5살처럼 설명하기’와 같이 특정 스타일로 뉴스를 요약하거나 이모티콘만 사용하는 등 재미를 더할 수도 있습니다.”

    내가 나이가 든 건지 서비스의 주요 포인트가 어디에 있는지 이해하기가 어렵다.

  • 유튜브의 수익 구성

    콘텐츠 수익모델과 관련하여 얼마 전 읽었던 벤 톰슨의 글에서 유튜브 프리미엄에 대한 공개를 언급하는 부분이 있었는데 닐 모한이 언급한 내용을 통해 연간 $ 10 billion 정도 된다고 예측할 수 있다.

  • 인공지능 학습과 데이터

    A Photographer Tried to Get His Photos Removed from an AI Dataset. He Got an Invoice Instead.
    Motherboard, by Chloe Xiang

    독일의 한 스톡 사진작가가 AI 학습용 LAION 데이터 세트에서 자신의 사진을 삭제하려고 시도했는데 오히려 변호사는 부당한 저작권 청구로 979달러를 지불해야 한다는 답변을 받았다는 기사.

    인공지능 학습과 저작권에 대한 논쟁이 점차 심해질 것이고, Zarya of the Dawn 같은 코믹스 저작권 관련 판결이 논쟁이 되기도 한 바 있다. 과연 어떤 방식의 접근이 좋은지 명확하게 판단하기는 어렵지만 Benedict Evans가 과거에 쓴 데이터에 관한 글 일부를 생각해볼만하다.

    기술은 내러티브로 가득 차 있지만 가장 시끄러운 것 중 하나는 ‘데이터’라는 것입니다. AI는 미래입니다. 데이터에 관한 모든 것입니다. 데이터는 미래입니다. 우리는 그것을 소유하고 아마도 지불해야 하며 국가는 데이터 전략과 데이터 주권이 필요합니다. 데이터는 새로운 석유입니다! 이것은 대부분 넌센스입니다. ‘데이터’와 같은 것은 존재하지 않으며, 가치가 없으며 어쨌든 실제로 귀하의 소유가 아닙니다.

    2017년 이코노미스트 컬럼은 데이터를 석유에 비유하며 자원으로 이야기했으나 데이터는 석유 같은 자원이 아니라는 이야기. 특정한 맥락에서 특정한 목적을 가지고 있을 때에만 가치를 가지기 때문에 석유와 같은 자원으로 비유하는 것은 적절하지 않다는 것이다(나도 과거에 데이터를 모을 때 같이 협업하던 분이 데이터가 아니라 거대한 쓰레기라는 말을 한 게 생각난다).

    물론 일부 유형의 데이터에서 문제가 될 수 있는 부분들도 있으나, 우리가 이런 논의를 위해서는 어떤 종류의 데이터에 어떤 크레딧을 줄 수 있는지 분리해서 생각하는 것이 필요하지 않을지.

  • 프롬프트 엔지니어링 테크닉

    Prompt engineering techniques

    언어모델에서 좋은 결과물을 얻기 위해 프롬프트를 잘 쓰는 방법에 대해서 이야기가 많은데, 보다보면 이게 새로운 개발언어지 자연어인가 싶은 느낌이 들 때가 있다.

    문단을 읽고 사실적 주장을 추출한 다음 검색 엔진 결과를 사용하여 사실을 확인합니다.

    문단
    John Smith는 Lucy Smith와 결혼했습니다. 그들은 다섯 자녀를 두고 있으며 그는 Microsoft에서 소프트웨어 엔지니어로 일하고 있습니다. 팩트체크를 하려면 어떤 검색어를 써야 할까요?

    사실적 주장
    – John Smith는 Lucy Smith와 결혼했습니다.
    – John과 Lucy에게는 다섯 자녀가 있습니다.
    – John은 Microsoft에서 소프트웨어 엔지니어로 일하고 있습니다.

    다음은 위의 주장을 조사하기 위해 발행된 다양한 검색 쿼리입니다.
    검색 쿼리
    – John Smith는 결혼했습니다. Lucy Smith에게
    – John Smith 자녀 수
    – John Smith 소프트웨어 엔지니어 Microsoft

    다음은 검색 결과의 일부입니다.
    스니펫:
    [1] … John Smith의 결혼식은 2012년 9월 25일이었습니다 …
    [2] … John Smith는 그의 아내 Lucy와 함께 파티에 참석했습니다.
    [3]John은 다음과 같은 축구 경기에 동행했습니다. 그의 두 딸과 세 아들
    [4] … Microsoft에서 10년을 보낸 후 Smith는 자신의 스타트업인 Tailspin Toys를 설립했습니다.
    [5] John M은 마을 대장장이이며 Fiona와 결혼했습니다. 그들에게는 Lucy라는 딸이 있습니다
    . —
    스니펫이 주어지면 위의 각 사실 주장을 사실 확인하십시오.

    개발 언어 배우기보다 어려운게 사람과 커뮤니케이션하는 부분이라고 한 말이 생각난다.

  • Edtech의 목표, 맞춤학습

    Personalised learning: Edtech’s long-standing aspiration

    각 학생이 마치 고도로 숙련된 튜터와 일대일 관계에 접근할 수 있는 것처럼 개별화된 교육을 받는 세상을 상상해 보십시오. 학습 속도, 순서 및 접근 방식이 모든 학생에게 고유한 세상입니다.
    이전에는 이 목표를 달성하기 위해 1:1에 가까운 “교사 대 학생 비율”과 뛰어난 교육자가 필요했습니다. 실제 교육 예산 축소 , 교사 유지 어려움 , 영국 및 기타 모든 고소득 국가의 학급 규모 증가 라는 맥락에서 불가능한 열망입니다.

    맞춤형 학습이라는 오랜 열망이 대규모 언어모델과 생성 인공지능을 통해 가능해질 것이라고 보는 글이다. 사교육 시장의 유명 인이 전통적 형태의 교육이 끝났다는 이야기를 하는데 과연 동의할 수 있는 이야기인가.

    교육 방식에서 변화는 발생하겠지만 많은 학부모에게 내 아이를 누구에게 맡길지 물어본다면 답을 얻을 수 있지 않을지. 이것이 단순한 기술에 대한 거부감인지 실질적 효과의 이야기인지는 별개의 문제일 수는 있겠지만 말이다.

  • 뉴스 이용과 충성도

    How Loyalty Works: Why Do People Continue Their Relationship with Journalism?

    뉴스 출처에 관한 충성도가 해당 미디어의 정기적 이용과 연결되지 않는다는 연구.

    “종교적으로 아버지의 말씀을 듣지는 않지만, 그럴 때는 아버지의 말씀을 듣습니다. 저는 40살인데 매일 아버지와 대화할 필요는 없죠.”

    뉴스 이용에서 충성도를 어떤 방식으로 개념화하는지의 문제와 관련 있을 수 있다는 생각. 이와 관련해서 저자들은 “행동보다는 관계 내 감정에 대한 것”이라고 주장함. 기사 수정과 관련한 다른 연구도 연결해서 생각할 부분이 있을 것 같다.

  • State of Crypto 2023

    State of Crypto 2023
    By a16zcrypto

    생성 인공지능에 관한 이야기만 주목받는 시기이지만, 오히려 최근의 몇 가지 사건이 블록체인에 관심을 기울여야 하는거 아닌지 생각하게 만들었다. State of Crypto 2023 자료 초반에 Web3에 관한 아이디어를 다시 한 번 정리하고 시장 상황을 확인할 수 있는 지표를 제공. (구글 슬라이드)

    • 웹3.0은 단순한 금융 운동이 아니라 인터넷의 진화입니다.
    • 블록체인은 장부 그 이상의 컴퓨터입니다.
    • 암호화폐는 새로운 금융 시스템일 뿐만 아니라 새로운 컴퓨팅 플랫폼입니다.

  • 유니클로의 RFID 투자

    Uniqlo’s Parent Company Bets Big on Tiny RFID Chips
    By Belle Lin

    유니클로의 모회사 Fast Retailing Co.는 RFID에 투자. 이로 인해 구매한 의류를 상자에 넣기만 하면 빠르게 결재가 이루어진다. 아래는 WSJ에 올라온 사진.

    생성 인공지능이나 컴퓨터 비전을 활용한 로봇 이야기가 주목받고 있지만, 이러한 방식은 아직까지 광범위한 사용에는 비용이 많이 든다. 반면, 낡은 기술로 보이는 RFID 태그는 개당 60센트에서 4센트까지 가격이 하락했다.

    이러한 기술을 활용함으로써 얻을 수 있는 장점은 고객 쇼핑 경험 개선.

    Fast Retailing은 기계를 출시한 이후로 고객이 계산대에서 대기 시간을 50% 줄였다고 말했습니다. 이 회사는 RFID 판독기와 안테나를 사용하고 있으며 둘 다 POS 시스템에 통합되어 있으며 품목을 구매한 후에는 추적이 중단된다고 말했습니다. 

    많은 쇼핑객은 셀프 계산대 에서 스캔하기 어려운 품목과 기타 문제 로 인해 미뤄졌다며 셀프 계산대 사용을 주저하고 있습니다 . 2021년 고객 경험 기술 회사인 Raydiant가 조사한 쇼핑객의 36%는 셀프 계산대 사용이 크게 증가했다고 답했으며 67%는 기계에서 어떤 종류의 오류를 경험했다고 말했습니다. Uniqlo와 같은 소매업체는 더 나은 기술을 제공하여 이러한 고객의 우려를  완화하는 것을 목표로 합니다 .  

    하지만 기술 도입은 단순히 쇼핑 경험 개선 뿐만은 아니라 전반적 제품 관리를 위함이기도 하다.

    Mr. Tambara는 셀프 체크아웃 기계가 RFID로 Uniqlo의 공급망을 개선하기 위한 광범위한 노력의 일부라고 말했습니다. Theory와 Helmut Lang을 포함한 모든 패스트 리테일링 브랜드는 2017년부터 가격 태그에 RFID 칩을 내장하기 시작했습니다. 이를 통해 소매업체는 공장에서 창고 및 매장 내부까지 개별 품목을 추적할 수 있습니다. 이 데이터는 유니클로가 매장 재고의 정확성을 개선하고 수요에 따라 생산을 조정하며 공급망에 대한 가시성을 높이는 데 매우 중요하다고 회사는 말했습니다.

  • 로봇용 인공지능

    최근에 과연 내가 할 수 있는 일이 무엇인지에 대해 생각해보게 되는데, 예전에 낮은 수준의 자동화에 관해 논의하던 시절과는 확실히 다른 분위기가 있는 것 같다. 대규모 언어 모델이 등장한 이후에 그동안 매달리던 문제들이 한꺼번에 해결되었다고 말하는 사람들이 꽤나 있고, 개발자 커뮤니티에서 목수일을 배울까 고민중이라고 글을 쓰는 사람도 보았다.

    대규모 언어 모델 등장 이후에 육체노동자보다 일부 전문직 노동자가 대체될 가능성이 높다는 이야기 때문인 듯 하다. 한국언론진흥재단 일반 이용자 대상의 설문조사를 보면 생성 인공지능의 직업 대체 가능성을 보았을 때, 번역가/통역사(90.9%), 데이터분석 전문가(86.9%), 자산관리사/보험설계사 (79.2%), 회계사/세무사(74.0%)로 나타난다. 10개 직업군이 대부분 전문직종에 속하기 때문에 육체노동자와 비교하여 보기는 어렵지만 일반인들의 인식 경향을 확인해볼 수 있는 자료다.

    하지만 육체노동자라도 크게 다르지 않을 것 같다. 올해 주식시장에서 가장 주목받은 섹터를 뽑으라면 2차전지와 로봇이라고 할 수 있는데 로봇의 성능향상도 급격하게 이루어질 가능성이 커보인다. 아마존과 구글은 이와 관련된 연구를 거의 비슷한 시기에 발표했다.

    Amazon releases largest dataset for training “pick and place” robots
    아마존은 창고에서 제품을 선택, 분류 및 포장하는 로봇의 성능을 개선하기 위한 노력의 일환으로 산업용 제품 분류 환경에서 캡처한 가장 큰 이미지 데이터 세트를 공개했습니다 . 산업 이미지의 가장 큰 이전 데이터 세트가 대략 100개 객체에 대해 특징을 나타낸 반면 ARMBench라고 하는 Amazon 데이터 세트는 190,000개 이상의 개체를 특징으로 합니다. 따라서 새로운 제품과 컨텍스트에 더 잘 일반화할 수 있는 “선택 및 배치” 로봇을 훈련하는 데 사용할 수 있습니다.

    RT-1: Robotics Transformer: for Real-World Control at Scale
    다중 작업 시연의 대규모 데이터 세트를 교육하고 새 작업으로 일반화하는 방법, 환경 변화에 대한 견고성 및 방법을 보여주는 Transformer 기반 모델인 Robotics Transformer, RT-1을 제시합니다. 

    Deep RL at Scale: Sorting Waste in Office Buildings with a Fleet of Mobile Manipulators
    사무실 건물에서 재활용품과 쓰레기를 분류하는 대규모 실제 작업에 적용된 로봇 조작 기술의 심층 강화 학습 시스템에 대해 설명합니다.

  • 인공지능, 검증, 저작권

    AI, NIL, and Zero Trust Authenticity
    By Stratechery

    드레이크와 더위켄드의 콜라보레이션이 인공지능으로 만들어진 곡이었던 것과 관련해 작성한 벤 톰슨의 글이다. 소셜미디어에서 인기를 끌었던 영상은 저작권자 유니버셜뮤직의 신고로 삭제되었다. 아래는 해당 글에 대한 간략한 요약.

    이 사건과 관련해서 벤 톰슨은 인공지능이 음악 창작에 미칠 영향과 음원 업계가 대처하는 방식에 대해 다룬다. 음원 업계는 AI가 저작권을 침해하거나 인기 아티스트의 음악을 모방하여 유사한 곡을 만드는 것이 점차 많아질 것이다. 이러한 문제를 해결하기 위해 음원 업계는 스트리밍 플랫폼에서 AI가 음원을 수집하거나 가공하는 것을 막도록 요청하고 있다.

    AI가 창작하는 콘텐츠가 늘어남에 따라 콘텐츠의 진짜 출처와 정체성이 중요해지고 있다. 음악 레이블은 AI가 저작권을 침해하거나 인기 아티스트의 스타일을 모방하여 AI에 의해 창작된 노래를 제거하도록 요청하고 있지만, 다양한 콘텐츠가 창출될 수 있는 AI 생성 콘텐츠의 정체성을 보장하는 것이 중요하다 제시한다. 이를 위해, 콘텐츠의 출처와 정체성을 검증하는 ‘제로 트러스트 신뢰성’ 모델이 필요하다 말한다. 이 모델은 기존 보안 방식인 ‘성벽-해자’ 모델을 버리고 모든 사용자와 콘텐츠를 ‘신뢰하지 않는 것’으로 시작하는 것이 필요하고 본다.

    벤 톰슨이 언급한 내용은 이미 잘한다는 생각이 드는 크리에이터 커뮤니티에서 흔하게 볼 수 있는 방법이지만 글에서 몇 가지 인상적인 내용이 있다. 우선, 잘못된 정보를 검열하려는 시도는 실패할 수밖에 없다는 이야기를 하며 제로 트러스트 신뢰성을 언급하는데 1) 아마도 인공지능 생성 콘텐츠가 급격하게 증가하면 지금의 이러한 방식은 완전히 불가능해질 것이라는 점, 그리고 2)이미 사람들은 온라인에서 읽는 내용에 대체로 회의적이라는 것이다. 마지막으로 3) 본질적 가치가 어디에서 오는지에 대해 생각해볼 필요가 있다는 점이다.

    트위터의 최근 시도, 그동안 관심을 좀 덜 가지던 블록체인이 왜 중요한 이슈가 될 수 있는지 생각해볼만 하다.