[작성자:] haeyeop

  • 발렌시아가 입은 교황

    AI Images Like the “Balenciaga Pope” Are Getting Harder to Spot
    By Billy Perrigo

    교황이 발렌시아가 패딩을 입은 사진이 온라인에서 바이럴 된 바 있다. 딥페이크에 관한 논의에서 이미지가 어색한 부분을 확인하는 방법 또는 이미지를 직접 검색해보는 방법을 활용해 진위여부를 판별할 수 있다는 이야기들을 했다. 이 사진도 진짜같지만 십자가 목걸이, 손모양 등을 참고하면 아직까지 조금 어색한 부분들을 발견할 수 있다. 그럼에도 불구하고 얼핏 보면 이 사진이 어색하다는 걸 발견할 수 있을까?

    출처 이미지 제공: Instagram을 통한 @art_is_2_inspire

    딥페이크 비디오를 감지하는 데 96% 정확하다고 말하는 Intel의 제품을 포함하여 딥페이크를 감지할 수 있다고 주장하는 판매용 소프트웨어가 많이 있습니다. 그러나 이미지가 AI로 생성되었는지 여부를 안정적으로 알려줄 수 있는 무료 온라인 도구는 거의 없습니다. AI 플랫폼 Hugging Face에서 호스팅되는 무료 AI 이미지 감지기 1개 는 Balenciaga Pope의 이미지가 AI로 생성되었음을 69%의 확실성으로 정확하게 감지할 수 있었습니다. 그러나 최신 버전의 Midjourney에서 제작한 Elon Musk의 AI 생성 이미지를 제시 한 이 도구는 이미지가 진짜라고 54% 확신한다고 말하면서 잘못된 대답을 했습니다.

  • 이탈리아 ChatGPT 금지

    Italian privacy regulator bans ChatGPT
    by Clothilde Goujard, POLITICO

    이탈리아 개인정보 보고 규제 기관이 개인정보 침해를 이유로 ChatGPT 새로운 버전 릴리즈를 일시 중단할 것을 요청했다고 한다. 이유는 “알고리즘을 훈련하기 위해 개인 데이터의 대량 수집 및 저장”을 정당화하는 법적 근거가 부족하다는 이유이다.

    ChatGPT도 지난 주 데이터 유출로 사용자 대화와 사용자의 지불 정보를 노출했다고 이탈리아 당국이 밝혔습니다. OpenAI는 사용자의 연령을 확인하지 않으며 “미성년자는 발달 및 자기 인식 정도에 비해 절대적으로 부적절한 답변”을 노출한다고 덧붙였습니다.[expand title=eng]
    ChatGPT also suffered a data breach and exposed users conversations and payment information of its users last week, the Italian authority said. It added OpenAI does not verify the age of users and exposes “minors to absolutely unsuitable answers compared to the their degree of development and self-awareness.”[/expand]

    해당 기사에서 언급하는 내용은 2023년 3월 22일 ChatGPT 다운 이후로 유료 버전 사용자의 결제 정보가 유출되었다는 것이다. (관련 기사). 아마 정상적인 상황에서는 이런 일들은 발생하지 않는 것으로 보이기는 하지만 GDPR을 준수한다는 내용을 20일 이내에 알리지 않으면 최대 4%에 달하는 벌금을 부과할 수 있다는 내용.

  • 구글 광고투명성센터

    메타(메타 광고 라이브러리)에 이어 구글도 자사 플랫폼에 게재된 모든 광고를 볼 수 있는 도구를 공개했다.

    광고 투명성 센터는 인증된 광고주가 제공하는 모든 광고의 검색 가능한 허브입니다.

    이 원스톱 상점은 Google에서 표시되는 광고에 대한 정보에 쉽게 액세스할 수 있도록 사용자를 염두에 두고 설계되었습니다. 광고 투명성 센터를 통해 다음을 이해할 수 있습니다.

    • 광고주가 실행한 광고
    • 특정 지역에 게재된 광고
    • 광고가 실행된 마지막 날짜 및 광고 형식.
    https://blog.google/technology/ads/announcing-the-launch-of-the-new-ads-transparency-center/

  • State of Crypto 2023

    State of Crypto 2023
    By a16zcrypto

    생성 인공지능에 관한 이야기만 주목받는 시기이지만, 오히려 최근의 몇 가지 사건이 블록체인에 관심을 기울여야 하는거 아닌지 생각하게 만들었다. State of Crypto 2023 자료 초반에 Web3에 관한 아이디어를 다시 한 번 정리하고 시장 상황을 확인할 수 있는 지표를 제공. (구글 슬라이드)

    • 웹3.0은 단순한 금융 운동이 아니라 인터넷의 진화입니다.
    • 블록체인은 장부 그 이상의 컴퓨터입니다.
    • 암호화폐는 새로운 금융 시스템일 뿐만 아니라 새로운 컴퓨팅 플랫폼입니다.

  • 유니클로의 RFID 투자

    Uniqlo’s Parent Company Bets Big on Tiny RFID Chips
    By Belle Lin

    유니클로의 모회사 Fast Retailing Co.는 RFID에 투자. 이로 인해 구매한 의류를 상자에 넣기만 하면 빠르게 결재가 이루어진다. 아래는 WSJ에 올라온 사진.

    생성 인공지능이나 컴퓨터 비전을 활용한 로봇 이야기가 주목받고 있지만, 이러한 방식은 아직까지 광범위한 사용에는 비용이 많이 든다. 반면, 낡은 기술로 보이는 RFID 태그는 개당 60센트에서 4센트까지 가격이 하락했다.

    이러한 기술을 활용함으로써 얻을 수 있는 장점은 고객 쇼핑 경험 개선.

    Fast Retailing은 기계를 출시한 이후로 고객이 계산대에서 대기 시간을 50% 줄였다고 말했습니다. 이 회사는 RFID 판독기와 안테나를 사용하고 있으며 둘 다 POS 시스템에 통합되어 있으며 품목을 구매한 후에는 추적이 중단된다고 말했습니다. 

    많은 쇼핑객은 셀프 계산대 에서 스캔하기 어려운 품목과 기타 문제 로 인해 미뤄졌다며 셀프 계산대 사용을 주저하고 있습니다 . 2021년 고객 경험 기술 회사인 Raydiant가 조사한 쇼핑객의 36%는 셀프 계산대 사용이 크게 증가했다고 답했으며 67%는 기계에서 어떤 종류의 오류를 경험했다고 말했습니다. Uniqlo와 같은 소매업체는 더 나은 기술을 제공하여 이러한 고객의 우려를  완화하는 것을 목표로 합니다 .  

    하지만 기술 도입은 단순히 쇼핑 경험 개선 뿐만은 아니라 전반적 제품 관리를 위함이기도 하다.

    Mr. Tambara는 셀프 체크아웃 기계가 RFID로 Uniqlo의 공급망을 개선하기 위한 광범위한 노력의 일부라고 말했습니다. Theory와 Helmut Lang을 포함한 모든 패스트 리테일링 브랜드는 2017년부터 가격 태그에 RFID 칩을 내장하기 시작했습니다. 이를 통해 소매업체는 공장에서 창고 및 매장 내부까지 개별 품목을 추적할 수 있습니다. 이 데이터는 유니클로가 매장 재고의 정확성을 개선하고 수요에 따라 생산을 조정하며 공급망에 대한 가시성을 높이는 데 매우 중요하다고 회사는 말했습니다.

  • 로봇용 인공지능

    최근에 과연 내가 할 수 있는 일이 무엇인지에 대해 생각해보게 되는데, 예전에 낮은 수준의 자동화에 관해 논의하던 시절과는 확실히 다른 분위기가 있는 것 같다. 대규모 언어 모델이 등장한 이후에 그동안 매달리던 문제들이 한꺼번에 해결되었다고 말하는 사람들이 꽤나 있고, 개발자 커뮤니티에서 목수일을 배울까 고민중이라고 글을 쓰는 사람도 보았다.

    대규모 언어 모델 등장 이후에 육체노동자보다 일부 전문직 노동자가 대체될 가능성이 높다는 이야기 때문인 듯 하다. 한국언론진흥재단 일반 이용자 대상의 설문조사를 보면 생성 인공지능의 직업 대체 가능성을 보았을 때, 번역가/통역사(90.9%), 데이터분석 전문가(86.9%), 자산관리사/보험설계사 (79.2%), 회계사/세무사(74.0%)로 나타난다. 10개 직업군이 대부분 전문직종에 속하기 때문에 육체노동자와 비교하여 보기는 어렵지만 일반인들의 인식 경향을 확인해볼 수 있는 자료다.

    하지만 육체노동자라도 크게 다르지 않을 것 같다. 올해 주식시장에서 가장 주목받은 섹터를 뽑으라면 2차전지와 로봇이라고 할 수 있는데 로봇의 성능향상도 급격하게 이루어질 가능성이 커보인다. 아마존과 구글은 이와 관련된 연구를 거의 비슷한 시기에 발표했다.

    Amazon releases largest dataset for training “pick and place” robots
    아마존은 창고에서 제품을 선택, 분류 및 포장하는 로봇의 성능을 개선하기 위한 노력의 일환으로 산업용 제품 분류 환경에서 캡처한 가장 큰 이미지 데이터 세트를 공개했습니다 . 산업 이미지의 가장 큰 이전 데이터 세트가 대략 100개 객체에 대해 특징을 나타낸 반면 ARMBench라고 하는 Amazon 데이터 세트는 190,000개 이상의 개체를 특징으로 합니다. 따라서 새로운 제품과 컨텍스트에 더 잘 일반화할 수 있는 “선택 및 배치” 로봇을 훈련하는 데 사용할 수 있습니다.

    RT-1: Robotics Transformer: for Real-World Control at Scale
    다중 작업 시연의 대규모 데이터 세트를 교육하고 새 작업으로 일반화하는 방법, 환경 변화에 대한 견고성 및 방법을 보여주는 Transformer 기반 모델인 Robotics Transformer, RT-1을 제시합니다. 

    Deep RL at Scale: Sorting Waste in Office Buildings with a Fleet of Mobile Manipulators
    사무실 건물에서 재활용품과 쓰레기를 분류하는 대규모 실제 작업에 적용된 로봇 조작 기술의 심층 강화 학습 시스템에 대해 설명합니다.

  • 인공지능, 검증, 저작권

    AI, NIL, and Zero Trust Authenticity
    By Stratechery

    드레이크와 더위켄드의 콜라보레이션이 인공지능으로 만들어진 곡이었던 것과 관련해 작성한 벤 톰슨의 글이다. 소셜미디어에서 인기를 끌었던 영상은 저작권자 유니버셜뮤직의 신고로 삭제되었다. 아래는 해당 글에 대한 간략한 요약.

    이 사건과 관련해서 벤 톰슨은 인공지능이 음악 창작에 미칠 영향과 음원 업계가 대처하는 방식에 대해 다룬다. 음원 업계는 AI가 저작권을 침해하거나 인기 아티스트의 음악을 모방하여 유사한 곡을 만드는 것이 점차 많아질 것이다. 이러한 문제를 해결하기 위해 음원 업계는 스트리밍 플랫폼에서 AI가 음원을 수집하거나 가공하는 것을 막도록 요청하고 있다.

    AI가 창작하는 콘텐츠가 늘어남에 따라 콘텐츠의 진짜 출처와 정체성이 중요해지고 있다. 음악 레이블은 AI가 저작권을 침해하거나 인기 아티스트의 스타일을 모방하여 AI에 의해 창작된 노래를 제거하도록 요청하고 있지만, 다양한 콘텐츠가 창출될 수 있는 AI 생성 콘텐츠의 정체성을 보장하는 것이 중요하다 제시한다. 이를 위해, 콘텐츠의 출처와 정체성을 검증하는 ‘제로 트러스트 신뢰성’ 모델이 필요하다 말한다. 이 모델은 기존 보안 방식인 ‘성벽-해자’ 모델을 버리고 모든 사용자와 콘텐츠를 ‘신뢰하지 않는 것’으로 시작하는 것이 필요하고 본다.

    벤 톰슨이 언급한 내용은 이미 잘한다는 생각이 드는 크리에이터 커뮤니티에서 흔하게 볼 수 있는 방법이지만 글에서 몇 가지 인상적인 내용이 있다. 우선, 잘못된 정보를 검열하려는 시도는 실패할 수밖에 없다는 이야기를 하며 제로 트러스트 신뢰성을 언급하는데 1) 아마도 인공지능 생성 콘텐츠가 급격하게 증가하면 지금의 이러한 방식은 완전히 불가능해질 것이라는 점, 그리고 2)이미 사람들은 온라인에서 읽는 내용에 대체로 회의적이라는 것이다. 마지막으로 3) 본질적 가치가 어디에서 오는지에 대해 생각해볼 필요가 있다는 점이다.

    트위터의 최근 시도, 그동안 관심을 좀 덜 가지던 블록체인이 왜 중요한 이슈가 될 수 있는지 생각해볼만 하다.

  • 추론엔진으로서 LLM

    GPT-4 Is a Reasoning Engine
    By Dan Shipper

    GPT 모델을 비판하는 사람들의 주요 이야기 중 하나는 확률적으로 다음 단어를 추정하는 앵무새일 뿐이라는 점이다. 하지만 사고(thinking)에는 추론(reasoning)과 지식(knowledge)이 있다는 점을 생각해본다면 GPT가 어떻게 사용될 수 있을것이라는 점을 다시 생각해볼 수 있다 말한다.

    예를 들면, ChatGPT에서 특정 인물에 대한 정보를 물으면 부정확한 정보를 제공해주지만, 인터넷에 접속할 수 있는 ChatGPT는 추론이 아닌 웹 조사를 통해 정확한 답변을 추출한다. 저자는 이를 통해 모델의 발전만큼 지식 데이터베이스의 발전이 중요하다 말한다. 따라서 자신의 생각을 정리하고 저장하고 분류하는 사람들은 이러한 모델을 통해 더 높은 효용을 가질 수 있을 것이라는 것이 저자의 주요 생각이다.

    우리는 입력의 중요성을 과소평가하는 경향이 있습니다. 이러한 결과를 얻기 위해 입력한 정보가 무엇인지 말입니다. 그 답은 우리가 분석을 위해 제공하는 정보에 크게 좌우됩니다. 시작점만큼 강력합니다.
    우리는 지식의 한계, 즉 얼마나 많은 정보가 잠겨 있고 이러한 시스템에 액세스할 수 없는지에 대해 충분히 주의를 기울이지 않습니다. 또한 정보 소스를 탐색하고 관련 사실을 찾는 데 시간과 컴퓨팅 비용이 얼마나 드는지 잊고 있습니다. 마지막으로 적시에 모델에 대한 관련 정보를 표시하는 것이 어렵다는 점을 과소평가합니다.
    그러나 이러한 종류의 문제를 해결하는 것은 기본 모델의 추론 기능을 해결하는 것만큼이나 근본적입니다.

    벡터 데이터베이스에 대한 부분도 관심을 가져볼만한 내용이 아닌가 싶다.

  • 와이어드의 생성 인공지능 사용규칙

    How WIRED Will Use Generative AI Tools

    와이어드 가 생성인공지능 정책을 공개했다. 간단히 이야기하자면 대부분의 경우에 생성 인공지능을 사용하지 않는 것으로 결정한 것 같다. 인공지능이 발전할 것이라고 생각하고 이후 변할 수는 있다고 보지만 지금 현재 상태에서의 결정은 아래와 같다.

    AI 텍스트 생성기 (예: LaMDA, ChatGPT)

    • 트위터에서는 AI가 생성한 텍스트가 포함된 스토리를 게시하지 않습니다.
    • 짧은 소셜 미디어 게시물의 헤드라인이나 텍스트를 추천하기 위해 AI를 사용할 수 있습니다.
    • 우리는 연구 또는 분석 도구로 AI를 사용하는 실험을 할 수 있습니다.

    이미지 생성기(예: Dall-E, 미드저니, 스테이블 디퓨전)

    • 트위터에서는 AI가 생성한 이미지나 동영상을 게시하지 않습니다.
    • 특히 스톡 사진 대신 AI가 생성한 이미지는 사용하지 않습니다.
    • 당사 또는 당사가 의뢰한 아티스트는 AI 도구를 사용하여 아이디어를 촉발할 수 있습니다.

  • GenAI의 인터페이스 문제

    Unpredictable Black Boxes are Terrible Interfaces

    프롬프트에 텍스트를 입력하여 결과물을 출력하는 생성인공지능이 왜 끔찍한 인터페이스를 가지고 있는지에 관한 글. 실제로 결과물을 얻기위해서는 수십차례의 시행착오를 겪어야하며, 이로 인해 프롬프트를 거래하는 프롬프트베이스와 같은 서비스도 생긴 상황. 해당 글에서는 몇 가지 논문을 바탕으로 다른 방식에 대한 이야기를 하기도 함.

    제너레이티브 AI 모델은 놀랍지만 끔찍한 인터페이스입니다. 사용자가 입력 제어가 출력에 미치는 영향을 예측할 수 없으면 시행 착오에 의존해야 하는데 이는 실망스러운 일입니다. 이것은 새로운 콘텐츠를 생성하기 위해 생성 AI를 사용할 때 중요한 문제이며 입력 컨트롤과 출력 간의 매핑이 명확하지 않은 한 문제로 남을 것입니다. 그러나 우리는 사용자가 AI와 공통 기반/공유 의미론을 설정할 수 있고 그러한 공유 의미론이 누락되었을 때 복구 메커니즘을 제공할 수 있는 대화형 상호 작용을 활성화하여 AI 인터페이스를 개선할 수 있습니다.

    결론 부분만 짧게 옮겨놓았지만 읽어볼만한 글이다.