[카테고리:] IT

  • 외로운 메타버스

    It’s Lonely in the Metaverse: DappRadar Data Suggests Decentraland Has 38 ‘Daily Active’ Users in $1.3B Ecosystem
    By Cameron Thompson, CoinDesk

    지난 달 나온 기사이지만 참고용으로 남긴다. 메타버스에 대한 책에서 밝은 미래까지는 아니지만… 긍정적인 측면을 위주로 이야기했다. 메타버스로 이야기할 때 언급되는 디센트럴랜드와 샌드박스에 대한 데이터에 따르면 각각 10억 달러의 가치를 지니지만 일일활성이용자(MAU)가 1,000명 미만인 것으로 나타났다.

    데이터 조사업체 DappRadar에 따르면 디센트럴랜드는 24시간동안 38명, 샌드박스는 같은 시간동안 522명의 활성ㅎ사용자를 기록했다. 가장 많은 일일 활성 이용자는 각각 675명, 4,503명이었다.

    측정 방식에 대한 논쟁이 있지만 확실한 사실은 이용자가 굉장히 적다는 것이다.

    디지털 자산 투자 회사인 Arca의 포트폴리오 매니저인 Sasha Fleyshman은 메타버스 플랫폼이 실제로 의도한 대로 작동할 때 사용자에게 훨씬 더 가치가 있을 것이라고 CoinDesk에 말했습니다. Fleyshman은 “오늘날 성공한 메타버스가 있다고 말하는 사람은 거짓말을 하는 것입니다. [expand title=eng]
    Sasha Fleyshman, portfolio manager at digital asset investment firm Arca, told CoinDesk that metaverse platforms will be much more valuable to users when they actually operate as intended. “Anyone telling you that there’s a metaverse today that has worked is lying through their teeth,” said Fleyshman. [/expand]

  • 데이터보다 고객의 소리를 듣기

    Data Is Great — But It’s Not a Replacement for Talking to Customers
    by Graham Kenny, HBR
    기업이 인사이트를 얻기 위한 방법으로 데이터에 과도하게 집중하는 것을 이야기하는 글이다. 은행들이 데이터로 고객을 분석하고 유통업도 대량의 데이터를 분석하며 빅데이터 푸시(big data push)를 선언했다는 사례를 언급한다. 하지만 데이터로 인사이트를 찾으려는 행동에 대한 우려를 표하며 진짜 성공은 도요타나 어도비처럼 고객의 소리를 듣는 것에서 왔다고 말한다.

    데이터가 “정밀하게 부정확”하지 않은 경우 최신 컴퓨터 성능을 사용하여 고객의 구매 행동 패턴을 조사한다. 하지만 빅 데이터의 한계를 이해해라. 데이터는 역사적이며 정적이다. 과거에 대한 것이기 때문에 역사적이다. 당신의 고객은 데이터가 획득한 것에서 이동했을 가능성이 크다. 그리고 다른 컴퓨터 모델링과 마찬가지로 여러분이 묻고 싶지 않은 질문에 답할 수 없기 때문에 정적이다.[expand title=eng]
    So, provided your data isn’t “precisely inaccurate” employ modern computer power to examine patterns in your customers’ buying behavior. But understand big data’s limitations. The data is historic and static. It’s historic because it’s about the past. Your customers have most likely moved on from what the data captures. And it’s static because, as with any computer modeling, it can never answer a question that you didn’t think to ask.[/expand]

    직접 목소리를 듣는 인터뷰에서 오는 편향도 있을 수 있지만 사실 데이터를 들여다보기전에 이미 현장에서 일하고 있는 사람은 대부분 정답을 알고 있다.

  • 팟캐스트, 구독(subscribe) 용어 변경

    ‘Follow our podcast’: Apple Podcasts to stop using ‘subscribe’
    By James Cridland
    구독 모델이 일반적인 수익모델로 사로잡으면서 구독(subscribe)이라는 말 자체가 돈 내야한다는 의미처럼 들릴 수 있는 것 같다. 그래서 애플은 팟캐스트에서 구독이라는 단어를 팔로우(follow)로 바꾸었다는 내용.

    Edison Research의 Tom Webster는 현재 팟 캐스트를 듣지 않는 청취자의 47 %가 팟 캐스트를 ‘구독’하면 비용이들 것이라고 생각하며 팟 캐스트의 성장을 걸림돌이 될 수 있는 것이라고 말합니다.[expand title=eng]
    Tom Webster from Edison Research says 47% of people who don’t currently listen to podcasts think that ‘subscribing’ to a podcast will cost money, describing it as a stone in the shoe of podcasting’s growth run.[/expand]

    우리나라에서는 용어가 정리 되지 않아서인지 사람들이 가지는 선입견이 크지 않은 것 같다. 유튜브에서는 구독과 가입(유료 후원)으로 되어 있다.

  • 데미안 허스트 NFT 프로젝트

    데미안 허스트의 새로운 프로젝트에 관한 토론 영상을 보고 흥미로워 보여서 프로젝트에 대한 내용을 조금 찾아보았다. 다음은 Fast Company에 나왔던 짧은 소개 기사다.

    영국 예술가 Damien Hirst의 최신 프로젝트 The Currency는 두 가지 형태의 작품입니다. 작품의 물리적 형태는 손으로 그린 다채로운 점들로 덮여 있는 10,000장의 ​​A4 용지입니다. 지폐와 같은 방식으로 각 시트에는 허스트의 홀로그램 이미지, 서명, 마이크로닷이 포함되어 있으며 일련 번호 대신 작은 개별 메시지가 있습니다.

    작품의 두 번째 부분은 이 손으로 그린 ​​각 시트에 해당 NFT(대체 불가능 토큰)가 있다는 것입니다. NFT는 블록체인으로 알려진 보안 온라인 원장에 존재하는 디지털 소유권 인증서입니다.

    The Currency가 작동하는 방식은 수집가가 실제 작품을 즉시 구매하지 않는다는 것입니다. 대신 NFT에 대해 2,000달러를 지불하고 1년 동안 디지털 버전을 원하는지 아니면 실제 버전을 원하는지 결정해야 합니다. 수집가가 하나를 선택하면 다른 하나는 파괴됩니다.[expand title=eng]

    English artist Damien Hirst’s latest project, The Currency, is an artwork in two forms. Its physical form is 10,000 unique hand-painted A4 sheets covered in colorful dots. In the same way as paper money, each sheet includes a holographic image of Hirst, a signature, a microdot, and—in place of a serial number—a small individual message.

    The second part of the artwork is that each of these hand-painted sheets has a corresponding NFT (nonfungible token). NFTs are digital certificates of ownership that exist on the secure online ledgers that are known as blockchains.

    The way The Currency works is that collectors will not be buying the physical artwork immediately. Instead, they will pay $2,000 for the NFT and then have a year to decide whether they want the digital or the physical version. Once the collector selects one, the other will be destroyed.[/expand]

    화폐란 무엇인지 본질적인 속성에 대한 의문을 제기하는 프로젝트라고 말한다. 가치란 가치를 부여하는 커뮤니티의 맥락과 떨어져서 존재하기는 어려운데, 데미안 허스트의 프로젝트에는 두 가지 커뮤니티가 있다. 실제 예술 작품을 소유하고 그것에 가치를 부여하는 커뮤니티와 디지털 버전을 소유하고 그것이 진짜 소유라고 생각하는 커뮤니티이다. 구매한 사람들이 어떤 것을 선택할지는 1년이 지나 알게 될 것이다.

  • OpenAI 소프트웨어 코드 자동화 소프트웨어 Codex

    OpenAI

    GPT-3 모델을 만든 OpenAI에서 공개한 또 다른 ML 프로젝트인 Codex. 자연어 입력을 통해 소프트웨어 코드를 작성할 수 있도록 만들어준다. 사이트에는 간단한 탄막 피하기류 게임 만드는 영상부터 데이터 분석에 이르기까지 몇 가지 사례가 나와있다.

    유튜브 영상을 보면 데모를 볼 수 있는데 생각하고 판단하는 인공지능은 아니지만 많은 부분을 자동화하는 모습을 확인할 수 있다.

    프로그래머가 무엇을 빌드해야 하는지 알게 되면 코드를 작성하는 행위는 (1) 문제를 더 단순한 문제로 분해하고 (2) 이러한 단순한 문제를 이미 존재하는 기존 코드(라이브러리, API 또는 함수)에 매핑하는 것으로 생각할 수 있습니다. 후자의 활동은 아마도 프로그래밍에서 가장 재미없는 부분(그리고 진입 장벽이 가장 높음)이며 OpenAI Codex가 가장 뛰어난 부분입니다.[expand title=eng]

    Once a programmer knows what to build, the act of writing code can be thought of as (1) breaking a problem down into simpler problems, and (2) mapping those simple problems to existing code (libraries, APIs, or functions) that already exist. The latter activity is probably the least fun part of programming (and the highest barrier to entry), and it’s where OpenAI Codex excels most.[/expand]

    머신러닝으로 “이미지 인식이 되네. 자연어 처리가 되네!”라고 했던게 2014년 언저리부터 지속되어 온 일이라면, 이러한 것으로 무엇을 어떻게 더 할 수 있을지에 대한 내용을 보는 것이 새로운 흐름이 되지 않았나 싶다.

  • 트위터의 조직문화 변화와 갈등

    Culture Change and Conflict at Twitter

    By Kate Conger, The New York Times 

    한창 때 트위터는 여러 가능성으로 많은 주목을 받았지만 새로운 제품 개발의 지연, 투자자들의 압력, 이용자의 불만과 같은 다양한 문제를 겪었다. 최근에는 혁신적인 변화를 보여주기 위한 다양한 서비스를 시도했다. 물론 금새 종료한 서비스들이 많지만 뒤늦게 변화하는 모습을 보여주는 듯 했다.

    혁신을 위해 새로운 경영진을 데려오며 조직의 문제가 발생했다는 것을 보여주는 뉴욕타임즈의 기사. 새로운 디자인 부사장 데이비스는 서로서로 칭찬과 비판을 할 것을 요구했고 많은 직원들이 부담감을 느끼고 회사를 떠났다는 이야기도 있다.

    친절한 문화(nice culture)라고 부르는 것은 조직 생활에서 많이 경험하게 되는 것 중 하나이지만 과도한 경우 조직 문화에 부정적 영향을 가져온다. 친절한 문화가 가지는 위험성으로 위기에 대한 대응을 어렵게 하고, 혁신을 제한하고, 인력 유출을 가져오며, 의사 결정의 속도를 늦춘다고 이야기한다.

    데이비스 같은 스타일의 리더십이 옳은 것인가? 조직에서는 많은 불만을 이야기했다는 언급도 있다.

    데이비스는 직설적인 스타일 때문에 직원들과 반복적으로 충돌했습니다. 직원에 대한 그의 대우는 또한 트위터의 직원 관계 부서에서 여러 조사의 대상이 되었고 CEO인 잭 도시에게 너무 많은 사람들이 떠나고 있다는 불만을 표출하기도 했습니다.[expand title=eng]

    Mr. Davis repeatedly clashed with employees because of his blunt style. His treatment of workers was also the subject of several investigations by Twitter’s employee relations department, and of complaints to Jack Dorsey, the chief executive, that too many people were leaving.[/expand]

    이러한 것을 어떻게 할 것인지는 언제나 문제가 된다.

    그는 문화적 엉망징창은 직원들을 짜증나게 하고 때로는 재정적 불안정을 야기하기도 한다고 말했습니다. “이러한 두 가지 사이에 균형이 있습니다. 사회화와 강력한 문화를 통해 그것을 할 것인가, 아니면 돈과 사람들을 단속하는 것을 통해 할 것인가”[expand title=eng]

    Cultural shits rile employees and sometimes cause financial instability, he said. “There is always this balance between: Do we do it by socialization and having a strong culture, or do we do it with money and cracking down on people?”[/expand]

    조직을 개선하려는 시도는 최근 다양한 테크 기업에서 나타나고 있는데 문화란 한 번 자리잡으면 쉽게 바꾸기 어려운 것이다. 리더십에 대한 일반적인 가치평가를 떠나 조직 문화 개선을 위해 어떤 종류의 리더십이 타당한지에 대해 생각해보게 된다.

  • 얼굴인식과 인공지능 윤리

    Face recognition and the ethics of AI
    Benedict Evans
     
    얼굴인식 윤리와 관련된 꽤나 긴 글인데 간단히 말하자면 우리가 어떤 것이 좋고 나쁘다고 이야기하기에는 회색 지대가 많다는 내용. 많은 부분 기술이 아니라 사람들이 가지는 인식, 문화, 정치와 관련된 질문에서 비롯한다는 것.
     
    좋은 사람이 나쁜 데이터를 활용할 때
    출처 : François Chollet

    • 수학은 편향될 수 없지만 데이터는 편향될 수 있다. (The maths can’t be biased but the data can be.)
      예) 피부암을 판별하기 위한 데이터 구성에서 인종간 데이터가 고르게 포함되지 않은 경우

     
    나쁜 사람이 좋은 데이터를 활용할 때

    • 경찰이 길 잃은 노인을 식별
    • 계산대에서 고객 식별

    이를 판단하기 위해 몇 가지 기준을 사용한다 (누가 수행하는지, 의도적인지, 익명을 보장하는지 등). 이러한 데이터베이스 문제에 대해 이야기하지만 우리는 공항에서 지문 날인이나 범죄자 생체정보 데이터베이스 구축에는 익숙하다. 즉, 무엇이 나쁜지에 대한 합의가 이루어지지 않기 때문에 실제로 나쁜것이 무엇인지 이야기하기 어렵다는 점이다.
     
    따라서 해결해야하는 과제는 올바른 수준의 추상성을 획득하는 것이라고 말한다.

  • 워드 임베딩의 성적 편향 완화

    Double Hard-Debias: Tailoring Word Embeddings for Gender Bias Mitigation
     
    세일즈포스(salesforce)와 버지니아 대학 연구자들이 제시한 워드 임베딩의 성적 편향을 완화하는 방법에 대한 내용이다.
    워드 임베딩은 단어전체에서 단어를 나타내는 실제 숫자로 이루어진 벡터로 단어와 다른 단어의 관계에 대한 의미론적 구문론적인 뜻을 포착할 수 있게 해준다. 자연어 처리 작업에 널리 활용됨에도 코퍼스에 대한 학습과정에서 의도하지 않은 성적인 편견을 물려받는 것으로 인한 비판을 받았다.
    예를 들면, 다음의 두 가지 기준(남성과 여성 / 젠더중립과 특정젠더)으로 단어를 분류한다면 우수한(brilliant), 똑똑한(genius)과 같은 단어는 젠더 중립적이고 숙녀(ladies), 여왕(queen) 같은 단어는 특정젠더에 속하는 단어이다.
    이와 같은 문제를 알고리즘에 대한 비판으로 접근하는 것과 관련해 사람들이 그러한 방식으로 언어를 사용하기 때문이고, 알고리즘은 이러한 내용을 순수하게 반영하는 것이라는 단순한 실재론에 가까운 입장이었다. 오히려 알고리즘을 의인화하는 방식의 비판에 대해서 부정적이었으나 실제로 이런 학습과 관련된 문제를 적극적으로 교정하는 것이 점차 중요해진다. 예를 들어, 젠더 편견을 가진 시스템으로 이력서 필터링을 하는 경우 어떤 일이 생길 것인가? 이미 비슷한 사례가 많이 제시되었다.
    기존 방식은 사후 처리 과정에서 성별 관련 구성 요소를 주성분 요소를 빼서 편견을 줄이는 방식이라고 한다. 하지만 이러한 방식이 가지는 한계는 단어의 빈도로 인해 제거된 젠더편향이 되살아날 수 있다는 점이다. 본 연구에서 제시한 방식은 워드 임베딩을 빈도가 없는 하위 공간으로 전환하는 과정을 거친다는 것이다. 대충 느낌은 오지만 실제로 데이터를 돌려봐야 정확하게 파악할 수 있을 것 같다.

    일부 전문가들은 단어 삽입에서 편견을 완전히 제거 할 수 없다고 생각하는 것은 가치가 있습니다. 뮌헨 기술 대학 (Technical University of Munich)의 최근 메타 분석에서, 기고자들은 단어의 의미 론적 내용이 항상 사회의 사회 정치적 맥락에 묶여 있기 때문에 자연적으로 발생하는 중립적 텍스트와 같은 것은 없다고 주장합니다. [expand title=eng]
    It’s worth noting that some experts believe bias can’t be fully eliminated from word embeddings. In a recent meta-analysis from the Technical University of Munich, contributors claim there’s “no such thing” as naturally occurring neutral text because the semantic content of words is always bound up with the sociopolitical context of a society.[/expand]

    알고리즘도 현실을 반영하는 하나의 미디어로 결국은 언어와 세상에 관해 어떤 관점을 가져가는지에 대해 고민할 필요가 있다. 완전 중립적이라는 것은 존재하지 않지만 이러한 편향을 줄이는 것이 가지는 의미에 대해 생각해볼 필요가 있지 않을까.

  • 얼굴 기반의 범죄예측 알고리즘

    Over 1,000 AI Experts Condemn Racist Algorithms That Claim to Predict Crime
    By Janus Rose, Vice
    얼굴을 기반으로 범죄여부를 예측하는 알고리즘을 제시하는 연구에 대해 많은 인공지능 전문가가 비판했다는 내용.

    이 공개 서한은 하버드, MIT, 구글, 마이크로 소프트의 학계 및 인공 지능 전문가들에 의해 서명되었으며 출판사 스프링거에게 다가오는 논문의 출판을 중단 할 것을 요구했다. 이 논문은“80 %의 정확성”과“인종의 편견이없는”얼굴 사진만으로 범죄를 저지를 지 여부를 저자가 주장 할 수있는 시스템을 설명합니다.[expand title=eng]
    The public letter has been signed by academics and AI experts from Harvard, MIT, Google, and Microsoft, and calls on the publishing company Springer to halt the publication of an upcoming paper. The paper describes a system that the authors claim can predict whether someone will commit a crime based solely on a picture of their face, with “80 percent accuracy” and “no racial bias.”
    [/expand]

    업데이트 한 뉴스에 따르면 네이쳐에 투고한 논문은 게제불가를 받아서 확인할 수는 없지만 가짜 프로필을 만드는데 얼굴이 왜 중요한지에 대해 생각해보다가 떠오른 기사. 하지만 동양에서는 얼굴을 가지고 판단하는 관상이라는 문화가 익숙하지 않은가? 연구와 관계없이 데이터가 있다면 유사한 아이디어로 한 번 시도해보고 싶은 내용이다.

  • GPT-3 아이디어

    OpenAI API

    OpenAI에서 새롭게 출시된 머신러닝 도구가 공개되고 나서 많은 사람들이 관심을 보였다. 엄청나게 큰 데이터를 통해 학습한 텍스트 생성 모델이라고 간단하게 설명할 수 있을 것 같다. 나는 열렬한 ML 신봉자는 아니었지만 GPT-3를 보면서 과연 어디까지 어떻게 활용할 수 있을까 생각해보게 된다. ML이 보편적인 기술이 되면서 이 기술을 어떻게 활용할지에 대한 상상력이 더 중요해지는 시기가 오는 것 아닌가. 트위터에서 GPT-3를 사용한 다양한 사례 중 몇 가지를 뽑았다.