[작성자:] haeyeop

  • 범죄예측 알고리즘과 인종

    by Julia Angwin, Jeff Larson, Surya Mattu and Lauren Kirchner, ProPublica, Machine Bias

    프로퍼블리카에 올라온 장문의 글이다. 긴 글을 보는건 부담스럽지만 흥미로운 내용이라서 적어놓는다. 국내 법정에서도 이런 방식을 사용하는지는 모르겠지만 미국에서는 범죄에 대한 법정 판결에서 위험 평가(risk assessment)라는 것을 참고하는가보다. 간단하게 이야기하면 다음과 같다.

    • (위험 평가) 공식은 흑인 피고인들에게 미래 범죄자라고 잘못 표시할 가능성이 있다. 이런 식으로 잘못 낙인찍히는 흑인 피고인들이 백인에 거의 두 배 가까이 된다.
    • 백인 피고인들은 흑인 피고인들에 비해 종종 낮은 위험을 가진 것으로 잘못 판정된다.

    범죄 관련 연구에서 오랫동안 미래의 범죄를 예측하려고 노력해왔고, 1970년대와 같은 초기에는 인종, 국적, 피부색과 같은 요인들이 사용되기도 했다. 그 이후로 다양한 연구들이 이루어진 것 같다. 최근 2016년 연구에서는 흑인들이 더 높은 점수를 받지만 편견이 원인이 아니라고 결론지었다. 하지만 실제 기사에 나오는 사례들을 보면 재범률이 낮음에도 불구하고 흑인이기 때문에 높은 점수를 받았다는 사례들이 제시된다. 중요한 것은 이런 평가 과정 자체를 명확히 알 수 없다는 것이다.

    피고인들은 그들의 평가에 이이를 제기할 기회를 거의 가지지 못한다. 결과는 피고인의 변호사와 공유되지만 기반하는 데이터로부터 점수로 변환된 계산은 거의 밝혀지지 않는다. [expand title=English]

    Defendants rarely have an opportunity to challenge their assessments. The results are usually shared with the defendant’s attorney, but the calculations that transformed the underlying data into a score are rarely revealed.[/expand]

    통계라는게 세상이 확률적이라는 가정 아래서 미래의 사건을 예측하려는 것이지만 오차가 발생할 수밖에 없다. 데이터와 알고리즘에 기반한 예측이 인간 개인에게 적용되었을 때 과연 공정하다고 말할 수 있을까. 과거 데이터를 기반으로 분류하는 통계적 방법이 연좌제 같다는 생각이 들기도 한다.

  • 애플과 블랙베리

    Marco Arment의 블로그에 올라온 If Google’s right about AI, that’s a problem for Apple

    원래 처음 올라왔을 때 제목은 Avoiding BlackBerry’s fate였는데 오늘 다시 들어가보니 제목이 바뀌었다. 과거 블랙베리가 실패한 것은 제품이 뛰어나지 않았기 때문이 아니라 게임의 규칙 자체가 변했기 때문이라는 이야기를 한다.

    아이폰이 처음 등장했을 때, 블랙베리는 한동안 꽤나 잘 해갔다. 그러나 아이폰은 게임을 완전히 바꾸었다. 스마트폰을 기본적인 비즈니스에 초점을 맞춘 이메일 기기로부터 데스크톱 수준의 운영체제와 풍부한 앱 생태계를 갖춘 개인용 컴퓨터로 변화시켰다.
    [expand title=English]
    When the iPhone came out, the BlackBerry continued to do well for a little while. But the iPhone had completely changed the game — it changed what smartphones were for, from basic business-focused email devices to entire consumer personal computers with desktop-class operating systems and rich app ecosystems.[/expand]

    현재도 이와 비슷한 일이 발생하고 있다고 보는데 바뀐 제목이 조금 더 직관적으로 말해주듯이 아마존, 페이스북, 구글과 다르게 빅데이터와 인공지능에서 뒤쳐지고 있다는 언급을 한다. 그리고 만약 구글이 가는 방향이 맞다면 애플이 블랙베리와 비슷한 길을 갈 수 있다는 이야기를 한다.

    그러나 만약 구글이 옳다면 빠르게 따라잡을 수 있는 방법은 없다. 시리를 만든 사람들을 다시 고용하거나 옐프(Yelp)와 파트너를 몇 년 더 유지하는 것으로는 충분하지 않다. 만약 애플이 다음 10년간 경쟁력을 가지는 기업으로 남아있기 위해서는 강한 인공지능과 빅데이터 서비스가 필요하고, 애플은 기업내에서 광범위하게 수 년간 이미 발달해 온 재능과 자산을 필요로 한다. 그들은 빅데이터 서비스 기업이 되는 것이 필요하다. 그들의 빅데이터 서비스는 훨씬 개선되고 훌륭하고 실뢰할만해야 한다.
    [expand title=English]
    But if Google’s right, there’s no quick fix. It won’t be enough to buy Siri’s creators again or partner with Yelp for another few years. If Apple needs strong AI and big-data services in the next decade to remain competitive, they need to have already been developing that talent and those assets, in-house, extensively, for years. They need to be a big-data-services company. Their big-data AI services need to be far better, smarter, and more reliable than they are.[/expand]

  • 인간의 확신과 통계적 사고

    인간의 확신과 통계적 사고, 뇌의 작용은 베이지안 통계의 계산과 유사

    sovidence님 블로그에서 본 연구다.

    우리가 상황을 판단해서 무엇인가에 대해서 확실하다고 주관적으로 느끼는 것이 인간만의 종합적이고 차원이 다른 인지적 사고의 결과가 아니라, 주어진 정보를 처리해서 높은 확률을 가진다고 계산하는 통계적 처리 과정과 같은 것임을 보여줌

    사람의 확신은 수학 혹은 통계적 확신과 다르다고 생각하는 경우들이 있었는데, 연구자들은 인간의 확신 판단이 통게적 확신의 계산에서 기인한다는 점을 밝혔다. (논문 원본)

    머신러닝을 봐도 비슷한 생각을 하게 되는데 너무 간단한 방식이지만 사람이 무언가를 학습하는 과정을 명확하게 반영하고 있다. 이 연구 결과도 비슷한 것을 말해주는 것 같다.

  • 뉴욕타임즈 요리재료 배달

    by Gerry Smith, bloomberg.com, New York Times to Start Delivering Meal Kits to Your Home

    올 여름 뉴욕타임즈는 NYT 쿠킹 웹 사이트의 조리법을 위한 요리 재료들을 판매하기 시작할 것이다. 신문사가 종이 신문의 감소를 상쇄하기 위한 새로운 수익원을 찾기 때문이다. 타임즈는 요리 배달 스타트업 Chef’d와 파트너 관계를 맺고 48시간 이내 독자들에게 요리 재료들을 보내줄 것이다. 타임즈와 Chef’d는 사업으로부터 매출을 절반으로 나눌 것이다.
    [expand title=English]
    This summer, the New York Times will begin selling ingredients for recipes from its NYT Cooking website as the newspaper publisher seeks new revenue sources to offset declines in print. The Times is partnering with meal-delivery startup Chef’d, which will send the ingredients to readers within 48 hours. The Times and Chef’d will split sales from the venture.[/expand]

    사업의 본질이 있고 그것을 바탕으로 다각화나 확장이 가능한 것인데 언론사가 가지고 있는 핵심 본질이 무엇인지 다시 생각해보게 된다.

  • 롱폼 기사가 모바일에서 더 오래 읽힌다

    Long-Form Reading Shows Signs of Life in Our Mobile News World

    퓨 리서치에서 웹 분석업체 Parse.ly와 수행한 연구 결과에 따르면 작은 모바일 화면 사이즈에서도 긴 형태의 기사가 읽힌다고 한다.

    분석결과는 작은 화면 공간과 멀티태스킹에도 불구하고 이용자들은 단문 기사보다 장문 기사에서 평균적으로 더 오랜 시간 시간을 보낸다는 것을 발견했다. 실제로 1,000 단어 혹은 그 이상의 기사의 참여 시간은 짧은 형태보다 약 두 배 정도였다 (123초 vs. 57초)
    [expand title=English]
    The analysis finds that despite the small screen space and multitasking often associated with cellphones, consumers do spend more time on average with long-form news articles than with short-form. Indeed, the total engaged time with articles 1,000 words or longer averages about twice that of the engaged time with short-form stories: 123 seconds compared with 57.[/expand]

    장문의 기사는 일반적으로 잘 공유되고 퍼져나가지 않는다는 생각들이 많기 때문에도 의외였다. 그리고 내가 기사를 보는 방식과도 다르다. 나는 기사가 조금 길다는 생각이 들면 Pocket이나 Instapaper에 담은 후 태블릿으로 몰아서 읽는다. 글을 보겠다는 생각으로 큰 화면의 스마트폰으로 바꾸었지만 결국은 한계가 있었다. 최근에 태블릿이 없어서 글을 읽는 양이 줄었다는 생각을 많이 했는데 모두 나 같은건 아닌가보다.

  • 트위터 140자 제한 해제

    By Sarah Frier, Bloomberg, Twitter to Stop Counting Photos and Links in 140-Character Limit

    트위터에 사진이나 링크를 올릴 때 사용되는 주소도 140자에 포함되었으나 이를 140자에서 제외할 것이라는 기사가 올라왔다. 아직 공식적인 입장을 밝힌 것은 아니지만 2주 이내에 변경된 서비스가 적용될 것이라고 한다.

    원래 트위터의 140자 제한은 모든 정보를 모바일 텍스트 메시지 안에 맞추어 트윗을 보내는 방법이었기 때문에 채택되었다. 스마트폰이 확산되기 이전 서비스가 시작되던 2006년에는 트윗을 보내는 흔한 방법이었다.
    [expand title=English]
    Twitter’s 140-character limit was originally adopted because it was a way to send Tweets while fitting all the information within a mobile text message — a common way for sending Tweets when the service debuted in 2006, before the proliferation of smartphones.[/expand]

    정말 별거 아닌 거라고 생각되는 일이라고 해도 어떤 서비스가 한 번 정착되면 시대가 변해도 바뀌는게 쉽지 않다. 140자라는 제한이 트위터의 정체성과 연결된다고 생각하는 사람들이 많기 때문일 수도 있지만 실질적인 제약이 전혀 없어진 상황에서도 엄격하게 링크 주소까지 140자에 포함시키는게 너무 비효율저거이라는 생각을 많이 했었다. 많은 기업들이 사라지는건 사소한 변화조차 쉽지 않기 때문이 아닌가 싶다.

  • 의지력 고갈 재현성 문제

    뉴스 페퍼민트에서 3편에 걸쳐 번역한 기사. 원문, 번역본 1 2 3

    의지력 고갈(ego depletion)은 바우마이스터가 주장한 이후 많은 연구에서 적용되어 온 이론이다. 최근 심리학계에서 재현성의 문제를 이야기하고 있는데 바우마이스터의 유명한 초콜릿 실험도 대규모로 재현성 실험이 시도되었다. 결과는 기존과 다르게 지지되기 어렵다는 것이다 (심지어는 나도 실험해 본 경험이 있다).

    물론 이번 APS의 ‘등록 재연 보고서’가 우리가 생각하던 의지력에 대한 모든 것이 틀렸다고 말하는 것은 아닙니다. 개인의 자제력은 당연히 줄어들 수 있습니다. 우리는 그저 그 자제력이 언제, 왜 감소하는지를 모르는 것일 뿐입니다. 심지어 바우마이스터의 원래 주장, 곧 사람들의 정신력은 일정한 양이 있고 이를 사용할 때마다 줄어든다는 그 주장이 실제로 참일 가능성도 있습니다. 단지 바우마이스터와 타이스가 20년 전 고안한 그 실험 방법이 적절한 방법이 아니라는 것입니다. 따라서 이 분야는 근본적으로 흔들릴 수밖에 없습니다.

    “언젠가 우리는 ‘이제부터가 제대로 된 시작’이라고 말하며 모든 것을 다시 시작해야 할겁니다.” 토론토 대학의 마이클 인츨리흐트는 단지 이번 자아의 고갈 연구만이 아니라 사회심리학 분야 전체에 이런 감정을 느꼈었다고 말합니다.

    과거의 모든 연구들이 의심받고 있습니다. 한때 다수의 연구를 평가하는 표준으로 여겨졌던 메타-분석 연구조차도 마찬가지입니다. “메타-분석은 쓰레기예요.” 인츨리흐트는 내게 경고했습니다. 곧, 200건의 엉성한 연구를 모아봤자 그 결과는 엉성할 수밖에 없다는 것입니다.

    쓰레기를 모아서 메타분석을 해도 쓰레기라는 말이 인상적이다.

  • 드롭박스의 아마존 제국 탈출

    Wired, The Epic Story of Dropbox’s Exodus From the Amazon Cloud Empire

    아마존, 구글, 마이크로소프트는 규모의 경제로 인해 낮은 클라우드 가격을 유지할 수 있다. 그러나 그들은 서비스를 원가에 판매하지는 않는다. “누구도 클라우드 비즈니스를 자선행위로 하지는 않는다”고 드롭박스 엔지니어링 부사장 Aditya Agarwal은 이야기했다. “어딘가에는 마진이 붙는다.” 만약 서비스가 충분히 크다면 클라우드와 다른 것들을 삭감해서 어마어마한 금액을 절약할 수 있다. 드롭박스는 지금이 큰 시기라고 말한다. [expand title=English] Amazon and Google and Microsoft can keep cloud prices low, thanks to economies of scale. But they aren’t selling their services at cost. “Nobody is running a cloud business as a charity,” says Dropbox vice president of engineering and ex-Facebooker Aditya Agarwal. “There is some margin somewhere.” If you’re big enough, you can save tremendous amounts of money by cutting out the cloud and all the other fat. Dropbox says it’s now that big. [/expand]

    드롭박스가 아마존 클라우드 서비스에 의존하는 것에서 벗어나서 자체적으로 서비스를 운영할 계획을 밝혔다. 애플의 팀 쿡은 “우리가 만드는 제품 배후에 있는 주요 기술을 소유하고 통제할 필요가 있다고 믿는다”라는 말을 한 적이 있다. 드롭박스도 단순한 파일 공유 서비스를 넘어 플랫폼이 되고 싶어한다. 구글 닥스와 유사하게 아마존이 온라인 텍스트 에디터와 협업도구인 드롭박스 페이퍼를 만든 이유이다.

  • 인공지능 혁명

    waitbutwhy.com에 올라온 Tim Urban의 The AI Revolution: The Road to SuperintelligenceThe AI Revolution: Our Immortality or Extinction이라는 두 편의 글을 coolspeed님이 전문 번역했다. 상당히 긴 글이여서 갈무리해놓았다가 조금 여유가 생겨 오늘에서야 읽었다. 인공지능과 관련된 논의가 낯선 사람에게는 장문의 글임에도 불구하고 좋은 길잡이가 될만한 글이다.

    왜 최근에 빌 게이츠, 엘론 머스크, 스티븐 호킹 등 많은 유명인들이 인공지능을 경계하라고 호소하는가?

    이세돌과 알파고의 바둑이 많은 주목을 받으면서 이와 관련해서 전문가들이 짦은 의견이나 논평을 내는데 우리나라 인문사회 전공자들의 이해 수준에 참담함을 느낄 뿐이다. 알파고 수준의 인공지능만으로도 우리가 사용하던 많은 개념이 다시 새롭게 정의될 필요성이 생겼다. 하지만 이런 문제에 대한 고민의 깊이는 깊지 않은 것으로 보인다.

  • 애플 법원 명령 거부

    A Message to Our Customers

    애플이 산 버나디노에서 발생했던 총격사건 범인의 아이폰을 조회할 수 있도록 하라는 법원의 명령을 거부했고, 팀 쿡이 이와 관련해서 고객들에게 편지를 썼다. 스마트폰이 삶의 중요한 일부가 된 오늘날 암호화가 왜 필요한지, 산 버나디노 케이스가 어떤 의미인지, 정부의 요청이 데이터 보안에 어떤 위협이 될 수 있으며 나쁜 선례를 남길 수 있다는 언급을 한다.

    지금 이 순간 공개된 토론이 필요하고, 우리는 고객들과 국민들이 무엇이 위태로운지 이해하기를 바란다.
    [expand title=English]
    This moment calls for public discussion, and we want our customers and people around the country to understand what is at stake.[/expand]

    당연한 일이지만 어떤 문제에 대해서 공개된 토론이 필요하다고 이야기하는게 왜 멋있어보이는지 모르겠다.