Blog

  • 버즈피드가 세상에서 가장 영향력 있는 뉴스조직인 이유

    기가옴(Gigaom)이 문을 닫기로 결정했다. 테크 관련 기사들을 다루는 곳은 많이 있지만 개인적으로는 기가옴의 기사가 조금 더 깊이 있는 면들이 있어서 좋아했다. 하지만 콘텐츠의 품질만으로는 살아남을 수 없는 시대가 되었다. Ben Thompson의 블로그에 올라온 WHY BUZZFEED IS THE MOST IMPORTANT NEWS ORGANIZATION IN THE WORLD라는 글을 다시 읽었다.

    예전에는 윤전기를 가지고 있지 않으면 아무나 신문을 만들 수 없었고, 이런 것들이 경쟁자가 시장에 들어오는것을 막는 요인이 되었다. 그리고 신문을 가지고 있으면 자연스럽게 대규모의 광고가 가능해서 자연스럽게 수익을 얻을 수 있었다. 이런 시대의 규범들이 현재의 온라인 시대에는 적용되지 않는 것으로 변했다. 신문 1면에 대한 관행의 변화, 그리고 버즈피드에서 최근 드레스 색깔 논쟁 포스팅으로 얼마나 많은 사람들의 주목을 끌었는지에 대한 사례가 나온다. 버즈피드가 어떤 식으로 성장했고, 이를 통해 어떻게 수익을 올리고 있는지 이야기한다. 버즈피드는 콘텐츠를 통해 직접적으로 돈을 벌지 않기 때문에 바이럴에 있어서 가장 뛰어나다. 이러한 비즈니스 모델을 통해 저널리즘의 독립성도 회복하고 있다. 마치 옛날의 저널리스트들이 돈을 버는 것을 걱정하지 않고 자신들이 중요하다고 생각하는 것을 썼던 것처럼 말이다.

    세상은 위대한 저널리즘을 필요로 하지만, 위대한 저널리즘은 위대한 비즈니스 모델을 필요로 한다. 그것이 바로 버즈피드가 가지고 있는 것처럼 보이는 것이고, 그런 이유로 버즈피드는 세상에서 가장 영향력 있는 뉴스 조직이다.

    The world needs great journalism, but great journalism needs a great business model. That’s exactly what BuzzFeed seems to have, and it’s for that reason the company is the most important news organization in the world.

    그런 의미에서 비즈니스 모델이 버즈피드를 영향력 있는 뉴스 조직으로 만들고 있다.

  • 왜 p-value 사용을 금지하는가?

    Basic and Applied Social Psychology에서 p-value 사용을 금지한 것과 관련해 r-bloggers에 p-value 사용을 금지하는지에 대한 글이 실렸다. 이 글에서는 샘플링의 문제로 영가설을 거부하는 결과가 나올 수 있다는 사실을 간단한 시뮬레이션을 통해 보여주고 있다. 그런데 댓글에서도 볼 수 있듯이 효과크기에 대한 이야기들이 많이 빠져 있다. 그래서 효과 크기와 관련된 논문을 찾다가 Using Effect Size—or Why the P Value Is Not Enough라는 논문을 찾아서 읽어봤다.

    효과 크기는 양적 연구의 주요한 결과물이다. p-value는 독자들에게 효과가 존재하는지 아닌지를 알려주는 반면, 효과의 크기를 나타내지는 못한다. 연구결과를 보고하고 해석하는데 있어서, 실질적인 중요성 (효과크기)와 통계적인 중요성 (p-value) 모두 보고되어야 하는 필수적인 결과다.
    The effect size is the main finding of a quantitative study. While a P value can inform the reader whether an effect exists, the P value will not reveal the size of the effect. In reporting and interpreting studies, both the substantive significance (effect size) and statistical significance (P value) are essential results to be reported.

    p-value만으로는 충분하지 않은지에 대해 심근경색과 아스피린에 관한 사례를 이야기하고 있다. 22,000명 이상의 피실험자를 대상으로 한 실험 결과에서 아스피린이 심근경색을 줄일 수 있다는 결과는 매우 높은 유의성 (p < .00001)으로 검증이 되었다. 너무 확실한 결과로 인해 연구는 조기 종료되었는데 효과 크기는 매우 작았다 (나도 도움이 된다고 알고 있었는데, 이 논문을 보고 알게 되었다) .

    이 외에도 유방암 조기 검사와 관련된 사례도 있다. 여성들이 조기에 유방암 검사를 하게 됨으로써 얻게 되는 이익은 무엇이고 안게 되는 위험은 무엇인가? 실질적으로 얼마나 유방암을 예방할 수 있을지에 대해서는 큰 효과가 없다는 사례도 보았다.

    p-value보다 효과 크기에 더 집중해야 하는지는 샘플 사이즈가 증가하면서 생긴 변화라는 생각이 든다. 2013년도 Information Systems Research에 나온 Too Big to Fail: Large Samples and the p-Value Problem라는 논문에서도 이런 사례에 대해서 이야기하고 있다. 예전보다 많은 수의 샘플을 가지고 하는 연구들이 용이해졌고 그렇기 때문에 더욱 효과 크기에 집중해야 하는게 아닌가 싶다.

    하지만 연구를 하다보면 항상 새로운 연구 결과를 요구하고 참신하고 기존과는 다른 것만을 요구하기 때문에 이런 식으로 된 건 아닐까 싶다. 꼭 저널에 실리지 않더라도 연구가 복제되고 심지어 유의하지 않거나 논쟁이 될 수 있는 결과까지 출판[1]할 수 있다면 연구한다는게 훨씬 더 나은 의미를 가질 수 있지 않을까 생각한다.


    1. 엘스비어 출판사에서 New Negatives in Plant Science라는 저널을 만들었다. 이와 관련해서 왜 과학은 부정적인 결과를 출판할 필요가 있는지에 대한 간단한 사설을 실었다.  ↩

  • Launch Center Pro

    예전에 할인 때 구매한 Launch Center Pro라는 앱이 있다. 자주 쓰는 액션들을 단축키처럼 지정해 놓으면 나중에 간단하게 실행시킬 수 있는 앱이다. 일종의 자동화 앱인데 IFTTT가 다양한 서비스들 간 자동화를 지원해준다면 Launch Center Pro는 앱 간 자동화를 지원해준다고 보면 된다. 이는 URL schemes에 기반하고 있다. iOS는 샌드박싱으로 알려진 보안정책을 사용한다. 가끔 윈도우에서도 위험한 프로그램이라고 판단되는 경우 백신이 “프로그램을 샌드박스에서 실행할까요?” 라고 물어보는 것을 떠올리면 알 수 있다. 이는 보안에는 유리하지만 앱 사이에 정상적인 데이터 교환에는 불리한 부분이다. URL schemes는 앱이 다른 앱과 커뮤니케이션 하는 방식이다. 모든 앱들은 각각의 고유한 schemes를 가지고 있고 이를 통해 앱을 실행하거나 그 안에서 액션들을 수행할 수 있다.

    이를 이해하기 위해 약간의 수고가 필요하고, 그래서 구입한 이후에도 한동안 사용하지 않다가 마음먹고 정리해봤다. 각 액션들은 링크를 클릭하면 설치할 수 있다. 내가 세팅한 액션들은 다음과 같다.

    launch-center-pro

    위키피디아 검색: 입력한 내용을 위키피디아에서 검색한다.
    이미지 검색: 클립보드에 있는 이미지 주소로 구글에서 이미지 검색을 실행한다.
    엔하위키 미러 검색: 입력한 내용을 엔하위키 미러에서 검색한다.
    클립보드 링크 열기: 클립보드에 복사되어 있는 웹 주소를 사파리로 연다.
    검색: 클리앙에서 가져 온 액션이다. 입력한 내용을 선택한 곳에서 검색한다.
    클립보드 구글 검색: 클립보드의 내용을 구글에서 검색한다.
    네이버 음악 검색: 네이버 음악 검색(노래 찾아주는 검색)을 실행한다.
    다음 지도 검색: 입력한 내용을 다음지도에서 검색한다.
    Day One New Entry: 데이원에서 새로운 일기를 작성한다.
    QR code reader: QR 코드 리더. 가끔 사용하게 될 때가 있는데 QR코드 리더를 찾는 일이 여간 귀찮은게 아니라 넣어놨다.
    Fantastical New Event: 판타스티칼에서 새로운 일정 입력. 사실 위젯으로 입력이 가능해서 잘 쓰게 될지는 모르겠다.
    GIF 검색: GIPHY에서 GIF 파일 검색

    가운데는 몇 가지 워크플로우 액션들을 추가해놓았고, 전화 걸기와 자주가는 사이트들을 그룹으로 추가해놓았다. 아이콘들은 사진으로 직접 캡쳐해서 사용한 것들이 대부분이다.

    네이버 지도를 사용하려 했으나 네이버지도는 URL schemes로 실행 외에는 다른 것을 할 수 없다. 상대적으로 다음은 대부분의 앱들의 URL schemes를 공개해놓았다. 사용하다보면 바뀌는 것들이 좀 있을 것 같은데 현재로서는 만족스럽다.

  • 구글이 신뢰성을 기반으로 검색 알고리즘을 바꾸기를 원한다

    Newscientist.com에 올라온 Google wants to rank websites based on facts not links.

    구글 연구팀은 웹에서의 명성보다 페이지의 신뢰성을 측정하는 모델을 적용하고 있다. 피인용 링크 숫자를 계산하는 대신에, 시스템은 페이지 내 불확실한 정보의 숫자를 센다. “오류가 적은 자료가 신뢰성이 있는 것으로 여겨진다”라고 연구팀은 말했다.

    A Google research team is adapting that model to measure the trustworthiness of a page, rather than its reputation across the web. Instead of counting incoming links, the system – which is not yet live – counts the number of incorrect facts within a page. “A source that has few false facts is considered to be trustworthy,” says the team

    페이지가 얼마나 인용되는지에 따라 검색결과를 보여주는 페이지 링크 방식은 예전 웹 환경에 적합할 수 있겠다는 생각이 든다. 개인적인 느낌일 뿐이지만 예전에 사용하던 웹과 현재 웹은 분위기가 많이 다르다. 어쨌든 내용에 오류가 많더라도 다른 곳에서 링크를 충분히 걸어준다면 상위로 올라갈 수도 있는 것이다. Knowledge-Based Trust score를 적용한다고 하는데 생각해보면 기술이 발전하는 속도가 엄청나게 빠르다는 생각이 든다.

  • 삼성 페이가 가지는 장점에 대한 글

    gigaom에 올라온 Samsung Pay has all the tools it needs to surpass Apple Pay라는 글이다.

    만약 삼성 페이가 올 여름에 성공적으로 출시된다면, 삼성은 여러가지 면에서 애플 페이의 라이벌이 될 수 있는 주목 할 만한 모바일 지갑 서비스를 가지게 될 것이다. 그러나 미국에서만 그러한 장점을 오랫동안 가질 수 있을 것이다. 상점들이 결제 터미널을 EMV[1]로 업그레이드함에 따라, 그들은 또한 NFC를 지원하기 위한 업그레이들을 할 것이다. 2년 이내에, NFC 거래는 예외가 아닌 일반적인 것이 될 것이다.

    If Samsung Pay launches with a bang this summer, Samsung will have a compelling mobile wallet that can rival Apple Pay in many ways, but it will only have that advantage for so long, especially in the U.S. As merchants upgrade their payment terminals for EMV, they’re also upgrading them to support NFC. Within a year or two, NFC transactions could become the norm rather than the exception.

    결제 플랫폼이 빠르게 바뀌지 않기 때문에 삼성이 두 가지 결제 방식을 모두 지원한다는 사실이 장점이 될 수 있을 것이라고 본다. 기사 내용에 나오듯이 여러 은행들과 파트너십을 통해 생태계를 이루려는 것도 큰 장점이 될 것이다. 개인적으로 애플 제품을 좋아하지만 맥북, 아이패드, 아이폰으로 연결되는 기능들이 편리해서 사용한다. 어차피 나는 쓰지 않을테지만 만약에 단 하나의 디바이스만 사용해야 한다면 갤럭시를 쓰는 것도 나쁘지 않을 수 있겠다 하는 생각이 든다.


    1. 암호화 된 데이터를 결제 터미널에 보내기 위해 스마트칩을 사용하는 방식  ↩

  • 여러가지 자동화 서비스들을 쓰면서 드는 생각들

    최근 맥에서 사용하는 Alfred가 세일하길래 충동적으로 구매했다. 간단하게 키보드 입력을 통해서 지정해놓은 워크플로우를 실행시킬 수 있는 프로그램이다. iOS의 경우에도 비슷한 프로그램들이 있다. 성격은 각각 조금씩 다르지만 Drafts, Workflow, Launch Center Pro 등이 비슷한 컨셉을 가지고 있다.

    개인적으로는 이런식으로 워크플로우를 만들고 자동화하면서 뿌듯해할수록 Geek에 가까워진다는 느낌이 드는데 온라인에도 이런 유사한 서비스가 있다. IFTTT (If This Then That)라는 서비스인데 간단하게 자동화 된 워크플로우를 만들어준다. 개인적으로는 유명하고 많은 사람들이 사용할 것이라고 생각했는데 주말에 간 세미나에서 사용해 본 적이 있냐는 질문에 나를 포함해서 딱 두 명이 손을 들었다. 나는 Feedly와 Evernote를 연동해서 사용하려다가 현재는 사용하지 않고 있다.

    IFTTT는 지난해 300억 정도 펀딩을 받았다. 다양한 서비스들 (채널)을 연결해주는 역할을 수행하지만 비즈니스모델이 없는 것을 생각해보면 놀라운 일이다. 하지만 연결되는 서비스는 점점 늘어나고 이용할 수 있는 방식은 무궁무진해지고 있다.

  • 심리학 저널에서 p-value를 금지하다

    심리학 저널 중 하나인 Basic and Applied Social Psychology에서 앞으로 영가설을 통한 유의성 검증을 퇴출시키겠다는 사설을 실었다. 그리고 이와 관련된 기사가 nature에도 실렸다 (Psychology journal bans P values). 사실 나도 제대로 알면서 사용한 것도 아니었지만 최근에 이 문제에 대해 알게되고 관심을 가져왔다.

    최근 통계의 역사와 관련된 서적들을 살펴보면서 교과서에서 배우는 기계적인 가설검정방식이 과연 어떤 의미를 가지는지에 대해서 생각해보게 되었다. 과연 가설검정을 통해 나온 결과는 어떻게 해석되어야 하는지, 실제로 어떤 효과를 가지는지에 대해서 생각해보았을 때 선뜻 답을 하기 힘든 문제이다.

    우선 영가설을 통한 가설검정방식이 어떤 문제를 가지는지에 대해서는 정리된 국내논문 한 편을 찾았다 (Review on Problem with Null Hypothesis Significance Testing in Dental Research and Its Alternatives). 가설검정방식의 문제에 대해서는 주로 의학분야에서 많이 찾아볼 수 있다. 만약 새로운 신약의 효과를 검증하려고 할 때 유의확률을 어떻게 볼 것인지 일반적인 사회과학에서의 연구와 다르다고 생각한다. 위 논문에서 시작부분에 인용하고 있는 사례이다.

    2011년 3월, 미국 대법원은 오랜 심의 끝에 임상시험의 결과가 통계적으로 유의(significant)하지 않더라도 여전히 중요(important)할 수 있다고 판결하였다. 제약회사 Matrixx Initiatives는 처방전 없이 살 수 있는 약인 Zicam이 후각상실을 일으키는 부작용이 있지만 그 발생빈도가 통계적 유의수준에 미치지 않았기 때문에 이 부작용을 알릴 이유가 없었다고 주장하였으나 대법원은 그 주장을 기각하였다. ‘Matrixx Initiatives사 대 Siracusano’로 알려진 이 사건은 통계학자들 의 논평과 함께 언론에 보도되었다.

    통계값을 표기하는 방법과 검정방식이 기계적으로 쓰이고 오용되고 있는데서 발생하는 문제들이 많다. 우선은 통계값을 표기할 때 사람들이 어떻게 이해하는가? 이에 대해 기거렌처의 책[1]에서 쓴 사례가 있다.

    이 여성들 가운데 유방암이 있을 확률은 0.8%다. 만일 어떤 여성이 유방암에 걸렸을 경우 유방촬영술 양성이 나올 확률은 90%다. 만일 어떤 여성이 유방암에 걸리지 않았더라도 유방촬영술 양성이 나올 확률은 7%다. 이제 한 여성이 유방촬영술 양성이 나왔다고 가정하자. 실제로 유방암에 걸렸을 확률은 얼마인가?

    과연 이 문장을 보고 확률적 추론을 할 수 있는 사람이 얼마나 될까. 다음의 글을 보면 조금 더 쉽게 이해할 수 있다.

    1000명 중 8명의 여성이 유방암에 걸린다. 이 8명 중 7명은 유방촬영술 양성이 나올 것이다. 유방암에 걸리지 않은 992명의 여성 중 70명에서도 유방촬영술 양성이 나올것이다. 이제 검진 결과 유방촬영술 양성이 나온 여성만 고려해보자. 이중, 실제로 얼마나 많은 여성이 유방암에 걸렸는가?

    표기방식의 변화만으로도 수치등에 대한 이해가 훨씬 쉬워진다. 이번 Basic and Applied Social Psychology 사설에서도 논문 상 p-value를 표기해도 되지만 모두 지우고 출판될 것이며, 되도록이면 많은 샘플을 이용하고 기술통계량 외에 effect size에 대한 부분이 포함되어야 함을 말하고 있다.

    개인적으로 내가 있는 분야는 시스템의 개선부분이 있다면 적용이 어렵지 않고 잘못된 이용으로 인한 부작용도 크지 않기에 통계가 가지는 의미에 대해 깊이 고려하지 않는게 아닐까 하는 생각이 든다. 하지만 내가 하고 있는 연구들이 실제로 어떤 의미를 가지는지 고민한다면 이런 문제에 관심을 가질 필요가 있을것이라고 본다.


    1. 숫자에 속아 위험한 선택을 하는 사람들  ↩

  • 마케팅은 죽었다

    HBR에 올라온 Alexander Jutkowitz의 Marketing Is Dead, and Loyalty Killed It라는 글이다.

    당신은 최고 마케팅 담당자가 되기 위해 직장의 사다리를 차근차근 밟아 올라가왔다. 스스로를 격려해라. 당신은 그럴 자격이 있다. 다 되었는가? 좋다. 이제 나의 애도를 받아들여라. 당신의 직업은 쓸모없고, 당신의 직업을 최고 로얄티 담당자로 바꾸지 않는 한 당신은 점차 대체될 것입니다.

    So, you’ve worked your way up the corporate ladder to become Chief Marketing Officer. Pat yourself on the back – you deserve it! All done? Good. Now, please accept my condolences. Your job is obsolete, and unless you turn yourself into a Chief Loyalty Officer, you’re sure to eventually be replaced by one.

    제목에서 이야기하는 것처럼 마케팅은 죽었고, 로얄티가 마케팅을 죽였다는 말이다. 애플의 성공 사례를 들면서 이야기를 하고 있는데, 마케팅은 상품을 파는데만 초점을 맞춘다. 하지만 소셜 미디어는 소비자들에게 메가폰을 쥐어주었고 전통적인 마케팅만큼이나 강력한 것이다. 모든 기업들이 애플처럼 될 수는 없을 것이다. 애플은 종교니까. 하지만 최근에 스타트업들을 비롯해서 제품 자체에 초점을 맞추는 경향이 많아지는 것 같다.

  • 트위터를 삭제하는 사람들

    트윗을 남긴 이후에 삭제를 하는 사람들이 있다. 트위터를 하다보면 흔하게 볼 수 있는 경우다. Meet the tweet-deleters: people who are making their Twitter histories self-destruct에서 이런 사람들에 대한 이야기를 다루고 있다.

    초기에 트위터는 스쳐가는 생각을 담는 그릇으로 생각되었다. 사람들은 그들의 점심, 스포츠 팀, 그날의 뉴스 등에 대한 이야기를 올렸다. 그러나 트윗이 공적이고 영구적인 것이기 때문에, 짧은 기간동안 지속되는 트윗도 전 세계적인 영구적인 기록에 포함되게 되었다. 이제 2억8800만 이용자들이 올리는 모든 트윗들이 검색가능하고 색인가능하며 법정 혹은 여론이라는 법정에서 그들에 반대되어 사용될 수 있다.

    In the beginning, Twitter was supposed to be a vessel for fleeting thoughts. People posted about their lunches, their sports teams, the news of the day. But because tweets are public and permanent by default, all of those ephemeral tweets congealed over the years into a kind of global permanent record. Now, everything the vast majority of Twitter’s 288 million monthly active users have ever tweeted is searchable, indexable, and usable against them in courts of law or public opinion.

    트위터에 글을 쓰고 흑역사라고 생각하는건 누구나 다르지 않은가보다. 대부분의 사람들이 흑역사로부터 자신을 보호하기 위해 지우지만, 트위터의 상태가 자신의 현재 상태를 반영하기를 원해서 지우는 사람들도 있다.

    조시 밀러는 7일 후에 트윗을 삭제하는 코드를 작성했다. 그는 트윗삭제를 트위터를 다른 형태의 대화처럼 만들기 위한 것으로 표현했다.

    “내 의견은 머릿속에서 영원하지 않고 (나는 종종 시간이 지나면서 마음을 바꾸기도 한다), 저녁 식사 자리에서 이야기할 때 영원하지도 않다 (누구도 우리 대화를 기록하지 않는다).” 밀러는 이메일에서 말했다. “그래서 온라인에서 그것들이 영원히 지속된다는게 말이 안 된다고 생각한다.”

    Josh Miller, a product manager at Facebook, wrote a piece of code that deleted his tweets after seven days. He frames his tweet-deleting as a decision to make Twitter more like other forms of conversation.

    “My opinions aren’t permanent in my head (I often change my mind over time), and they’re not permanent when shared around the dinner table (nobody is recording our conversations),” Miller wrote in an e-mail. “So it just doesn’t make sense to me that they would be permanent online.”

    여러가지로 문제가 많음에도 사람들은 SNS에 무엇인가를 남기기를 원한다.

  • 에어로프레스 타이머

    아마존으로 핸드밀을 하나 구입하는김에 에어로프레스도 함께 주문했다. 국내에서 5만원정도에 판매하고 있지만 아마존에서는 $25.99에 판매중이다. 에어로프레스만 산다면 별 가격 차이가 없겠지만 핸드밀을 사는 김에 함께 주문했다. 사실 예전부터 한 번 마셔보고 싶다는 생각은 했다. 일반적인 드립커피나 프렌치프레스와는 맛이 어떻게 다를지 궁금했다. 에어로프레스는 커피를 내리는 방법이 꽤나 다양하다. 커피의 미분정도, 추출시간, 추출 방향 등에 따라 여러가지 다양한 레시피가 존재한다.

    에어로프레스를 구매한 김에 에어로프레스 타이머 앱도 함께 구매했다. 앱 스토어에는 다양한 커피 관련 타이머 앱들이 있다. CoffeeTime, Aeropress Timer, Press Coffee. 그 중에서 구매한 건 에어로프레스 타이머이다. 타이머 기능을 하기도 하지만 챔피언십 레시피를 포함해서 다양한 레시피를 제공한다. $2.99에 구매하면 챔피언십 팩은 무료, 로스터스 팩은 $1.99에 추가로 구매해야 한다.

    에어로프레스 레시피는 온라인에 검색하면 찾을 수 있고 시간이야 적당히 생각하며 할 수도 있는 거지만 커피를 자주 마시게 된다면 앱 하나로 해결할 수 있다는 점이 편리할 것 같다. 그리고 디자인도 깔끔하고 나름 괜찮아보인다.