Blog

  • 맞춤법 스타트업 Grammarly

    VCs Put $110 Million Into Grammar-Checking Software by Nico Grant, www.bloomberg.com

    맞춤법 검사 소프트웨어 스타트업인 Grammarly가 벤처캐피털로부터 110M 달러 (약 1200억 원 대) 투자를 받았다. WSJ에 따르면 Grammarly는 기계 학습 및 인공 지능을 사용하여 기본 철자법, 문법, 스타일에서부터 말투 및 상황별 언어에 대한 고급 제안에 이르기까지 사람들의 글쓰기를 향상시키 위한 도움을 준다고 언급하고 있다. 맞춤법과 관련된 소프트웨어도 시장이 크고 수요가 높은 분야 중 하나이지만 이번 투자에 대해서는 과장되었다는 이야기도 있는 것 같다. 기즈모도 기사의 경우 전형적인 테크버블이라고 이야기하고 있다.

    당연히 기계 학습을 사용하니 데이터로부터 학습한 내용을 기반으로 제안을 하게 될텐데 적합하지 않은 경우도 있다는 사례를 이야기한다.

    Grammarly는 방대한 양의 글쓰기로부터 학습하고 사용법에 따라 조정한다. 간단한 사례는 사람들이 이메일에 ‘Hi John” 이라고 적을 때, Grammarly는 사람들에게 쉼표를 붙이라고 제안한다는 것이다. [expand title=Eng]Grammarly learns from the vast amount of writing it ingests, and it adjusts based on usage. In a simple example, when people write “Hi John” in an email, Grammarly was suggesting people add a comma.[/expand]

    “Hi John,” 이 맞는 것이라는 것도 처음 알았지만 아무도 저렇게 사용하지 않는다는 이야기를 한다.

    개인적으로 많이 아는 분야가 아니라 맞춤법과 관련된 어떤 문제를 해결하기 위해 머신 러닝이 사용되어야 하는지 모르겠다. 맞춤법이란 것 자체가 규칙에 기반하여 정해지는 것이기 때문에 지속적으로 규칙을 업데이트하면 될 것이라고 생각하는데 다른 적용되어야만 하는 부분이 있는건지. 기사에서는 머신 러닝이나 인공지능 같은 말에 혹해서 과한 투자를 하는 것이라는 이야기를 하는데 그럴 수 있다고 본다. 최근 너무 많은 사람들이 머신 러닝에 대해 이야기하고 있지만 결국은 어떤 문제를 해결하기 위해 도입하는 방법이고 어느 문제는 매우 잘 해결하기도 하지만 시간과 비용의 문제가 크다는 단점도 있다. 최근 국내 투자 사례 이후 이야기되는 것처럼 아직까지 사람이 더 싸지 않은가.

  • 뉴스 스토리 GIF 이미지 사용

    HuffPost’s reorganized product team drove a 27 percent lift in video views By Ross Benes, digiday.com

    News Innovation 그룹이라고 이름지어졌다. 스냅챗이나 인스타그램 스토리와 유사한 기능의 허핑턴포스트 “스토리북”과 같은 새로운 스토리 포맷을 시험하기 때문이다. Acquisitions 그룹은 뉴스레터를 통해 독자와 직접 연결을 만드는데 초점을 맞춘다. Revenue 그룹은 각각의 웹 페이지로부터 허핑턴포스트가 수익을 올리는데 영향을 미치는 측정치를 모니터링 한다. 비디오 그룹도 있다. 마지막으로 일반 그룹은 A/B 테스팅 콘텐츠에 대한 비즈니스 개발을 담당한다.[expand title=Eng] One group is named News Innovation because it experiments with new story formats like HuffPost’s “storybook” feature that is similar to Snapchat and Instagram Stories. The Acquisitions group focuses on making direct connections to users through newsletters. A Revenue group monitors metrics like viewability that affect how much money HuffPost is getting from each webpage. There is also a video group. Last but not least, a generalist group works with business development on A/B testing content.[/expand]

    예를 들어, 12월에 허핑턴포스트는 비디오를 미리보기 위해 사용했던 정적 이미지를 gif로 대체하여 사람들이 비디오를 더 많이 클릭하도록 만들었다. 애니메이션 gif로 인해 동영상 조회수가 27 % 증가했다. 데스크톱에서 비디오 시청은 지난 12월의 440만 사용자에서 3월의 620 만 사용자로 증가했다.[expand title=Eng] For example, in December HuffPost replaced the static images it used to use to preview videos with gifs, which led people to click on videos more. The animated gifs led to a 27 percent increase in video views. Unique video viewers on desktop increased from 4.4 million users in December to 6.2 million users in March, the latest month comScore had data for[/expand]

  • 저널리즘의 SaaS 시대

    Why the SaaS era of digital journalism may be our most exciting yet. Medium · by David Skok

    디지털 저널리즘의 시기를 크리스텐슨의 파괴적 혁신을 기반으로 구분하고 분석하는 글. 최근 구독모델이나 직접 지불쪽으로 비즈니스 모델을 구축해가려는 흐름을 SaaS(Stories as a Service) 시대라는 것으로 정의한다.

    첫 번째 시기는 포털을 중심으로 이루어진 뉴스 유통, 두 번째 시기는 검색을 중심으로 이루어진 시기, 세 번째 시기는 소셜미디어를 통한 뉴스 유통을 이야기한다. 그리고 (시기에 대해서는 명확한 이유는 없지만) 2015년부터 현재까지를 SaaS시기라고 부른다.

    소비자들은 믿음과 신뢰를 무너뜨린 페이크 뉴스를 포함하여 뉴스와 정보 과잉 시대에 살고 있다. 뉴스 퍼블리셔들은 품질과 커뮤니티를 향해 나아가고 있다. [expand title=Eng]These consumers are now living through a surplus of news and information, including fake news, that has eroded trust and credibility. They are on a flight towards quality and community. [/expand]

    SaaS라는 용어 자체는 소프트웨어를 구축하고 개선하기 위해 구독모델에 기반하는 조직들을 지칭하는 Software as a Service라는 용어에서 유래했다. 이러한 용어 자체가 디지털 저널리즘이 진입하고 있는 시기를 정의하기 적절하다고 말한다. 일반적인 관점과는 다른 이야기를 하는데 플랫폼을 소유하는 것 보다 스스로의 스토리를 가지는 것이 중요하다는 말을 한다. 스토리와 독자를 가지는 것이 뉴스 수집과 유통을 담당하는 플랫폼보다 중요하다 말한다. 알 수는 없지만 용어 자체는 재미있다.

  • 타임즈 에디션

    The Times of London says focus on editions has driven digital growth
    Nieman Lab by Joseph Lichterman

    나온지는 몇 주 지난 기사이지만 최근 뉴스 퍼블리싱 시간과 관련된 내용을 보다보니 생각이 났다.
    인터넷으로 뉴스를 퍼블리싱하는게 일반적으로 된 이후 기사는 24시간 계속 나온다고 생각하지만 실제로 그렇지도 않다. 그리고 실시간으로 계속 내용을 보내주는 것이 반드시 좋지만은 않다는 내용이다. 디지털 담당 Nick Petrie는 우리는 라이브 블로깅을 하고 있는 것이 아니라고 말하며 에디션이라고 부르는 방식을 통해 기사를 퍼블리싱을 통제한다.

    Murdoch이 소유한 신문은 일반적으로 웹 사이트와 앱을 하루에 4번 업데이트 한다. 밤 사이, 오전 9시, 정오, 오후 5시이다. 2017년 런던 테러는 신문이 발행 일정을 위반 한 10개 중 하나였다.[expand title=Eng]
    The Murdoch-owned paper typically updates its website and apps four times per day — overnight, at 9 a.m., at noon, and again at 5 p.m. The London attack was one of only 10 or so times that the paper has broken its editions schedule.[/expand]

    에디션에 대한 이야기도 결국은 독자들에게 나은 경험을 제공하고 완성된 제품을 제공함으로서 직접 구독을 늘리려는 시도의 연장선으로 보인다. 인터네셔널 서비스의 실패가 있었으나 이와 관련해서 다음과 같이 언급한다.

    "우리는 스스로 매우 훌륭한 뉴스 제품을 가지고 있다고 생각하지만 직접지불, 시험사용, 데이터 수집 과정은 우리가 성공하는데 필요한 것은 아니었다. 다시 한번 살펴보면,편집권부터 전체 제품과 구독 사이클까지 모든 프로세스가 최적화 되어야 하고 그렇지 않으면 실패할 것이다.[expand title=Eng]
    “We think we had a very good editorial product, but the actual mechanics of payment, trial, and data collection were not what we needed to succeed,” Hunter said about the international app. “As we look at it again, we’ll be very clear that every single bit of the process — from editorial right through the whole product and subscription cycle — needs to be optimized or the product will fail.”[/expand]

  • 구글을 해체할 때가 되었는가

    Is It Time to Break Up Google? By Jonathan Taplin, www.nytimes.com

    기사에서 구글은 검색광고 88%, 페이스북은 모바일 소셜 트래픽 74%, 아마존은 전자책 74%를 독점하고 있다고 지적한다. 플랫폼들이 독점하는 상황이기 때문에 과거 통신사들처럼 공공성 차원 규제가 필요하다는 주장이다. 하지만 기사를 보면 정당하지 않은 비난처럼 보이는 부분들이 많이 있다.

    페이스북, 구글, 아마존이 혁신을 광범위하게 저지했음을 부정하기는 어렵다. 우선 구글과 페이스북 플랫폼은 대부분의 미국인을위한 모든 미디어에 접근할 수 있는 지점이다. 구글, 페이스북, 아마존의 수익이 급증한 반면, 신문 출판이나 음악 사업과 같은 미디어 사업의 수익은 2001 년 이후 70 % 나 감소했다.[expand title=Eng] It is impossible to deny that Facebook, Google and Amazon have stymied innovation on a broad scale. To begin with, the platforms of Google and Facebook are the point of access to all media for the majority of Americans. While profits at Google, Facebook and Amazon have soared, revenues in media businesses like newspaper publishing or the music business have, since 2001, fallen by 70 percent.[/expand]

    구글이 플랫폼으로 독점적 지위를 누리고 있는 것은 맞지만 신문산업이나 음악산업은 구글이 죽인 것은 아니다. 저작권법에 safe harbor 조항 때문에 스트리밍에서 iTuens보다 비용을 덜 지불하는 것도 아니다. safe harbor 때문에 네트워크가 포르노그라피로 가득차게 되는 것도 아니다. 디지털 시대에 지배적인 사업자들이 한 순간에 영향력을 잃을 수도 있다는 점도 고려할 필요가 있다. 무너뜨리는게 답이 되고 더 좋은 환경이 만들어지는가.

  • 짧은 R 메뉴얼

    A (very) short introduction to R

    12장 짜리 간단한 R 메뉴얼을 봐서 올려놓는다. 이런게 있어도 오랜만에 다시 쓰려면 언제나 다시 찾아봐야 하는거는 피할 수 없지만 짧다는 사실이 좋다.

  • 스냅챗과 인스타그램 스토리, 플랫폼 포위

    Instagram’s Snapchat clone is now more popular than Snapchat
    By Mike Murphy, qz.com

    이용자들이 24시간 후 사라지는 이미지와 짧은 영상을 올릴 수 있게 하는 페이스북의 이미지 공유 소셜네트워크 인스타그램 스토리가 8개월만에 2억 일일 이용자를 돌파했다. 일상의 스토리 기능의 선두주자인 스냅챗이 만들어진 이후 5년 동안 모은 이용자 수 1억 6100만 명 보다 많았다.[expand title=Eng]
    In about eight months, Instagram Stories, the function of Facebook’s image-sharing social network that allows users to post images and short videos that disappear after 24 hours, has amassed 200 million daily users, it announced today. That’s more than the 161 million users that Snapchat, which pioneered the daily story feature, has attracted in the five years the company has existed.[/expand]

    무조건 이용자 기반을 확보하는게 유리하게 된 플랫폼 경쟁 상황에서 인스타그램 스토리가 유사한 기능을 도입하며 스냅챗 이용자를 넘어섰다는 사실은 스냅챗에게 좋지 않아 보인다. 플랫폼은 종종 중복되는 이용자 기반과 유사한 구성요소들을 가질 수 있다. 플랫폼이 기존 시장에서 가지고 있던 기능 이외에 추가적으로 인접한 시장에 존재하는 플랫폼이 제공하는 기능을 제공하는 경우 platform envelopment가 나타나게 된다. 승자독식을 보이는 플랫폼 시장에서 후발주자가 실질적인 시장 점유율을 차지하기 위해서는 혁신적인 기능을 제공해야만 한다. 하지만 후발 주자들은 platform envelopment를 통해서 다른 플랫폼 시장에 진입하는 것을 가능하게 한다. 마이크로소프트의 리얼네트워크, 넷스케이프, 플래시부터 애플의 PDA, 포터블게임기, ebook 등 다양한 사례들이 있다. 페이스북도 스토리라는 유사한 서비스를 도입하였고 다른 유사 기능들도 보호받기 어려운 것이기에 합법적으로 가져다 올 수 있다. 이런 경우 장기적으로 이용자 기반이 큰 쪽이 유리할 수밖에 없지 않을까.

  • 사회과학과 고품질 데이터

    최근 사회과학연구에서 사용되는 고퀄 데이타

    김창환 교수 블로그에서 읽은 글. 좋은 연구를 위해서 좋은 품질의 데이터가 필요하고 정부에서 이러한 행정자료들을 공개해서 사용할 수 있게 해야된다는 내용이 요지.

    사회과학연구에서 전통적인 서베이 자료를 이용한 연구의 비중은 점점 줄어들고 있다.

    아래 그림은 요즘 사회과학계의 신성, 라지 체티가 2012년에 발표했던 최근 경제학 4대 탑 저녈 출판 트렌드. 첫 번째 그림이 기존 서베이를 이용한 논문의 비중이고, 아래가 행정자료를 이용한 논문의 비중. 2010년에 경제학 4대 저널에서 기존 서베이 이용 논문은 평균 20% 정에 불과. 반면 행정자료를 이용한 논문이 50%를 넘어섬. 나머지 30% 정도는 실험 등 자체적으로 자료를 모은 경우임.

    서베이 방식의 논문으로는 좋은 저널에 가기 힘들다는 것은 이미 거의 기정사실. 기존 생각을 뒤집어 엎는 독특한 아이디어가 있지 않으면 좋은 저널에 가기는 어렵다. 국내 연구를 하려고 해도 평가는 SSCI 저널을 위주로 이루어지고 국내 데이터 자체는 구하기도 쉽지 않은 상황.

  • 유투브 파트너 프로그램 변경

    YouTube will no longer allow creators to make money until they reach 10,000 views By Ben Popper, www.theverge.com

    유투브에서 영상 업로드로 수익을 내기 위해서는 총 조회수가 10,000건 이상 되어야 하는 것으로 규정이 변경되었다는 기사. 다른 문제가 있다기보다는 불법 업로드를 하는 사람들을 걸러내기 위한 것이라 한다.

    사람들은 유명한 레코드사, 영화 스튜디어, 인기있는 유투버 소유의 콘텐츠를 업로드 하기 위해 계정을 만들었다. 이러한 이용자들을 배제하기 위한 노력의 일환으로 유투브는 오늘 파트너 프로그램 변경을 공지했다. 현재부터 크리에이터들은 채널 조회수가 1만건이 되기 전까지는 수익화를 할 수 없다. 유투브는 이러한 기준점이 채널이 합법적인지 아닌지에 대한 정보를 줄 수 있을 것으로 생각한다.[expand title=Eng] People were creating accounts that uploaded content owned by other people, sometimes big record labels or movie studios, sometimes other popular YouTube creators. In an effort to combat these bad actors, YouTube has announced a change to its partner program today. From now on, creators won’t be able to turn on monetization until they hit 10,000 lifetime views on their channel. YouTube believes that this threshold will give them a chance to gather enough information on a channel to know if it’s legit.[/expand]

    개인적으로 유투브 채널을 만들었었는데 생각나서 들어가보니 총 조회수가 100이 넘지 않는다.

  • 프로그램 광고와 효율

    The Online Ad Industry Is Undergoing Self-Reflection. That’s Good News By Farhad Manjoo, www.nytimes.com

    프로그램 광고에 대한 비판이 있으나 프로그램 광고는 많은 것을 바꾸어 놓은 효율적인 방식이라는 기사

    GroupM 최고 경영자 브라이언 리서(Brian Lesser)는 “우리가 수용자에게 도달하고 있는지는 확신할 수 없었기 때문에, 수용자를 정의하기 위해 특정 프로그램 콘텐츠를 사용했습니다.” 즉, 남성을 타겟팅하는 대신 남성 시청자가 좋아한다고 생각하는 프로그램에 광고를 게재했습니다. 이는 동일한 프로그램을 보는 다른 여성과 면도기를 사용하지 않는 사람들을 제외한다면 충분히 좋은 해결책이었습니다. 디지털 광고는 근본적으로 이 모델을 변경했습니다. 프로파일링을 통해 이제 광고 회사는 특정 사이트를 읽거나 특정 비디오를 보고 있는 사람을 정확히 알고 있거나 적어도 알 수 있습니다. 따라서 특정 콘텐츠에 연결된 광고를 구매하는 대신 회사는 잠재 고객에게 정확히 타겟팅 된 광고를 구매할 수 있습니다.[expand title=Eng] “It wasn’t possible for us to be certain that we were reaching that audience, so we used the content of certain programming to define that audience,” said Brian Lesser, the chief executive of GroupM, a division of the advertising giant WPP. In other words, instead of targeting men, they’d run ads on shows they thought men liked to watch — a good enough solution, except for all the women and non-shavers who were also watching. Digital advertising fundamentally altered this model. Through profiling, now ad companies know — or, at least, aim to know — exactly who is reading a certain site or watching a certain video. So instead of buying ads tied to a certain piece of content, companies can buy ads targeted exactly to an audience.[/expand]