Blog

  • 왜 딥러닝이 갑자기 당신의 삶을 바꾸고 있는가

    WHY DEEP LEARNING IS SUDDENLY CHANGING YOUR LIFE
    By Roger Parloff, fortune.com

    딥 러닝에 대해 정리한 fortune 기사. 초기 뉴럴 네트워크부터 현재에 이르기까지 과정을 정리하며 왜 딥 러닝이 갑자기 주목을 받게 되었는지에 대해 설명한다. 꽤나 길지만 전반적인 흐름을 이해하기 좋은 기사.

    5년 전에 딥 러닝이 무엇인지 모르던 벤처 캐피털리스트도 오늘날 딥 러닝을 하지 않는 스타트업에 대해 경계한다.”우리는 정교한 소프트웨어 애플리케이션을 제작하는 것이 필수가 된 시대에 살고 있다.” 사람들은 곧 “어떤 자연어 처리 버전인가?”,”앱과 대화하기 위해서는 어떻게 해야 하느냐. 나는 메뉴를 클릭하고 싶지 않다”와 같은 요구를 할 것이다.
    [expand title=Eng]
    Venture capitalists, who didn’t even know what deep learning was five years ago, today are wary of startups that don’t have it. “We’re now living in an age,” Chen observes, “where it’s going to be mandatory for people building sophisticated software applications.” People will soon demand, he says, “ ‘Where’s your natural-language processing version?’ ‘How do I talk to your app? Because I don’t want to have to click through menus.’ ”[/expand]

  • 젊은 사람들은 뉴스 시청보다 읽는 것을 선호

    Pew: Younger adults more likely than their elders to prefer reading news

    퓨 리서치에서 나온 연구결과. 비디오에 투자해야 한다는 이야기들을 많이 하는데 젊은 사람들은 오히려 읽는 것을 좋아한다고.

    ft_16_09_30_newsbyage

    개인적으로는 이해가 되는 것이 비디오는 보기 위해서 너무 오랜 시간을 기다려야 한다는 느낌이 있다. 바쁜데 빠르게 원하는 내용을 찾아보기에는 텍스트가 훨씬 편하다. 그래서 뉴스를 보는 것은 모든 세대에서 온라인보다 TV를 더 선호한다.

  • 페이스북 방문자 추적기

    ‘페이스북 방문자 추적기’, 왜 ‘토큰’을 달라고 하시나요?

    블로터의 기사인데 여러가지로 재미있어서 올려놓는다. 예전 싸이월드 시절에도 비공식 방문자 추적기 같은 걸 사용하는 사람들이 있었고 내가 아는 가까운 사람도 그걸 사용했었다. 구남친의 여자친구가 계속 자기 미니홈피에 들어오는걸 확인하고 항의했다가 여자친구의 신고로 싸이월드 정지를 받았던 기억이 난다.

    페이스북에서도 누가 내 페이지를 방문하는지 궁금해 하는 사람들의 욕망은 여전한가 하는 생각이 든다. 방문자 추적을 위해 토큰을 달라고 하는데 이는 페이스북에서 계정 권한을 넘겨주는 키 같은 것이다. 받아가는 업체가 거의 대부분의 권한을 받아가는 것으로 보인다.

    실제 자신의 타임라인을 방문한 사람 데이터를 페이스북으로부터 받아서 제공하는 것은 당연히 아닙니다. 업체 측은 “방문자 추적기는 5가지 가설을 세워서 기능을 넣었다”라며 “100% 완벽하게 추적을 완료하는 게 아니라, 5가지 방법을 교차해서 방문자를 예측하는 서비스”라고 설명했습니다.

    페이스북도 아닌데 방문자를 정확히 파악할 수 없고 알고리즘으로 예측하는 수준인데 어떻게 알 수 있겠는가.

  • 인공지능이 만든 팝 음악

    AI makes pop music in the style of any composer (the Beatles too!)

    [iframe id=”https://www.youtube.com/embed/LSHZ_b05W7o”]

    1) LSDB라는 데이터 베이스를 만든다. 다양한 스타일과 작곡가들의 리드시트 약 13,000를 포함하고 있다.
    2) 인간 작곡가는 FlowComposer라는 시스템을 가지고 스타일과 생성될 리드시트(멜로디+하모니)를 선택한다. Daddy’s Car 경우에는 비틀즈 스타일을 선택했고, Mr. Shadow는 “아메리칸 작곡가” 스타일을 선택했다.
    3) Rechord 라는 다른 시스템을 가지고 인간 작곡가는 생성된 리드 시트에 다른 노래의 오디오 녹음에서 일부 오디오 덩어리들을 붙어녛는다.
    4) 인간 음악가는 프로덕션과 믹싱을 마무리한다.
    [expand title=Eng]
    1) We set up a database called LSDB. It contains about 13000 leadsheet from a lot of different styles and composers (mainly jazz and pop about also a lot of Brazilian, Broadway and other music styles).

    2) The human composer (in this case Benoît Carré, but we are experimenting with other musicians as well) selected a style and generated a leadsheet (melody + harmony) with a system called FlowComposer. For Daddy’s Car, Carré selected as style “the Beatles” and for Mr. Shadow he selected a style that we call “American songwriters” (which contains songs by composers like Cole Porter, Gershwin, Duke Ellington, etc).

    3) With yet another system called Rechord the human musician matched some audio chunks from audio recordings of other songs to the generated leadsheets.

    4) Then the human musician finished the production and mixing.[/expand]

    창작이라는게 결국 기존 것들의 조합인데 최근 느끼는 건 결국 기존 만들어진 로데이터가 가장 중요한 것 아닌가 하는 생각이 든다.

  • 구글의 뉴럴 머신 번역 시스템

    Google Translate now converts Chinese into English with neural machine translation
    By Jordan Novet, venturebeat.com

    구글이 중국어 번역에 뉴럴 네트워크 기반 머신러닝을 적용한다는 이야기이다. 번역의 품질이 구절 기반으로 번역할때보다 향상되었다고 한다.기존에 구글은 구글 번역에 뉴럴 네트워크를 사용한다고 말해왔지만, 실시간 이미지 번역을 위한 것이었다.

    뉴럴 네트워크 기반이 항상 좋은 결과를 내는 것은 아니지만 phrase-based 번역에 비해 60%정도 오류가 줄어들었다는 이야기를 한다.

    이번 번역 관련 연구는 여기에서 읽어볼 수 있다.

  • 디즈니 트위터 인수에 참여하기로

    Disney Is Working With an Adviser on Potential Twitter Bid

    디즈니도 트위터 인수를 고려하고 있다. 디즈니하면 미키마우스와 디즈니랜드를 떠올리지만 ESPN과 ABC를 소유하고 있는 미디어 복합기업으로, 얼마전에는 스트리밍 미디어 기업 BAM Tech 지분을 33.3% 인수하기도 했다.

    디즈니의 가장 많은 비중을 차지하는 비즈니스인 케이블TV가 시청자들을 잃어가고 온라인 비디오 서비스들과 경쟁에 직면함에 따라, Iger (CEO)는 비디오 스트리밍 서비스 훌루(Hulu), 디지털 미디어 기업 바이스(Vice), MLB의 BAMTech와 같은 기술 관련 미디어 테크놀로지 기업에 투자해왔다. 트위터는 또한 BAMTech와 라이브 스트리밍에 대한 파트너십을 맺었다.
    [expand title=Eng]
    With Disney’s largest business — cable TV — losing viewers and facing more competition from online video services, Iger has invested in technology-related media businesses, including the Hulu video streaming service, digital media company Vice and Major League Baseball’s BAMTech, which provides the platform for online video services such as HBO Now. Twitter has also partnered with with BAMTech for its live streaming.[/expand]

    트위터 내부적으로는 디즈니가 가장 적격이라는 이야기도 나온다고 한다.

  • 넷플릭스 오리지널 비중 50%까지 늘린다

    Netflix planning to fill half its catalog with originals in the next few years By Rich McCormick, www.theverge.com

    의미하는 것은 넷플릭스가 오리지널 콘텐트를 제작하거나 구매함으로써 50/50에 도달할 것이라는 점이지만, 쇼와 영화를 더 조금 라이센스함으로써 비율을 맞출 수도 있다. 넷플릭스 CEO Ted Sarandos는 연초 2016년 600시간의 오리지널 콘텐트를 공개할 것이라고 말했지만, 다른 네트워크와 스튜디오에서 콘텐트를 얻는 것의 비율을 줄이지 않는한 50%의 카탈로그를 채우는 것은 충분하지 않다. 라이센스 쇼와 다르게 넷플릭스 오리지널들은 경쟁자와 차별화하고 사람들이 가입하도록 만들기 위해 독점으로 유지될 것이다. [expand title=Eng] The implication is that Netflix would reach its 50/50 split by producing and buying up more originals, but the company may also even the odds by licensing fewer shows and movies. Ted Sarandos, Netflix’s CEO, said at the start of the year that Netflix would release 600 hours of originals in 2016 — up from the 450 hours it put out last year, but not yet enough to fill up 50 percent of its catalog unless it scaled back on content picked up from other networks and studios. Unlike licensed shows, Netflix’s originals can be kept exclusive to the service, differentiating it from its competitors and driving people to sign up for subscriptions. Already, Wells says between a third and half of lapsed subscribers to the service return eventually.[/expand]

    독점작이 플랫폼에게 중요하지만 전체 콘텐트에서 비중을 50%까지 가져간다는게 어떤 의미일까.

  • 페이스북 동영상 시청 측정

    Facebook Overestimated Key Video Metric for Two Years By SUZANNE VRANICA and JACK MARSHALL, www.wsj.com

    몇 주 전, 페이스북은 “광고주 고객 센터”에 올린 글에서 이용자들이 비디오 시청에 소비하는 평균 시간에 대한 매트릭스가 인위적으로 부풀려졌는데, 3초 이상 본 비디오를 감안했기 때문이라고 밝혔다. 페이스북은 문제를 해결하기 위한 새로운 매트릭을 소개할 것이라고 말했다. [expand title=Eng] Several weeks ago, Facebook disclosed in a post on its “Advertiser Help Center” that its metric for the average time users spent watching videos was artificially inflated because it was only factoring in video views of more than three seconds. The company said it was introducing a new metric to fix the problem.[/expand]

    평균이라고 써진 값을 잘못 계산한건 문제겠지만 페이스북에 올라온 글처럼 다른 메트릭들 계산에 시청인원이 포함되지 않는다면 큰 문제였을까 하는 생각은 든다.

  • EdTech 분야에서 LMS 시장 변화

    The LMS market glacier is melting

    EdTech 분야에서 스타트업들에 대한 투자는 지속적으로 높은 수준을 보여왔다. 그리고 그 중에서 많은 관심을 받는 분야는 LMS쪽이다. 신규 진입자들도 많이 등장하고 있지만 원래부터 자리잡고 있는 지배적인 사업자들이 대부분의 시장점유율을 차지하는 과점 형태를 보이고 있다. 블랙보드 같은 업체들이 대표적이다. 하지만 LMS분야에서 이런 독과점 형태가 무너지고 있다는 기사다. LMS 도입에서 조직보다 개인이 선택할 수 있는 경향이 생겼기 때문이다. 캔버스 같은 서비스는 신규 진입 이용자의 80%정도를 가져간다고 한다.

    아마도 중요한 사실은 대부분의 학교가 더 이상 가상 클래스를 운영하기 위한 하나의 시스템을 찾지 않는다는 점이다. 우리는 LMS가 구성요소에 하나일 뿐인 새로운 아키텍처를 디자인하고 있는 기관들을 볼 수 있다. 이러한 움직임은 능력기반교육이나 개인화 된 학습과 같은 폭넓은 교육학적 접근을 가능하게 한다.
    [expand title=Eng]
    Perhaps most significantly, most schools are no longer looking for just one system to manage the virtual classroom. We are now seeing entire institutions, such as Southern New Hampshire University and University of Maryland University College, designing new architectures where the LMS is but one core component. This move is enabling broader adoption of pedagogical approaches, such as competency-based education and personalized learning.[/expand]

  • 정지사진으로 다음 동작 예측

    Machine learning’s next trick is generating videos from photos

    MIT 연구자들이 뉴럴네트워크를 통한 알고리즘으로 정지 사진 다음 동작이 어떻게 될지 예측하는 모델을 만들었다는 기사. 플리커에서 받은 이미지들을 통해 학습시킨 것 같다. 아직까지 그림 크기가 작고 몇 초 되지 않으며 약 빤거 같은 이미지들이 나오는 경우도 있지만 시도 자체가 재미있다. 기사 내에 샘플 이미지들이 올라와 있다.