필요한 시각화를 찾도록 도와주는 사이트

from Data to Viz

입력되는 데이터 유형을 기반으로 어떤 종류의 시각화가 가능한지를 보여주는 의사결정트리 형태의 사이트. 오랜만에 데이터를 돌릴 때 확인하는 것도 좋을 것 같다.

By |7월 14th, 2018|Statistics|필요한 시각화를 찾도록 도와주는 사이트에 댓글 닫힘

미국의 마지막 블록버스터

There’s now just one Blockbuster remaining in the U.S.
TechCrunch · by Sarah Wells

영화 렌탈 체인 블록버스터가 7월 16일 공식적으로 문을 닫고 단 한 곳만 남게 될 것이라고 한다.

영화 렌탈 체인은 1985년 달라스에 첫 매장을 개설하고 2004년까지 9,000 지역으로 증가하며 호황을 누렸다. 그러나 스트리밍 서비스가 도입되고 일반 소비자의 시청 습관이 바뀌면서 회사는 지난 10년간 지역 매장을 폐쇄해왔으며 2013년에 나머지 지역이 곧 폐쇄 될 것이라고 발표했다.
eng

The movie rental chain opened its first store in Dallas in 1985 and swelled to a booming 9,000 locations by 2004. But, with the introduction of streaming services and a general change in consumers’ viewing habits, the company has been closing locations in the last decade and announced in 2013 the imminent closing of its remaining locations.

과거에 설마 그런 날이 올까 했던 일들이 이제는 정말로 실제가 되는 순간들이 온다. 어찌보면 아직까지 남아있다는 사실이 더 놀라울 수도 있다.

By |7월 14th, 2018|Media|미국의 마지막 블록버스터에 댓글 닫힘

인공지능 기반 영화 시나리오 평가

Artificial Intelligence Could One Day Determine Which Films Get Made Variety · by Peter Caranicas

인공지능을 활용해 시나리오 기반으로 영화흥행을 예측하는 ScriptBook 서비스. 2015년 설립된 서비스는 인공지능을 활용하여 스토리텔링 비즈니스에서 위험을 평가할 수 있도록 하는 것을 목적으로 한다고 이야기한다.

시스템은 다음과 같이 작동한다 : ScriptBook 사용자는 영화대본의 PDF 파일을 시스템에 업로드한다. 약 5분 후 MPAA 등급을 예측하고 특성을 분석하며 주인공과 적대자 탐지하는 것과 같은 프로젝트의 상세한 분석을 받게된다. 각 캐릭터의 감정을 평가하고 성별과 인종을 포함한 타깃 고객을 예측한다. 가장 중요한 것은 박스 오피스 예측이다.eng

The system works like this: ScriptBook users upload a PDF file of a screenplay into the system. About five minutes later they receive a detailed analysis of the project that, among other things: predicts the MPAA rating, analyzes its characters, detecting the protagonists and antagonists; assesses the emotions of each character; predicts the target audience, including gender and race; and, most importantly, makes box office predictions.

라라랜드같은 경우 예측보다 2배 가까운 수익을 벌어들인 것으로 나타났지만 데이터에 기반한 분석에서 예외적 사례에 대한 한계일 수 밖에 없다. 이러한 종류의 분석은 언제나 사후적이기는 하지만 의사결정을 도와주는 도구로 활용될 수 있다고 말한다.

By |7월 14th, 2018|Media|인공지능 기반 영화 시나리오 평가에 댓글 닫힘

구글 듀플렉스

Google Duplex: An AI System for Accomplishing Real World Tasks Over the Phone

구글 I/O에서 발표한 듀플렉스. 구글 어시스턴트가 대신 전화를 해서 미용실 예약을 해주는 시연 영상을 보였다.

듀플렉스는 TensorFlow Extended를 사용한 RNN으로 익명화 된 전화 대화 코퍼스를 학습했고 결과는 구글의 ASR(automatic speech recognition)을 사용했다.

블로그에 미용실 예약 외에도 다양한 상황에서 적용한 사례가 올라와 있다.

대화를 자연스럽게 만들기 위해 여러가지 테크닉을 사용했다.

또한 대기 시간이 사람들의 기대치와 일치하는 것이 중요하다. 예를 들어, 사람들이 “hello?”와 같이 간단한 것을 말한 후에는 즉각적인 응답을 기대하며 대기 시간에 보다 민감하다. 낮은 대기 시간이 필요하다는 것을 감지하면 빠르고 신뢰할 수있는 모델을 사용한다. 극단적인 경우 우리는 RNN을 기다리지 않고 빠른 대응을 사용한다 (일반적으로 상대방을 완전히 이해하지 못하면 사람이 할 수있는 것처럼 보다 주저스러운 응답과 결합된다). 이를 통해 이러한 상황에서 100ms 미만의 응답 대기 시간을 가질 수 있다. 흥미롭게도 어떤 상황에서는 대화를 더 자연스럽게 느낄 수 있도록 더 많은 대기 시간을 도입하는 것이 실제로 도움이 된다는 사실을 발견했다. 예를 들어 실제로 복잡한 문장에 답하는 경우입니다.eng

Also, it’s important for latency to match people’s expectations. For example, after people say something simple, e.g., “hello?”, they expect an instant response, and are more sensitive to latency. When we detect that low latency is required, we use faster, low-confidence models (e.g. speech recognition or endpointing). In extreme cases, we don’t even wait for our RNN, and instead use faster approximations (usually coupled with more hesitant responses, as a person would do if they didn’t fully understand their counterpart). This allows us to have less than 100ms of response latency in these situations. Interestingly, in some situations, we found it was actually helpful to introduce more latency to make the conversation feel more natural — for example, when replying to a really complex sentence.
By |5월 9th, 2018|미분류|구글 듀플렉스에 댓글 닫힘

뉴스룸이 잘못된 측정 항목에 관심을 기울인다면 어떻게 될까?

The Seattle Times is making it everyone’s job to grow digital subscribers
poynter.org · by Kristen Hare

독자를 파악하기 위해 노력해왔지만 잘못된 숫자나 전혀 올바르지 않은 것이었다면 어떨까.
기사는 시애틀 타임즈의 이야기를 하며 디지털 구독자를 influence report라는 이름으로 측정한다고 말한다.
구독자가 되기 이전 세 개의 단계동안 이용자가 클릭한 것에 기반하여 점수를 산정한다.

  • 1 회 방문 (방문당 1 회 이상 이야기 클릭)
  • 1 주 및 5 회의 페이지 뷰
  • 30 일 및 25 회의 페이지 뷰

어떤 측정 지표가 필요한지에 대해서 다음과 같이 합의했다는 내용을 언급한다.

그는 작년에 작은 아파트에 대한 간단한 기사를 썼다. 발행된 날 가장 많이 읽힌 기사였으며 약 10만 페이지 뷰를 얻었다. 해당 기사는 약 7 명이 구독하는데 영향을 주었다.
“뉴욕과 시카고에 있는 많은 사람들이 읽었지만 다시는 시애틀로 돌아오지 않을 바이럴 스토리보다 숫자가 적지만 구독으로 마무리되는 좋은 독자를 가지는 스토리를 가지고 싶다고 합의했다.”
eng

He also wrote a quick story last year about tiny apartments. It was the most-read story on the day it was published and got about 100,000 pageviews. It influenced about seven people to subscribe.
“The consensus is we’d rather have a story that had a smaller number of good readers who wind up subscribing than a viral story that a bunch of people in New York and Chicago read but will never come back to Seattle again.”
By |4월 16th, 2018|Media|뉴스룸이 잘못된 측정 항목에 관심을 기울인다면 어떻게 될까?에 댓글 닫힘

광고차단기의 가치

A guerrilla test of ad-free: Let subscribers leave their ad blockers on Ryan Nakashima @medium

AP의 Ryan Nakashima는 광고를 대체하는데 드는 초기 비용에 대한 연구 결과를 발표. 광고 차단기를 사용하는 사람들에게 메시지를 보여주었는데 기존 흔히 보는 메시지와는 다르게 “with or without your ad blocker on.”이라는 메시지를 추가. 구독을 하면 광고 차단기를 켜 놓을 수 있다는 메시지를 준 것이었다.

실험 결과가 말하는 것은 광고를 없애는 것에 사람들이 어느 정도 가치를 두고 있는지를 추측해볼 수 있게 한다. 다음은 세부내용

  1. 위의 메시지에서 구독을 클릭 한 후 가입 한 107명에게 설문 조사를 보냈다. 20명이 응답했으며 20명의 응답자 모두가 옵션을 부여받은 후 광고 차단기를 유지했다고 답했다. 100%! 광고 차단기를 꺼야하지 않았다면 누구도 끄려고 하지 않았다. 이것은 관성 때문일 수 있지만, 분명한것은 사람들이 콘텐츠 비용을 지불했을 때 Netflix, HBO, Pandora, YouTube 및 기타 여러 온라인 서비스에서와 마찬가지로 광고없는 경험을 기대한다는 것이다.
  2. 응답에 따르면 저널리즘에서 광고가 차지하는 역할을 사람들이 인식하고 있지만 여전히 좋아하지는 않는다.
  3. 20명 중 11명은 그래야만 한다면 한 달에 0.50 달러에서 4 달러 사이에서 광고없는 접속을 위해 더 많은 비용을 지불할 것이라고 답했다. 한 명은 더 지불하지 않을 것이라 답했고 8명은 확신할 수 없다고 했다.
  4. 20명 모두는 가입 후 광고 차단기를 유지하는 것이 “보통”, “중요”또는 “매우 중요”하다고 말했다. 아무도 그것이 “전혀” 또는 “약간” 중요하지 않다고 답하진 않았다.
  5. 20명 중 5명이 가입하게 된 원인을 설명하는데 있어서 로컬 저널리즘을 지지하거나 지역 사회에 관해 읽고 싶어한다고 말했다.
  6. 두 명의 응답자가 광고 차단기를 끄지 못하거나 어떻게 알지 못했다고 응답했다. 많은 기업, 정부 기관, 학교 및 기타 조직이 네트워크상의 모든 컴퓨터에서 광고를 차단합니다.
  7. 광고 차단기를 사용하는 사람들은 모든 사회계급에 있다. 응답자 중에는 교사, 디자이너, 소프트웨어 엔지니어, 시스템 관리자, 비영리 단체의 이사, 건축가, 재무 분석가, 변호사 및 일부 실업자 및 퇴직자가 있었다. 소득은 25,000 달러 이하에서 150,000 달러 이상이며, 연령대가 19 세 이상 65 세 이하였다. (우리의 응답자 샘플이 고연령으로 치우쳐 있었다)
eng
1. We sent a survey to 107 people who signed up after clicking subscribe on the above message. Twenty responded, and all 20 respondents said they left their ad blocker on after being given the option to do so. 100%! No one decided they’d just turn off their ad blocker if they didn’t have to. While this could be due to inertia, what’s clear to me is this: When people pay for content, they expect to have an ad-free experience, just like they get at Netflix, HBO, Pandora, YouTube and many other online services.
2. Comments showed that people are cognizant of the role ads have in funding journalism, but they still don’t like them:
3. Eleven of 20 people said they’d pay more for ad-free access if they had to, anywhere from between $0.50 to $4 more per month. One wouldn’t pay more and eight were unsure.
4. All 20 said it was “moderately,” “very,” or “extremely” important to leave their ad blocker on after subscribing. No one said it was “not at all” or only “slightly” important.
5. Five of 20 said they want to support local journalism or read about their community in explaining what led them to subscribe.
6. Two respondents said they couldn’t turn off their ad blocker or didn’t know how. Many businesses, government institutions, schools and other organizations block ads on all computers on their network. Let’s not punish them by cutting off access.
7. People who use ad blockers come from all walks of life. Among our respondents were teachers, designers, a software engineer, a systems administrator, the director of a non-profit, an architect, a financial analyst, an attorney and some unemployed and retired people. Incomes ranged from below $25,000 to above $150,000, and ages from 19 to above 65 years old (our respondent sample skewed older)
By |4월 16th, 2018|Media|광고차단기의 가치에 댓글 닫힘

라이브 붐 시작단계

트위치 공동창업자 “라이브 붐, 이제 시작 단계”
bloter.net · by 권도연

라이브와 VOD 콘텐츠는 이용자 입장에서 확실히 다른 경험을 제공. 그렇기에 규제라는 측면에서도 라이브 방송에 대해 다른 접근이 필요하다는 생각.

“유튜브, 넷플릭스, 훌루 같은 동영상 플랫폼은 모두 VOD 모델로 빠르게 확산됐습니다. 한편으론 사람들은 살아있는 경험을 좋아합니다. 어떤 일이 발생했을 때의 생생한 현장감을 원합니다. 트위치는 이런 경험 중 한 가지 유형이 될 수 있습니다. 게다가 우리는 웹에 비해 모바일에서 더 많은 인터랙티브 이용자들은 발견하고 있습니다”

트위치 카테고리들 중 IRL같은 경우 초기에는 없던 카테고리이다. 확실히 방송 종류에서도 한국이 훨씬 다양하다는 느낌.

미국 동영상 플랫폼 사업자의 한국 시장 분석담은 흥미로웠다. 국내 시장은 트위치에게도 새로운 도전이 됐다. 그는 “서양보다 훨씬 트렌드가 빠르고 다양했다”라며 ‘먹방(Mukbang)’에 대해 먼저 말을 꺼냈다. 그는 “한국은 인기 있는 게임뿐만 아니라 인기 있는 콘텐츠 유형도 매우 달랐다”라며 “먹방에서부터 시작해 IRL(In Real Life) 카테고리를 새롭게 시작하게 된 이유”라고 밝혔다. 하지만 의외로 먹방이라는 새로운 콘텐츠가 트위치 전체에 통하진 않았다. 그는 한국 이용자들이 특히 다양하고 자연스러운 라이브 영상에 대한 니즈가 강했다고 분석했다. 현재 한국은 여전히 IRL 카테고리 최상위 이용국이다. 먹방의 사례를 토대로 트위치는 국가별 콘텐츠 유형을 분석 중이라고 밝혔다.

By |4월 16th, 2018|Media|라이브 붐 시작단계에 댓글 닫힘

모바일 크롬의 기사추천

This is the next major traffic driver for publishers Chrome’s mobile article recommendations, up 2,100 percent in one year
Nieman Lab · by John Saroff

언제나 사파리를 쓰고 모바일 크롬을 잘 쓰지 않아서 몰랐는데 빈 화면에 나오는 추천기사 목록에서 트래픽이 꽤나 나온다는 이야기. 과거 홈페이지를 점령하기 위해 많은 기업들이 노력을 기울였던 결과와 유사한 모습을 보인다. 기사를 보면 트위터 수준까지 올라온 모습. 하지만 왜 이 기사가 추천되었는지는 아무도 알지 못한다.

당신을 위한 기사로 가게 만드는 요인은 명확하지 않다. AMP 형식을 채택한 것을 선호하는 것 이외에, 이러한 선택은 정확히 어떻게 만들어지는가?
내 브라우저 사용 기록이 영향을 미치는가? 미국 뉴스 사이트에서 Marine Le Pen에 대한 기사를 읽으면 Marine Le Pen에 대한 기사나 유럽 우익정당에 대한 기사들이 갑자기 더 많이 보이게 될까?
구글의 크롤링 된 모든 페이지가 고려될까? 단지 일부 목록일까?(아마 구글의 허용목록에 들어가 있는 사이트일까?). 어떤 요인(진실성, 신뢰성, 페이지로딩 속도)가 순위에 영향을 주는가? 당신을 위한 기사는 어떻게 작동할까?eng

The signals that drive Articles for You are much less clear. Other than what appears to be a preference for articles that have adopted the AMP format, how exactly are the selections made?
How does my browsing history affect what I see? If I read about Marine Le Pen on an American news site, will I suddenly start seeing more articles about Marine Le Pen, about right-wing European parties, from right-wing American sites? From French sites?
Are all Google-crawled pages considered? Is it just a subset (perhaps the Google News corpus of whitelisted sites?). What factors (authenticity, reliability, pageload speed) drive a ranking? In short, how does Articles for You work?
By |4월 2nd, 2018|Media|모바일 크롬의 기사추천에 댓글 닫힘

페이스북 스캔들 이후 AD Tech 기업들의 미래

With ad privacy coming, ad tech is about to get its close-up
Digiday · by Lucia Moses

페이스북 스캔들 이후 프라이버시에 대한 규정이 강화되면서 광고 기술 기업들이 이용자 데이터를 활용하기 점차 어려워질 수 있다는 이야기.

EU의 일반 정보 보호 규정(GDPR)이 5월에 발효되면 광고 회사는 사용자의 데이터 리타겟팅에 대한 허가를 받아야 한다. 그러나 페이스북과 캠브리지 애널리티카와 같은 스캔들은은 회사가 허락을 받기가 더 어렵게 만들 가능성이 있다고 Lucia Moses가 보도했다. “광고 기술 회사는 기업이 무엇을 어떻게 하는지 일반적인 사람들과 소통하는데 있어서 복잡하고 지루하기 때문에 어려움을 겪어왔다.”라고 기술 컨설턴트인 Matt Rosenberg는 Moses에게 이야기했다. Moses는 사람들이 동의하기로한 메시지가 무엇을 의미하는지 알지 못하고 광고 기술에 대해 알고 있는 것이 스캔들과 관련되어 있다면 이용자들에게 허가를 받는 것이 더욱 어려워질 것이라고 말한다.eng

When the EU’s General Data Protection Regulation goes into effect in May, ad tech companies will have to get permission from users for their data to be used for retargeting. But scandals such as Facebook’s with Cambridge Analytica will likely make it harder for these companies to get permission, Lucia Moses reports. “Ad tech companies have had a couple historical problems communicating what they are and how they do it because it’s really complex and, if you’re a layman, really boring,” tech consultant Matt Rosenberg tells Moses. Getting permission from users will be even more challenging, Moses explains, if people don’t know what the opt-in messages mean, and what they do know about ad tech is linked to scandals.
By |4월 2nd, 2018|IT|페이스북 스캔들 이후 AD Tech 기업들의 미래에 댓글 닫힘

스티브잡스 프라이버시

스티브잡스가 2010년 모스버그와 인터뷰에서 프라이버시에 대해 한 이야기

잡스: 아니다. 프라이버시는 사람들이 가입한 내용이 무엇인지 알려주는 것을 의미한다. 평범한 영어로, 그리고 반복적으로 말이다. 그것이 프라이버시가 의미하는 것이다. 나는 낙과주의자이다. 나는 사람들이 똑똑하다고 생각한다. 그리고 어떤 사람들은 다른 사람들에 비해 더 많은 데이터를 공유하기를 원한다. 그들에게 매순간 물어봐라. 사람들이 물어보는게 지쳤다면 사람들이 그만 물어보라고 말할 수 있도록 만들어라. 데이터로 무엇을 할 것인지를 정확하게 알게 만들어라. 그것이 우리가 생각하는 것이다.eng

Jobs: No! Privacy means people know what they’re signing up for. In plain English, and repeatedly. That’s what it means. I’m an optimist. I believe people are smart. And some people want to share more data than other people do. Ask them. Ask them every time. Make them tell you to stop asking them if they’re tired of you asking them. Let them know precisely what you’re going to do with their data. That’s what we think.
By |3월 28th, 2018|IT|스티브잡스 프라이버시에 댓글 닫힘