About hysong

This author has not yet filled in any details.
So far hysong has created 366 blog entries.

위키피디아 이용에 대한 설문조사

Why the world reads Wikipedia What we learned about reader motivation from a recent research study
blog.wikimedia.org · by Florian Lemmerich

위키피디아에서 250M+ 을 대상으로 한 설문조사 결과

그래프를 보면, 특정 언어를 사용하는 위키피디아 사용자 중 약 35%가 위키피디아에서 특정 사실을 찾았으며 33%는 주제에 대한 개요나 요약, 32 %는 위키피디아에서 주제를 심층적으로 읽는다.eng

From these graphs, we see that on average around 35 percent of Wikipedia users across these languages come to Wikipedia for looking up a specific fact, 33 percent come for an overview or summary of a topic, and 32 percent come to Wikipedia to read about a topic in-depth.

동기와 관련된 설문 문항들도 있는데 책, 라디오, 영화, TV 프로그램과 같은 미디어는 독자를 위키피디아로 유입시키는데 중요한 역할을 한다고 말한다.

By |3월 19th, 2018|IT|위키피디아 이용에 대한 설문조사에 댓글 닫힘

페이스북에서 트럼프 선거를 위한 이용자 데이터 불법수집

How Trump Consultants Exploited the Facebook Data of Millions
The New York Times · by MATTHEW ROSENBERG

트럼프 선거를 지원했던 데이터 분석업체 캠브리지 애널리티카(Cambridge Analytica)가 페이스북을 통해 유권자 5,000만 명의 데이터를 불법 수집했다는 폭로.

Wylie의 팀은 더 큰 문제가 있었다. 전국 규모의 심리학적 프로파일을 구축하는 것은 회사가 엄청난 비용을 들이지 않고는 모을 수 없는 데이터를 필요로 했다. 전통적인 분석회사는 투표 기록과 소비자 구매 기록을 사용하여 정치적 신념과 투표 행위를 예측하려고 노력했다.

하지만 이러한 종류의 기록은 특정 유권자가 신경증적으로 내향적인 사람인지, 종교적으로 외향적인 사람인지, 공정한 마음을 가진 자유주의자인지 혹은 오컬트의 팬인지를 알아 내는데 쓸모가 없었다. 그것들은 정치적 메시지를 디자인할 수 있는 독특하고 강력한 수단을 제공할 것이라고 회사가 주장한 심리적 특성 중 하나였다.

Wylie는 Cambridge University의 Psychometrics Center에서 해결책을 찾았다. 연구자들은 사람들이 Facebook에서 좋아하는 것을 기반으로 성격 특성을 매핑하는 기술을 개발했다. 연구자들은 사용자에게 페이스북에서 허용한 활동과 친구들의 개인 정보를 긁어내는 성격 퀴즈를 풀고 앱을 다운로드하게 만들기 위해 작은 액수의 돈을 지불했다. 과학자들은 이러한 접근 방식이 부모나 연인이 알고있는 것보다 더 많은 것을 밝힐 수 있다고 주장했다.eng

Mr. Wylie’s team had a bigger problem. Building psychographic profiles on a national scale required data the company could not gather without huge expense. Traditional analytics firms used voting records and consumer purchase histories to try to predict political beliefs and voting behavior.

But those kinds of records were useless for figuring out whether a particular voter was, say, a neurotic introvert, a religious extrovert, a fair-minded liberal or a fan of the occult. Those were among the psychological traits the firm claimed would provide a uniquely powerful means of designing political messages.

Mr. Wylie found a solution at Cambridge University’s Psychometrics Centre. Researchers there had developed a technique to map personality traits based on what people had liked on Facebook. The researchers paid users small sums to take a personality quiz and download an app, which would scrape some private information from the their profiles and those of their friends, activity that Facebook permitted at the time. The approach, the scientists said, could reveal more about a person than their parents or romantic partners knew — a claim that has been disputed.

By |3월 19th, 2018|Media|페이스북에서 트럼프 선거를 위한 이용자 데이터 불법수집에 댓글 닫힘

팀버너스리, 위험에 처한 웹

The web is under threat. Join us and fight for it.
Web Foundation Tim Berners-Lee

수 년 전 많은 사람들이 연결된 웹은 오늘날 새로운 이용자를 발견할 수 있는 곳이 아닙니다. 한 때 블로그와 웹 사이트의 풍부한 선택은 몇 가지 지배적인 플랫폼으로 압축되었습니다. 이러한 힘의 집중은 새로운 게이트 키퍼(gatekeeper)의 집단을 만들어줌으로써, 소수의 플랫폼이 아이디어와 의견을 확인하고 공유하는 것을 통제하도록 만듭니다.

이러한 지배적인 플랫폼은 경쟁 업체에 대한 진입장벽을 만들어 자신의 위치를 완전장악할 수 있습니다. 이들은 신생 기업을 인수하고 새로운 혁신을 도입하며 업계 최고의 인재를 고용합니다. 이것에 이용자 데이터가 제공하는 경쟁 우위를 추가하면 향후 20년이 지난 시기보다 훨신 늦은 혁신을 보일 것으로 예상할 수 있습니다.

게다가 권력이 소수의 기업들에 권력이 집중되어 있다는 사실은 웹을 무기화 하는 것을 가능하게 합니다. 최근 몇 년간 소셜 미디어 플랫폼에서의 음모 이론, 가짜 트위터와 페이스북 계정이 부추기는 사회적 긴장감, 외부 행위자들의 선거 방해, 범죄자들이 개인 데이터 도용을 보았습니다.eng

The web that many connected to years ago is not what new users will find today. What was once a rich selection of blogs and websites has been compressed under the powerful weight of a few dominant platforms. This concentration of power creates a new set of gatekeepers, allowing a handful of platforms to control which ideas and opinions are seen and shared.

These dominant platforms are able to lock in their position by creating barriers for competitors. They acquire startup challengers, buy up new innovations and hire the industry’s top talent. Add to this the competitive advantage that their user data gives them and we can expect the next 20 years to be far less innovative than the last.

What’s more, the fact that power is concentrated among so few companies has made it possible to weaponise the web at scale. In recent years, we’ve seen conspiracy theories trend on social media platforms, fake Twitter and Facebook accounts stoke social tensions, external actors interfere in elections, and criminals steal troves of personal data.

기업의 책무, 법과 규제가 이러한 긴장을 완화할 수 있을 것이라는 이야기도 덧붙인다.

By |3월 13th, 2018|Media|팀버너스리, 위험에 처한 웹에 댓글 닫힘

의미를 잃어가는 블록체인

‘Blockchain’ is meaningless
The Verge · by Adrianne Jeffries

비트코인이 주류 담론에 들어오면서 많은 담론이 이어지고 있지만 이해가 부족한 개념이라는 이야기. 비트코인과 암호화폐를 뒷받침하는 디지털 장부에 대한 아이디어는 너무 광범위해져서 은행거래부터 물류유통에 이르기까지 모든 것을 설명하는데 사용되고 있다고 함. 그렇기 때문에 정확한 의미를 잃어가고 있다고 봄.

Google의 블록체인에 대한 정의는 비트 코인 (bitcoin) 또는 다른 암호화폐에서 거래가 시간순서로 공개적으로 기록되는 디지털 장부이다. 대부분의 사람들은 블록체인이 디지털 장부라는 점에 동의하지만, 많은 블록체인은 암호화폐와 관련이 없으며 공개적으로 기록되지 않는다. 심지어 블록 체인이 디지털일 필요는 없다고 주장하는 사람들도 있다.

Investopedia는 “블록체인은 모든 암호화폐 거래에서 디지털화되고 분산된 공개 원장입니다.”라고 말한다. 다시 말하지만, 많은 블록체인은 공개되지 않으며 많은 블록체인은 분산되어 있지 않는다.
eng

Google’s definition of “blockchain” is “a digital ledger in which transactions made in bitcoin or another cryptocurrency are recorded chronologically and publicly.” While most people would agree that a blockchain is a digital ledger, many blockchains do not have an associated cryptocurrency and are not recorded publicly. Some would even argue that a blockchain needn’t be digital.

Investopedia says, “A blockchain is a digitized, decentralized, public ledger of all cryptocurrency transactions.” Again, many blockchains are not public, and many others are not decentralized.

블록체인이라는 말을 마케팅에 사용하는 기업들도 있는데, 무엇이 블록체인 기술인지 정확하게 이해하기 위해서 시간이 걸릴 것이라고 이야기한다. 표준안이 마련되는데 오랜 시간이 걸릴 것이라는 이야기.

By |3월 12th, 2018|IT|의미를 잃어가는 블록체인에 댓글 닫힘

Musical.ly의 유해단어 차단

Musical.ly Blocked Tags Related To Self Harm And Eating Disorders After Scrutiny
BuzzFeed · by Katie Notopoulos

젊은 사용자들에게 인기가있는 립싱크 앱 Musical.ly는 특정 유형의 위험한 콘텐츠를 완화하고 필터링하는 방법에 있어서 인스타그램 또는 텀블러와 같은 10대 친화적 인 소셜 앱을 따라 잡기 위해 고심하고 있다. 사람들이 이번 주에 #cutting이나 #proana와 같이 자해나 거식증과 관련된 해시 태그를 검색 할 수 있도록 허용한 것에 대해이 앱을 비판 한 후 이러한 검색어 중 일부를 차단했습니다.eng

Musical.ly, the lip-synching app that is wildly popular with younger users, is struggling to catch up to other teen-friendly social apps like Instagram or Tumblr in how it moderates and filters certain types of dangerous content. After people criticized the app this week for allowing users to search for hashtags related to self-harm or eating disorders, like #cutting or #proana, Musical.ly blocked some of these search terms.

하지만 이러한 방식의 필터링은 사람들이 단어를 조금만 바꿔도 콘텐츠를 제제하기 어렵다는 것. 그래서 여전히 검색이 가능하다고 한다.

By |3월 11th, 2018|Media|Musical.ly의 유해단어 차단에 댓글 닫힘

소셜미디어와 성 노동자

Social Media Is Reshaping Sex Work—But Also Threatening It
Wired · by Emma Grey Ellis

유료 누드 사진에서 웹캠 모델링, 고급 에스코트 서비스에 이르기까지 모든 것을 포함하는 성 노동을 위해 소셜 미디어가 어느 때보다도 인기를 얻기는 하지만 이러한 모든 것은 미국 성매매법에 기반한 성적인 내용에 관한 플랫폼의 규칙에 위배된다. Kush처럼 성노동자의 계정은 명시적으로 침범하지 않더라도 경고나 설명없이 종료되는 경우가 많다. 그래서 그들은 플랫폼에 의해 배반당한 것 이상을 느끼고 있다.

이것은 단일 플랫폼 문제가 아닙니다. 주목받는 포르노 연기자 중에 허가받지 않고 스냅캐시를 사용하여 비디오 클립을 고객에게 청구할 수 있기 때문에 스냅챗이 인기가 있다.eng

But as social media has become more popular than ever for sex work—which encompasses everything from paid nude photos to webcam modeling to high-end escort services—all of it is strictly against platforms’ rules regarding sexual content, which are loosely based on United States prostitution law. And, like Kush, workers’ accounts are often shut down without warning or explanation, even when their content never ventures into explicit territory. So they’re feeling more than a little betrayed by the platforms they feel they helped create.

THIS ISN’T A single-platform problem. Among aspiring porn performers, Snapchat is popular because off-label use of Snapcash allows them to charge clients for video clips.

스냅캐시는 잭 도시가 창업한 모바일 서비스 스퀘어와 콜라보레이션을 통해 만들어진 핀테크 서비스.

By |3월 11th, 2018|Media|소셜미디어와 성 노동자에 댓글 닫힘

포르노가 청소년에게 미치는 영향

청소년들이 온라인에 넘쳐나는 포르노를 보고 무엇을 배우게 될까?

포르노가 청소년들에게 미치는 영향에 대해 다양한 이야기를 하고 있는 뉴욕타임즈 기사. 뉴스 페퍼민트 번역.

그런 동영상을 본다고 구체적으로 청소년의 행동이 어떻게 바뀌는지는 알 수 없습니다. 포르노를 더 많이 보는 청소년들이 상대적으로 더 어린 나이에 첫 섹스를 하고, 성에 대한 고정관념도 더 강하게 형성되며, 또래보다 성에 관한 관계 전반에서 훨씬 애정표현을 덜 한다는 몇몇 연구가 있기는 하지만, 이는 상관관계를 나타낸 것일 뿐 인과관계는 밝혀내지 못했습니다. 하지만 설문조사 결과를 보면 청소년들의 성생활 자체가 바뀌고 있는 것 같기도 합니다. 허버닉 교수가 공저자로 참여해 학술지 <성 의학>에 실린 논문에 인용된 미국인의 성생활에 관해 최대 규모로 치러진 조사 결과를 보면, 2009년 18~24세 여성 가운데 항문 성교를 해봤거나 시도해봤다고 답한 이들은 40%로 나타났습니다. 1992년 같은 질문에 그렇다고 답한 여성이 16%에 불과했던 것과 비교하면 큰 폭으로 늘어난 겁니다.

특정 단어의 의미가 변했다는 사실만으로도 어느 정도 예측해 볼 수 있는 사실이지 않을까 싶다.

By |3월 11th, 2018|미분류|포르노가 청소년에게 미치는 영향에 댓글 닫힘

인공지능 저작물과 저작권 이슈

How AI and copyright would work
TechCrunch · by Dave Davis

로봇 저널리즘부터 다른 여러가지 인공지능의 저작물과 관련된 저작권에 대한 기사.

AI 자체의 권리에 관해서 핵심적인 문제는 의도라고 생각한다.
논리적으로 말하면 의도가없는 독창적인 표현은 할 수 없으며 자각이 없으면 의도를 가질 수 없다. 인공 지능의 등장에 대한 경고를하는 대중적인 글에도 불구하고, 인공 지능을 연구하는 회의적인 핵심그룹에 따르면 적어도 자신의 존재와 작동에 대한 인식이있는 작업 프로그램은 아직 멀었다.eng

When it comes to the rights of an AI itself, I think the key issue would be intent.
Logically speaking, you can’t have original expression without intent, and you can’t have intent without self-awareness. Despite popular articles warning about the coming of AI, a working program with awareness of its own existence and operations is still a long way off — at least according the more skeptical cadre of those studying AI.

미국 저작권법은 현재 저작권법에 의해 보호받을 수 있는 자격을 갖추기 위해서는 102조 (a)에 명시된 조건을 충족해야 함을 이야기하고 있다.

“저작권 보호는 법명에 따라 현재 알려지거나 나중에 개발된 유형의 표현 매체에 고정된 원저작에서 직접적으로 또는 기계 혹은 기기의 도움을 통해 지각되거나 재현되거나 다른 방식으로 커뮤니케이션 될 수 있습니다.”eng

“Copyright protection subsists, in accordance with this title, in original works of authorship fixed in any tangible medium of expression, now known or later developed, from which they can be perceived, reproduced, or otherwise communicated, either directly or with the aid of a machine or device.”

국내 저작권법은 어떻게 되어있는지 모르겠지만 알고리즘을 통한 요약 기사나 여러가지 저작물을 기반으로 학습해 생성되는 결과에 대한 저작권 문제가 이슈가 될 수 있다고 본다.

By |1월 11th, 2018|Media|인공지능 저작물과 저작권 이슈에 댓글 닫힘

모바일 이용에 대한 자녀의 부모 통제

Apple will address kids’ iPhone addiction with enhanced iOS parental controls VentureBeat · by Jeremy Horwitz · January 9, 2018

아이들의 모바일 중독과 부모의 통제 권한에 대한 이야기. 애플은 원래부터 자녀 보호 기능이 있었으나 이를 강화해달라는 요청에 따라 이러한 기능을 더 강화시킬 것이라는 이야기.

아이폰 중독(일반적으로 휴대용 장치 중독의 문제) 이슈는 수년간 눈에 띄지 않고 있었지만 최근에는 더 많은 주목을 받았다. 이전 로이터 보도에서 밝혀진 바와 같이, 과거의 디즈니 스타 셀레나 고메즈 (Selena Gomez)는 소셜 미디어 중독에 의한 우울증으로 인해 투어를 취소했으다. 2016 년 설문 조사에 따르면 10대 청소년의 절반이 휴대 전화에 중독된 것으로 생각하며 전화 메시지에 즉시 응답해야 한다는 부담감을 느낀다고 했다. 부모가 얼마나 많은 아이들의 시청 습관을 통제해야하는지에 대한 문제는 결정적인 해결책 없이 블랙 미러 (Black Mirror)와 같은 대중 매체에서 계속 이야기되었다.eng

The issue of iPhone addiction — and portable device addiction in general — has been in the background for years, but recently benefited from additional attention. As noted in an earlier Reuters report, former Disney star Selena Gomez revealed that she’d canceled a tour due to depression she attributed to social media addiction, and a 2016 survey suggested that half of teenagers felt addicted to their mobile phones and were pressured to immediately respond to phone messages. The issue of how much parents should control their kids’ viewing habits — and thus their kids — has continued to percolate in popular media such as the TV show Black Mirror, without reaching a conclusive answer.

어린 조카가 네 살인데 너무 체력이 좋아서 놀아주다 지쳐 유투브를 틀어주는 경우가 있다. 할머니 아이패드를 가지고 알아서 유투브를 시청하는데 어느날 이상한 드라마를 보고 있는걸 확인하고 “얘가 왜 이걸 보고 있어”라고 이야기했던 적이 있다. 알고리즘이 관련영상을 추천하기 때문에 아이들이 어떤 것을 보게 될지, 어떤 광고에 노출될지 통제하기 어렵다. 누나에게 유투브 키즈앱을 사용하라고 이야기했다. 하지만 애들이 빨라서 이미 유투브 키즈앱으로 유투브를 보면 적응하지 못하는 친구들도 있다는 댓글을 봤다.

By |1월 10th, 2018|Media|모바일 이용에 대한 자녀의 부모 통제에 댓글 닫힘

데이터사이언티스트, 머신러닝, 인공지능 차이점

What’s the difference between data science, machine learning, and artificial intelligence?
varianceexplained.org · by David Robinson

Data Scientist, Machine Learning, Artifical Intelligence를 간단한 개념으로 구분하는 방식을 제시. 각 영역은 중복되는 부분이 많지만 상호호환하여 사용할 수 있는 용어는 아니며 매우 간단한 개념적 구분임에도 특정 작업이 세 가지 중 어떤 것으로 분류되는지를 이해할 수 있게 해 준다.

이 글에서 나는 세 가지 영역 사이의 차이점에 대한 단순화 된 정의를 제시한다
– 데이터 사이언테스트는 인사이트를 만들어낸다
– 머신 러닝은 예측을 만들어낸다
– 인공지능은 행동을 만들어낸다eng

So in this post, I’m proposing an oversimplified definition of the difference between the three fields:
– Data science produces insights
– Machine learning produces predictions
– Artificial intelligence produces actions

세 가지를 구분하는 매우 좋은 기준이라는 느낌이다. 자세히 따지면 모호한 영역이 있음에도 직관적으로 이해하기 어렵지 않다.

By |1월 10th, 2018|Statistics|데이터사이언티스트, 머신러닝, 인공지능 차이점에 댓글 닫힘