About hysong

이 저자는 아직 상세 내용을 기재하지 않았습니다.
So far hysong has created 411 blog entries.

워드 임베딩의 성적 편향 완화

Double Hard-Debias: Tailoring Word Embeddings for Gender Bias Mitigation

 

세일즈포스(salesforce)와 버지니아 대학 연구자들이 제시한 워드 임베딩의 성적 편향을 완화하는 방법에 대한 내용이다.

워드 임베딩은 단어전체에서 단어를 나타내는 실제 숫자로 이루어진 벡터로 단어와 다른 단어의 관계에 대한 의미론적 구문론적인 뜻을 포착할 수 있게 해준다. 자연어 처리 작업에 널리 활용됨에도 코퍼스에 대한 학습과정에서 의도하지 않은 성적인 편견을 물려받는 것으로 인한 비판을 받았다.

예를 들면, 다음의 두 가지 기준(남성과 여성 / 젠더중립과 특정젠더)으로 단어를 분류한다면 우수한(brilliant), 똑똑한(genius)과 같은 단어는 젠더 중립적이고 숙녀(ladies), 여왕(queen) 같은 단어는 특정젠더에 속하는 단어이다.

이와 같은 문제를 알고리즘에 대한 비판으로 접근하는 것과 관련해 사람들이 그러한 방식으로 언어를 사용하기 때문이고, 알고리즘은 이러한 내용을 순수하게 반영하는 것이라는 단순한 실재론에 가까운 입장이었다. 오히려 알고리즘을 의인화하는 방식의 비판에 대해서 부정적이었으나 실제로 이런 학습과 관련된 문제를 적극적으로 교정하는 것이 점차 중요해진다. 예를 들어, 젠더 편견을 가진 시스템으로 이력서 필터링을 하는 경우 어떤 일이 생길 것인가? 이미 비슷한 사례가 많이 제시되었다.

기존 방식은 사후 처리 과정에서 성별 관련 구성 요소를 주성분 요소를 빼서 편견을 줄이는 방식이라고 한다. 하지만 이러한 방식이 가지는 한계는 단어의 빈도로 인해 제거된 젠더편향이 되살아날 수 있다는 점이다. 본 연구에서 제시한 방식은 워드 임베딩을 빈도가 없는 하위 공간으로 전환하는 과정을 거친다는 것이다. 대충 느낌은 오지만 실제로 데이터를 돌려봐야 정확하게 파악할 수 있을 것 같다.

일부 전문가들은 단어 삽입에서 편견을 완전히 제거 할 수 없다고 생각하는 것은 가치가 있습니다. 뮌헨 기술 대학 (Technical University of Munich)의 최근 메타 분석에서, 기고자들은 단어의 의미 론적 내용이 항상 사회의 사회 정치적 맥락에 묶여 있기 때문에 자연적으로 발생하는 중립적 텍스트와 같은 것은 없다고 주장합니다. eng

It’s worth noting that some experts believe bias can’t be fully eliminated from word embeddings. In a recent meta-analysis from the Technical University of Munich, contributors claim there’s “no such thing” as naturally occurring neutral text because the semantic content of words is always bound up with the sociopolitical context of a society.

알고리즘도 현실을 반영하는 하나의 미디어로 결국은 언어와 세상에 관해 어떤 관점을 가져가는지에 대해 고민할 필요가 있다. 완전 중립적이라는 것은 존재하지 않지만 이러한 편향을 줄이는 것이 가지는 의미에 대해 생각해볼 필요가 있지 않을까.

By |2020-07-10T15:33:43+09:007월 10th, 2020|IT|0 댓글

에르메스 콜렉션 비디오

Men’s Spring-Summer 2021 collection

 

새로운 디지털 경험 관련 에르메스의 비디오.

일반적인 연구 결과는 오프라인에서 가지는 촉감이 소비자를 구매로 연결시키는 주요 요인 중 하나라고 보고 있으며, 온라인과 관련된 마케팅의 많은 연구가 오프라인의 이러한 특성을 어떻게 온라인으로 전환할 것인지에 관해 연구했다. 에르메스 영상은 디지털 경험이라는 측면에서 e커머스가 홈페이지의 상품 목록과 사진에만 의존하는 것과 관련해 다른 가능성을 제시한다.

코로나 이후 다양해지는 디지털 경험방식 중 하나로 볼 수도 있을까?

By |2020-07-09T01:04:59+09:007월 9th, 2020|Media|0 댓글

코로나 이후의 기술과 미디어 소비

The Post-Covid-19 Agenda for Technology and Media Companies.

 

코로나 이후 미디어 기업을 위한 아젠다라는 제목의 보고서 (출처: activate consulting)

핵심적인 내용은 오히려 너무 간단한데 코로나로 인한 외출금지 이후 사람들의 습관, 활동, 기대에 관한 근본적인 변화가 발생했다는 것으로 기술 및 미디어 회사는 가치 제안, 프로그래밍, 경험, 기능, 가격 및 마케팅을 포함하여 사용자 및 소비자와의 다양한 방식을 재 연결해야 한다고 말한다.

 

다음은 몇 가지 (개인적으로) 눈에 띄는 내용들

  • 외출금지동안 미디어 이용이 증가했고, 외출금지가 해제된 이후에도 이전보다는 증가한 수준
    (새로운 기술이나 미디어 채택에서 한 번의 경험이 중요할 수도 있는데 코로나로 인한 강제 경험?)
  • 스트리밍 서비스 이용이 증가했는데 구독을 하게 만드는 주요 요인에서 차이가 있음. 외출금지 전에는 가격이 가장 중요했으나 외출금지 기간 구독한 사람들은 오리지널 콘텐트가 가장 중요하다고 보았음
  • 게임은 특히 큰 폭의 성장을 기록했음. 게임 회사들의 문제는 이렇게 증가한 이용자를 유지하는 것과 관련되어 있음. 새로운 20% 신규 이용자 중 47%는 외출금지가 종료된 이후에도 유지할 것 같다고 응답했음
  • 브랜드 신문은 페이월을 낮추고 시험이용을 유도함으로써 새로운 구독자를 확보했음
  • 이커머스 기업에게는 소비자와 직접 연결될 수 있는 훌륭한 기회가 되었음
  • 인터넷 서비스를 업그레이드하고자 하는 수요도 증가함
  • 기존 소셜 미디어 플랫폼을 대체하는 게임. 이제 게임은 사회적 연결을 위한 플랫폼으로 작동함
  • 디지털 경험을 위한 새로운 형식과 플랫폼이 만들어 질 것임. 코로나 기간의 디지털 경험 혁신은 새로운 사회적 연결 활동을 의미하며 물리적 현실과 디지털 사이의 경계를 허물게 될 것임
By |2020-07-09T00:53:40+09:007월 9th, 2020|Media|0 댓글

누가 퀴비를 보나?

Is Anyone Watching Quibi?

By Benjamin Wallace, Vulture

큰 금액을 투자하고 A급 탤런트 목록을 보유했던 퀴비의 실패에 대한 기사. 다음과 같은 평가가 나오고 있다.

“옙, 퀴비는 나쁘다”는 잡지의 TV 비평가 중 한 사람의 기사 제목이었다. 가디언은 퀴비(Quibi)는 L.A. 회의실에서 태어난 아이디어로 현실에서 죽은 아이디어”라고 불렀다.eng

“Yep, Quibi Is Bad” was the headline on an article by one of this magazine’s TV critics. The Guardian called Quibi “an idea born in an L.A. conference room that will probably die in the real world.”

 

실패에 대한 원인으로 기사에서는 타깃으로 삼고 있는 세대에 대한 무지를 언급하고 있다.

카젠버그와 휘트먼은 그들이 도달하려는 인구 통계에있는 젊은 직원들과 함께 퀴비 사무실에 있었다고 지적한다. 그러나 놀라울 정도로 수용자에 대한 지식이 부족했으며 오만했다. 제프리가 항상 말하는 것은 ‘나는 어린이나 어머니가 아니지만 아이들과 어머니가 사랑하는 영화를 만들었다. 나는 밀레니얼 세대보다 밀레니얼 세대를 더 잘 알고 있다.’였다. 카젠버그는  직관을 잘 활용해 왔으며,  직관의 날카로움에 관한 확신을 가지고 있었다. 휘트먼은 대조적인 스타일로 “데이터가 어디에 있나?”라고 말했으나 “아무것도 없다. 단지 직감으로 가야한다”고 그는 말했다.eng

Katzenberg and Whitman also point out that they stocked the Quibi offices with young employees who are in the demographic they’re trying to reach. But “there was an incredible lack of knowledge of the audience and dismissiveness of the audience,” another ex-Quibite says. “A thing Jeffrey always says is ‘I’m not a child or mother, but I made movies children and mothers loved. I know millennials better than millennials.’ ” Katzenberg had at times been well served by his intuition, and he remained convinced of its acuity. “I say, ‘Where’s your data?,’ ” Whitman says of their contrasting styles. “He says, ‘There is none. You just have to go with your gut.’ ”

 

플랫폼 경쟁 상황에서 A급 콘텐츠에 대한 투자는 단순히 양을 늘리는 것 보다 효과적임에도 퀴비가 실패한 이유는 무엇인가? 단순히 고객에 대한 타깃팅의 문제보다는 벤 톰슨의 설명(Never-ending Niches)이 조금 더 적절해보인다. 결국은 인터넷으로 인해 영화나 TV와는 완전히 다르다는 것이다. 모바일에 관한 문제가 아니라는 것

영화와 텔레비전 모두에서 가장 중요한 사실은 희소성으로 정의되었다는 것입니다. 극장 슬롯 만 가득 채울 영화가 너무 많았고 TV의 경우 하루 24 시간 밖에 없었습니다. 프로그램이 만들어지기 전에 무엇이 히트하게 될지 알아 낸 다음 그것을 만들기 위해 투자 할 수 있는 누군가가 되는것은 상당한 가치가 있었다는 것을 의미한다. 이러한 종류의 선택과 제작은 카젠버그와 나머지 할리우드 사람들이 수십 년 동안 해왔 던 일이며, 카젠버그는 자신이 동일한 공식을 모바일에 적용 할 수 있다고 생각한 것이 이해할 만합니다. 그러나 모바일은 인터넷에 의해 정의됩니다. 즉, 풍부함에 의해 정의됩니다. 목표는 타깃을 골라내는 것이 아니라 가능한 한 많은 콘텐츠를 끌어들이는 것입니다.eng

The single most important fact about both movies and television is that they were defined by scarcity: there were only so many movies that would ever be made to fill only so many theater slots, and in the case of TV, there were only 24 hours in a day. That meant that there was significant value in being someone who could figure out what was going to be a hit before it was ever created, and then investing to make it so. That sort of selection and production is what Katzenberg and the rest of Hollywood have been doing for decades, and it’s understandable that Katzenberg thought he could apply the same formula to mobile. Mobile, though, is defined by the Internet, which is to say it is defined by abundance…The goal is not to pick out the hits, but rather to attract as much content as possible, and then algorithmically boost whatever turns out to be good.

 

하드웨어-소프트웨어 플랫폼과 다르게 인터넷의 논리가 지배받는 공간에서는 알고리즘이 작동하고 되도록 많은 콘텐츠를 보유하는 것 자체가 플랫폼 경쟁에서 더 중요할 수도 있다는 이야기.

 

By |2020-07-09T00:19:07+09:007월 9th, 2020|Media|0 댓글

사회적 거리에 대한 사진 보도

SLIDESHOW: Uproar reaction over social distancing at beaches a matter of perspective

 

사회적 거리두기와 관련된 다양한 보도 사진이 나오고 있는데 촬영 방식에 따라 다르게 보일 수 있는 장면에 대한 사례. 사실 이런 종류의 사진은 우리나라에서 굉장히 흔한편(?)이지만 예시로 사용할 수 있는 사진이라 기록용으로 업로드한다.

위 사진은 200-400mm 정도 망원렌즈로 찍은 사진이라 공간이 압축되어 보이는 효과가 발생한다. 하지만 다른 관점에서 바라본 사진은 적절하게 사회적 거리두기가 유지되고 있는 모습을 발견할 수 있다.

By |2020-05-12T16:40:35+09:005월 12th, 2020|Media|0 댓글
Go to Top