NYT lab, The Future of News Is Not An Article

페이스북의 인스턴트 아티클이나 애플 뉴스가 불러온 논쟁은 미래의 플랫폼이나 퍼블리셔와의 관계에 대해 많은 논의를 이끌어냈지만 뉴스가 배포되는 형태와 구조에 대한 질문은 이루어지지 않았다고 언급한다. 현재 일반적으로 받아들여지는 아티클 형태의 방식은 종이신문 혹은 초기 웹의 제약 아래에서 발전되어 온 것이다. 이 글에서 언급하는 것은 뉴스 기사의 구조화와 관련된 이야기이다.

출간된 모든 아티클 안에 있는 지식을 활용하기 위해서, 우리는 우선 그것을 검색하고 추출할 수 있는 형태로 변환할 필요가 있다. 이것은 아티클이 만들어지는 과정 안에서 향후 다시 사용 가능한 정보 조각을 발견할 수 있게하고 주석을 다는 것을 의미한다. 이것은 우리 뉴욕타임즈 R&D 랩에서 파티클(Particle)이라고 불러온 것의 일부분이다. 이러한 개념은 한동안 시맨틱 웹이라는 논의 아래서 이야기되어왔던 – 하지만 그렇게 하는데 있어 필요한 노동비용으로 인해 보편적으로 채택되기 어려웠던 – 아이디어를 만들어낸다. 우리는 이러한 종류의 주석과 태깅을 하는데 필요로 하는 부담을 줄일 수 있게 만드는 접근을 연구해왔다.

In order to leverage the knowledge that is inside every article published, we need to first encode it in a way that makes it searchable and extractable. This means identifying and annotating the potentially reusable pieces of information within an article as it is being written – bits that we in The New York Times R&D Lab have been calling Particles. This concept builds on ideas that have been discussed under the rubric of the Semantic Web for quite a while, but have not seen universal adoption because of the labor costs involved in doing so. At the Lab, we have been working on approaches to this kind of annotation and tagging that would greatly reduce the burden of work required.