학술출판에서의 인공지능 활용과 윤리

서태설 | 과편협 정보관리위원장, 한국과학기술정보연구원 책임연구원

컴퓨팅 파워, 빅데이터, 알고리즘 등의 발전으로 인공지능(artificial intelligence, AI)이 보편화되고 있다. 학술출판의 영역도 예외는 아니다. 아직까지 초기단계이긴 하지만, 여러 출판사에서 이미 AI를 활용하고 있다. International Association of Scientific, Technical and Medical Publishers (STM)에서 발표하는 STM 보고서에 따르면, 출판사는 데이터 제공자, 내부 업무 프로세스 및 서비스 지원, 외부로 제공하는 도구와 서비스의 세 영역에서 AI와 관련이 있다고 한다[1].

첫째로, 학술지 출판사는 AI를 위한 데이터와 정보를 제공하는 핵심 기관이다. 학술지가 제공하는 AI용 학습 데이터는 품질이 우수하고, 신뢰성이 높으며, 윤리적인 결과물을 얻는 데 필수적인 요소 중의 하나로 자리 잡고 있다. 출판사들은 상호운용이 가능하고, 일관된 포맷으로 콘텐츠를 검증, 정규화, 태깅, 보강하고, 자료를 안정적으로 공급하며, 주제별 온톨로지(ontology)를 생성함으로써 다양한 분야에 AI를 활용할 수 있는 가능성과 품질을 보장한다.

(사례 1) SpringerNature 출판사는 각종 자연어 처리, 기계학습, 텍스트 분류, 지식 그래프 등의 시멘틱(semantic) 기술을 활용하여 특정 도메인의 온톨로지를 구축하고, 이를 통해 새로운 지식을 추론하고 있다.

(사례 2) Frontiers 출판사는 ARIA(artificial intelligence review assistant)라는 AI 도구를 개발하여 투고 원고와 심사 품질 개선에 활용하고 있다.

두 번째로, 학술지 출판사는 저자, 편집자, 심사자를 위한 내부 프로세스와 서비스를 지원하는 데 AI 활용을 늘려나가고 있다. AI는 저자에게 투고 학술지를 추천할 수 있고, 원고의 교정교열과 적정한 심사자 식별에 사용된다. 표절 검사와 데이터 조작 여부 확인에도 AI가 사용되고 있다. 뿐만 아니라, 논문 본문에서 중요 사실, 실체, 관계 등도 자동으로 추출하기도 한다.

(사례 3) Hindawi 출판사는 AI 언어 평가 도구를 투고 과정에 적용함으로써 비영어권 저자들 영어 논문의품 질 개선 효과를 보고 있다

(사례 4) 미국광학회(Optical Society of America)에서는 논문 출판 이력과 유사도 검사를 통해 최적의 후보 심사자를 추천하는 AI 도구를 개발하여 활용하고 있다.

셋째로, 학술지 출판사는 콘텐츠 분류 작업 및 독자와 저자를 위한 콘텐츠 추천용 외부 도구와 서비스에도 AI를 배치한다. 학술지 출판사는 AI를 통해 연구 트렌드 제공, 신약 개발 표적 식별 등과 같은 분석 및 인사이트(insight)를 제공하는 역할을 늘려나가고 있다.

(사례 5) Elsevier 출판사는 연구 데이터를 위한 FAIR 원칙에 입각해서 고품질의 데이터를 구축한 Entellect라는 데이터 통합 플랫폼을 개발하여, 연구자나 건강관리 전문가가 데이터로부터 통찰을 얻어 혁신을 할 수 있도록 돕는다.

(사례 6) 미국화학회(American Chemical Society)는 동료심사 시스템에 의미 분석과 출판 이력에 근거하여 투고 학술지 전환 제시를 할 수 있는 AI 도구를 연계하였다.

앞으로도 학술 출판 분야에서의 AI 활용 영역은 꾸준히 확대될 것으로 보인다. 그런데, 이 시점에서 한 가지 심각하게 생각해야 할 것이다. AI가 지속적으로 발전하여 사람의 지능을 초월하는 초인공지능(artificial super intelligence)이 등장하게 되면, AI의 사용자가 사람이 아니고, AI가 될 수도 있다. 그러한 시대가 되면 AI는 통제 불능이 될 수도 있을 것이기 때문에, AI는 단지 기술적으로만 접근해서는 안 된다고 한다[3]. 그래서 여러 나라와 기관에서는 이를 미연에 방지하기 위해 AI 윤리지침을 제정하고 있다. STM에서도 최근 “학술 커뮤니케이션에서의 AI 윤리”라는 보고서를 발간했다. 이 보고서에서는 윤리적이고 신뢰할 수 있는 AI를 위한 다섯 가지 원칙과 모범 사례를 제시하였다[1]. 그것은 투명성과 책임성(transparency and accountability), 품질과 진실성(quality and integrity), 프라이버시와 보안(privacy and security), 공정성(fairness), 지속가능한 개발(sustainable development) 등이다. 이 보고서는 초안의 성격이 강해서 계속 보완해 나갈 것으로 보이지만, 학술 출판계에서 AI를 도입할 때 참고할 필요가 있을 것으로 생각된다.

참고문헌

1. International Association for Scientific, Technical and Medical Publishers (STM). AI ethics in scholarly communication: STM AI White Paper [Internet]. Oxford; STM; 2021 Apr [accessed 2021 Apr 29]. Available from: https://www.stm-assoc.org/2021_05_11_STM_AI_White_Paper_April2021.pdf

2. Mugridge R, Hutt H. AI-assisted editorial tools: creating solutions for shared challenges through AI. 2021 CSE Annual Meeting; May 3-5, 2021.

3. 서태설. 데이터의 윤리적 활용. ICT 전문가 인터뷰. TTA Journal 2021;193호:6-13.

Copyright by Korean Council of Science Editors
The Korea Science & Technology Center 2nd floor, 22 Teheran-ro, 7-gil, Gangnam-gu, Seoul 06130, Korea
Tel: +82-2-3420-1390   Fax: +82-2-563-4931