특허청, 의약품 실험·인공지능 학습 ‘데이터 45만건’ 무료 개방
[아시아경제(대전) 정일웅 기자] 특허청은 특허공보에 포함된 의약품 실험 데이터와 실험 데이터 추출을 위한 인공지능 학습 데이터 등 45만건의 정보를 무료로 공개한다고 12일 밝혔다.
관련 데이터는 13일부터 키프리스플러스를 통해 확인할 수 있다.
개방될 의약품 실험데이터는 의약품 분야의 특허공보에 포함된 이미지(그림) 형태의 표를 가공·분석해 의약품 성분명, 실험방법, 실험값 등을 데이터베이스로 구축한 정보다.
인공지능 학습데이터는 표·그래프·화학식 등 다양한 이미지 형태의 실험 데이터에서 표 형태만을 추출하기 위한 이미지 분류 정보, 표 데이터를 정확하게 파악하기 위한 표 구조(행×열) 정보 및 실험에 사용된 성분명, 실험값 등을 자동분류하기 위한 실험데이터 속성 분류 정보 등을 포함한다.
의약품 실험 데이터 및 인공지능 학습 데이터를 활용하면 특허·논문 등에 포함된 이미지 형태의 ‘표 실험데이터’를 문자 형식의 분석 가능한 데이터로 변환 추출할 수 있다.
이를 기반으로 지식재산 서비스 업체는 특허공보의 실험데이터 추출·활용 서비스를 개발하고 관련 기업 및 연구기관은 특허공보에 포함된 실험 실시 예, 비교에 등을 자유롭게 분석해 백신·신약 등 연구개발에 활용할 수 있을 것으로 특허청은 기대한다.
한편 키프리스플러스는 특허청이 운영하는 데이터 개방 플랫폼으로 국내외 13개국 주요 산업재산권(특허·상표·디자인) 공보와 특허 행정 정보 등 데이터 상품을 제공한다.
최근에는 다국어 번역, 이미지 검색 등을 위한 인공지능 학습데이터까지 개방해 총 115종의 데이터 상품을 파일 또는 OpenAPI(Open Application Programming Interface) 형태로 개방하고 있다.
꼭 봐야 할 주요 뉴스
100조 날리게 생겼는데…"삼성 파업은 역대급 특수...
OpenAPI는 표준화로 구축한 데이터를 누구나 실시간 호출해 활용할 수 있게 하는 공개 인터페이스다.
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>