[아이뉴스24 김혜경 기자] "인공지능(AI) 기술 개발은 50년 동안 부흥기와 빙하기를 반복해왔다. AI 연구가 침체기를 겪었던 이유는 '한스 모라벡의 역설' 때문이다. 인간에게 어려운 것은 기계에 쉽지만 인간에게 쉬운 건 기계에 어렵다는 내용이다. 챗GPT 등장으로 대전환을 맞이하면서 장기적으로 AI 부흥을 이끌지 주목된다."
신동호 무하유 대표이사는 최근 서울 성수동에서 진행된 아이뉴스24와의 인터뷰에서 AI 기술 전망에 대해 이같이 말했다. 2011년 설립된 무하유는 자연어 처리 AI 기술에 특화된 기업으로, 서류검토 자동화 솔루션 개발을 핵심 사업으로 삼고 있다. 이 회사의 '카피킬러'는 국내 대표 표절 검사 서비스로 자리잡았다.
신 대표는 "대학원에 다닐 때만 해도 머신러닝은 한계가 있다는 이야기가 나왔고 실험실 수준을 벗어나지 못했다"면서 "딥러닝이 등장하면서 AI 분야에 다시 붐이 일었다"고 전했다. 이어 "인간의 언어는 컴퓨터가 습득하기엔 만만치 않은데 챗GPT는 언어생성이 자연스럽다는 것이 충격적"이라며 "방대한 양의 파라미터를 학습한다고 해서 될까 싶었는데 챗GPT의 문법 지식은 경험으로 습득했다고 봐도 이상하지 않은 수준"이라고 덧붙였다.
◆카피킬러로 표절 인식 달라져…'점검 용도'로 써야
컴퓨터 공학을 전공한 신 대표는 25년 넘게 AI 분야에 몸담고 있다. 검색엔진 개발 분야에 종사했던 그는 각종 문서가 폭발적으로 늘어나는 현상을 목도하면서 방대한 양의 서류를 검토할 수 있는 솔루션이 필요하다고 여겼다. 그래서 창업한 회사가 무하유다.
신 대표는 "논문이나 보고서를 쓰기 위해서는 선행연구 등을 인용해야 하는데 정당하게 사용한 범주와 정당하게 사용하지 않은 범주가 있을 수 있다"며 "카피킬러가 찾아내는 것은 타인의 저작물을 가져왔지만 출처를 표시하지 않고 쓰는 경우"라고 말했다.
카피킬러는 자체 보유하고 있는 데이터베이스와 검증 대상 문서를 비교해 표절률을 계산한다. 표절률은 검증 대상 문서를 구성하는 전체 어절(띄어쓰기 단위)에서 표절 의심 영역 내 포함된 어절을 나눠 계산한다. 1000자 가운데 100자가 표절이 의심되는 영역이라면 표절률은 10%인 셈이다.
신 대표는 "어절 단위로 표절률을 계산하는 이유는 객관적인 기준 내에서 표절 시비를 가리기 위해서"라며 "어절 표절검사의 한계를 극복하기 위해 표현 바꿔쓰기(패러프레이즈)를 판별할 수 있는 기술도 개발해 현재 시범 운영하고 있지만 높은 수준의 엄격성이 요구된다는 점에서 신중하게 접근하고 있는 상황"이라고 전했다.
그는 "카피킬러 도입으로 타인의 저작물을 무단 도용하면 안 된다는 인식이 사회에 자리잡았다는 점은 긍정적"이라며 "표절검사 시스템은 적발을 위한 목적이 아닌 맞춤법 검사처럼 스스로 점검하는 용도로 사용하는 것이 맞다고 본다"고 했다.
무하유는 국내 성공을 바탕으로 지난해부터 일본 시장을 두드리고 있다. 신 대표는 “일본에서는 아직까지 타사 표절검사 솔루션의 점유율이 높은 상황이지만 충분히 승산이 있다고 보고 있다”며 "향후 중국 시장에도 진출할 계획"이라고 말했다.
/김혜경 기자(hkmind9000@inews24.com)
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기