[65호]2021 국제인공지능대전
AI and Digital Transformation
2021 국제인공지능대전
글 | 박진아 기자 jin@ntrex.co.kr
(사)한국인공지능협회, ㈜서울메쎄, 인공지능신문이 주최, 주관한 2021 국제인공지능대전이 지난 2021년 3월 24일부터 26일까지 3일간 코엑스에서 진행됐다.
이번 국제인공지능대전은 네이버클라우드, 한국마이크로소프트, 메가존클라우드, 에이모, 크라우드웍스, 인피닉 등 AI 전문기업 150여개사와 기관의 참가해 215부스 규모로 인공지능의 최신 기술과 플랫폼·솔루션, 인공지능 기반 비즈니스 모델, 인공지능 적용 및 도입 전략 등 4차 산업혁명 시대를 혁신으로 이끌 인공지능에 대한 모든 것을 한눈에 확인할 수 있다.
인공지능 전시 외에도 인공지능 전문가들이 참여하는 전문 세미나, 컨퍼런스 등 다양한 행사도 함께 진행되었으며, 정부가 AI 학습을 위한 데이터 구축 사업에만 올해도 수천억원 규모를 투자함에 따라 데이터 가공 서비스와 데이터 라벨링 자동화 플랫폼을 선보인 기업들을 가장 많이 볼 수 있었다.
전시장에 입장하면 가장 먼저 좌측 네이버 클라우드 플랫폼 부스와 우측 에이모 부스를 확인할 수 있었다. 기자는 먼저 익숙한 네이버 클라우드 플랫폼 부스를 방문해 보았다. 해당 부스는 오후 2시가 안 된 시간이었는데도 불구하고 부스에서 나눠주는 팸플릿이나 관련 자료집이 다 동이 난 상태였다. 부스에 전시된 정보를 보면 다양한 문서 형식부터 손글씨까지 정확하게 인식하는 OCR 서비스와 Ai Call 서비스를 확인할 수 있었는데 여기서 OCR이란 사람이 쓰거나 기계로 인쇄한 문자의 영상을 이미지 스캐너로 획득하여 기계가 읽을 수 있는 문자로 변환하는 것을 말한다. 사업자등록증을 온라인으로 첨부할 경우 기존에는 담당자가 수기로 정보를 확인하고 처리하여 시간이 많이 소요되었다면 이 기술을 활용하면 글자 위치를 찾고 어떤 글자인지 자동으로 알아낼 수 있다. 네이버의 Clova AI 기술을 활용하여 주요 비즈니스 활용에 최적화된 고성능 OCR 인식 모델이 적용되었고 한국어, 영어, 일본어, 활자체 및 필기체도 인식이 가능하며 등록된 템플릿의 유사도를 통해 자동 분류가 가능하다. Ai Call은 인공지능 기술 및 음성을 활용하여 사람과 자연스럽게 통화가 가능한 대화형 AI 서비스로 전화를 통한 24시간 문의 응대 및 예약등이 가능하다고 한다. 이런 서비스 뿐만아니라 네이버 클라우드 플랫폼 자체가 갖는 데이터 수집, 저장, 다루는 기능자체도 4차 산업혁명 기술 및 AI, 빅데이터 기술에서 빠질 수 없는 요소이기 때문에 앞으로 클라우드 기술의 발전과 활용이 기대된다.
데이터 대표 기업인 에이모에서는 머신러닝과 인공지능 개발을 돕는 데이터 플랫폼을 선보이며 ‘에이모 엔터프라이즈’ 플랫폼에 AI 라벨링 자동화 기능을 추가해 데이터 라벨러들의 학습 데이터 가공 편의성을 높인 업그레이드 버전을 체험하는 기회를 제공했다.
인공지능을 사용하기 위해서는 다양한 데이터를 주입해야 하는데 AI는 사람이 사용하는 문서, 사진 등을 학습없이 식별할 수 없다. 데이터 라벨링은 인공지능 알고리즘 고도화를 위해 AI가 스스로 학습할 수 있는 형태로 데이터를 가공하는 작업을 말하며 문서, 사진, 동영상에 등장하는 모든 것에 라벨을 달아 AI에 주입하면 AI는 이를 바탕으로 데이터들을 학습하면서 유사한 이미지를 인식할 수 있다고 한다.
에이모 엔터프라이즈는 별도 프로그램 설치나 개발자 도움 없이도 준비된 툴을 누구나 이용할 수 있는 직관적인 UI를 제공하여 사용자가 쉽게 레이블링 작업을 설계할 수 있다. AI 학습 데이터 라벨링이 필요한 기업, 기관, 개인이 데이터 라벨링 프로젝트 설계, 작업자 초대, 학습 데이터 라벨링, 산출 관리 모두 직접 가능하며 2D, 3D, Video와 같이 다양한 유형의 데이터에 알맞은 툴로 정확하고 편리하게 작업할 수 있다.
인공지능, 전자문서 전문기업 사이냅소프트에서는 여러대의 컴퓨터를 두고 데이터 레이블링을 시연하고 있었다. 사이냅소프트는 국내 전자문서 시장점유율 1위 기업으로 전자문서 처리 노하우와 기술력을 바탕으로 자체 인공지능 기술을 확보해나가고 있으며, 데이터 레이블링은 인공지능 사업 분야에서 가장주목 받고 있는 기술 중 하나로 이미지, 비디오, 음성, 텍스트 등 다양한 유형의 데이터를 수집 및 가공하고 검수하는 서비스를 제공한다.
당일 레이블캠프와 사이냅 OCR의 성능을 체험하며 설명도 함께 들을 수 있었는데 사이냅 OCR은 AI 딥러닝 기반 문자인식으로 높은 인식률과 빠른 인식 속도와 자체 렌더링 기술로 다량의 학습 데이터를 확보하고 있어 미학습글꼴, 왜곡, 노이즈 등 인식 방해에 강한 특징을 갖고 있다.
한글, 영문, 숫자, 특수 기호를 인식하며 아직은 손글씨 인식은 조금 어렵다고 하나, 현장에서 뚜렷하게 작성된 손글씨는 데이터화 하는 모습도 살펴볼 수 있었다.
레이블 캠프는 크라우드소싱 방식으로 대량의 고품질 데이터를 빠르게 수집 및 가공하는 플랫폼으로 바운딩 박스 등 다양한 어노테이션 도구를 활용한 이미지 라벨링 작업은 물론이고, 물체를 자동으로 가공해 주는 오토 레이블링 기술이 탑재되어 있다. 두번째 이미지 화면에서 빨간색으로 표시되는 부분은 인식하지 못한 부분이라고 하며, 오토 레이블링을 이용해서 작업자는 잘못된 위치만 수정하면 되기 때문에 작업자의 데이터 가공, 작업시간을 현저히 줄여줄 수 있을 것으로 보였다. 이처럼 가독성 높은 시연화면과 상세한 설명으로 해당 부스에는 관람객들의 발길이 끊이지 않았다.
관람객들이 가상현실과 연결되는 장치 착용하고 흥미롭게 체험을 즐기고 있던 부스로는 XR LIFE TWIN인 XR 플랫폼을 선보인 프론티스를 확인할 수 있었다. 프론티스는 AIOT, 5G, AI, VR, MR 기술 기반 맞춤형 솔루션을 개발하는 전문 기업으로 ICT 융복합기술연구소는 4차 산업혁명의 선두주자로 가상증강현실기술과 인공지능의 융복합, 컴퓨터비전, 실감기술, 위치기반 솔루션의 심층연구를 수행하고 있다.
XR 플랫폼으로는 XR 판도라, XR 라이프트윈, XR 워크트윈이 있으며, 사용자의 신체정보 및 햅틱 장비를 통해 높은 몰입감과 현실감을 제공하여 교육 효과를 극대화할 수 있으며, 다수의 사용자가 시간과 장소에 구애받지 않는 장점이 있다. 또한, 높은 접근성, 원거리에 작업자 간 음성 대화 및 영상 공유 기능을 제공하여 시/공간적 제약을 해소해 빠른 업무처리가 가능한 특징이 있는 플랫폼이다.
관람객은 이중 XR 라이프트윈으로 나를 대신하는 아바타가 내 삶을 공유하는 또 다른 세상을 보여주는 메타버스 세컨드 라이프 클라우드 플랫폼을 체험하고 있었다. 라이프트윈을 통하면 비대면으로 강의를 수강할 수도 있고, 직접 강의를 준비하고 진행할 수도 있다고 한다. 하나의 메타버스 시티 당 다수의 아바타가 동시접속이 가능한 클라우드 플랫폼으로 블록체인 디지털 화폐 금융서비스를 도입하여 아바타간 거래 가능한 모든 가상의 동산, 부동산 자산가치를 부여한다. 해당 플랫폼을 이용하여 학교, 일반인 모임, 메타버스 영환관, 박물관등의 비즈니스를 운영할 수 있고, 다양한 VR 콘텐츠 체험, VR 마켓 플레이스로 이용될 수 있다고 한다.
증강현실 관련한 부스로는 마이크로소프트(Microsoft)사의 홀로렌즈2(Hololens 2)를 확인할 수 있었다. 증강현실 디바이스를 착용하면 사람이 작업할 때 Human error를 줄이기 위해 무슨 작업을 해야 하는지 홀로 렌즈가 알려준다.
증강현실이란 실세계에 3차원 가상물체를 겹쳐 보여주는 기술로 한 때 유행했던 포켓몬 Go를 생각하면 이해가 쉬울 것이다. 현장에서 체험할 수 있었던 홀로렌즈 2는 산업용 버전으로 셋팅되어 있었고, 일반용 버전도 있다고 한다. 홀로렌즈 2는 다이얼 인 핏 시스템으로 설계되어 장시간 착용 시에도 편안한 착용감을 제공하고, 바이저를 위로 올리면 손쉽게 혼합 현실에서 빠져나올 수 있다.
시야각을 넓혀 더 많은 홀로그램을 한 번에 볼 수 있으며 업계 최고의 해상도로 텍스트를 읽고 3D 이미지의 복잡한 세부 사항을 보다 쉽게 확인할 수 있다. 그중에서도 가장 큰 편리함은 전선이나 외부 부속물이 없는 디바이스로 움직임을 방해하지 않는 것과 홀로그램을 자연스럽게 터치하고 만지고 움직일 수 있는게 아닐까 한다.
주식회사 증강지능에서는 스마트 팩토리를 위한 증강현실 플랫폼을 선보였다. 인공지능, 증강현실 기술과 관련된 제품 및 솔루션을 개발하는 증강지능은 인하대학교 인공지능연구실에서 창업한 기업이다.
IAR-MAP은 인공지능과 증강현실이 융합된 플랫폼으로서 작업 상황에 대한 기술 정보들을 각 작업자의 시야 내에서 실시간으로 증강시켜주는 산업용 증강현실 솔루션이라고 한다. 매뉴얼의 그림과 실제 부품을 하나씩 비교해 볼 필요가 없으며, 복잡한 매뉴얼을 살펴보며 고민하지 않아도 되는 장점이 있다고 한다.
IAR-MAP의 주요 기능을 살펴보면 클라우드의 레거시 정보와 연결된 AR 콘텐츠로 한 서버에서 각 작업자들에게 작업지시문서를 할당할 수 있고, Knowledge Manager와 Contents Creator는 레거시 기술문서를 지식으로 변환하고, AR콘텐츠를 효율적으로 빠르게 제작할 수 있도록 도와준다. 또한, 실감형 기술자 훈련 및 교육, AR 기반 원격 정비 등 이 가능하다고 한다. 해당 제품은 스마트 팩토리 및 항공기, 국방, 자동차, 조선, 의료 및 교육 등 다양한 산업분야에서 활용이 가능해 보였다.
비전문가 대상의 딥러닝 비전 소프트웨어 기업 뉴로클(NEUROCLE)에서는 뉴로티(Neuro-T)와 뉴로알(Neuro-R)을 선보였다. 뉴로티는 이미지 해석용 딥러닝 모델을 생성할 수 있는 범용 소프트웨어로 사용자가 GUI상에서 이미지 데이터를 자유롭게 관리할 수 있으며 자체 Auto Deep Learning 알고리즘을 활용하여 코딩없이도 최적의 모델을 생성한다. 뉴로알은 뉴로티에서 생성된 모델을 현장에 적용할 수 있는 런타임 API로 대규모 서버 PC부터 임베디드 프로세서까지 다양한 플랫폼을 지원하면 각 플랫폼에 최적화된 인퍼런스를 제공한다.
Auto Deep Learning을 통해 재학습 과정이 불필요하며 외부 이해관계자의 개입이 없어 빠른 기술 도입이 가능한 점이 특징이다. 또한, 학습한 딥러닝 모델을 활용하여 새로운 Data에 대해 이미지 자동 판독이 가능하여, 의료 이미지 해석, 제품 표면 검사, 얼굴 인식, 자동차 번호판, 제조업의 양품·불량품 검사에 활용할 수 있다고 한다. 전시장에서는 딥러닝을 통해 제품의 파손영역을 인식하는 모습을 확인할 수 있었다.
딥러닝 기술을 활용하여 축산 분야의 개체 관리를 효율적으로 바꾼 기업도 볼 수 있었다. 인트플로우 주식회사의 비접촉 축산개체관리 솔루션 엣지팜 카우는 체내에 삽입하거나 부착하는 물리적 방법이 아닌 오로지 영상 분석 기술로만 실현하는 개체관리 시스템으로 엣지팜 카우 메니저, 고정형 CCTV(8채널)로 소의 이상행동을 감지하고 실시간으로 전송한다.
기존 농가에서는 송아지 폐사율을 낮추기 위해 한 마리 한 마리 일일이 직접 소의 건강 상태를 체크하며 24시간 축사에 상주해야 했지만, 엣지팜 카우를 사용하면 AI가 실시간으로 돼지의 식사 횟수부터 활동량, 이상행동 빈도, 질병 여부 확인까지 꼼꼼하게 관리할 수 있다고 한다.
번식부터 출하까지 모든 이력을 통합된 빅데이터 플랫폼에서 관리하며 컴퓨터와 스마트폰으로 어디서든 이용할 수 있으나 월정액을 납부해야한다. 소의 분만, 발정 등 중요한 일도 카카오톡 알림+영상 클립을 통해 바로 확인할 수 있어 효율적인 개체관리가 가능해 보인다.
후원사인 한국전자통신연구원(ETRI)부스에서는 AI 범죄·치안 관련 기술인 치안 민원응대 폴봇 기술, 인공지능 얼굴정보 인식 기술, 지능형 범죄 위험도 예측기술을 선보였다.
폴봇 기술은 치안 분야 전화민원 상의 음성을 인식하고 대화 의도를 파악함으로써 치안 지식을 활용한 양방향 음성 대화 기반 치안 민원 자동응대 기술이다. 전화콜 음성데이터를 전사 및 전처리한 후 음성 모델 및 언어모델을 기반으로 음성 내용을 분석한다. 폴봇이 대화의 의도를 추론하고 기존 구축한 데이터베이스에서 의도에 맞는 응답의 텍스트 내용을 발화자 음성으로 합성해 전달한다. 폴봇 기술은 단순민원업무 전화상담 서비스, 실버세대 말동무 대화 서비스, 대화형 지역관광안내 서비스, 음성인식 대화형 학습도우미 분야에 적용될 것이며 상담인원은 고객 응대에 더욱 집중하여 민원응대 서비스 향상이 가능하다고 한다. 지능형 범죄 위험도 예측기술은 국민들의 치안 안전을 위해 각종 치안 정보를 통합·분석해 경찰에 신고된 사건의 유형과 위험 수준을 초기 인지하고 주변 인물 관계, 범죄 발생 주요 요인을 분석해 의사결정을 지원한다.
얼굴정보 인식 기술은 사람의 얼굴에서 나타나는 정보를 통합적으로 인식해 로봇이 사회적 상호작용 단서를 이해하고 적절히 반응함으로써 사람과 로봇 간의 자연스러운 상호작용을 가능하게 하는 기술이다.
Vision AI 기반 탐지, 추적, 식별, 검색 솔루션을 제공하는 넥스리얼(NEXREAL)에서는 인공지능 센서카메라와 AI기반 영상객체 탐지, 추적, 기술 솔루션을 전시했다. 솔루션은 자체 비전 AI 플랫폼을 내장한 카메라(AI@Camera) 및 게이트웨이(AI@Edge) 장비와 서버용 프로그램 S/W(AI @Server)로 구성된 3-Tier 분산·통합 시각인공지능(Vision AI) 솔루션을 의미한다.
이미지 하단에 보이는 사각형의 제품들은 AI 카메라와 AI 게이트웨이로 AI 카메라는 넥스리얼이 자체 설계 제작한 임베디드 Vision AI 플랫폼 모듈이 내장된 지능형 센서 카메라로 RGB 센서, Depth 센서(스테레오, 3D ToF), Thermal 센서(LWIR)와 선택적 결합해 2D AI 카메라, 3D AI 카메라, 열화상 AI 카메라 또는 멀티모달(RGB-Depth-Thermal) AI 카메라 형태로 제공된다. AI 게이트웨이는 RTSP 또는 HDMI 비디오 스트림을 수신하여 AI 기반 객체 탐지·추적·식별 등 영상분석을 수행하고, 영상분석 메타 데이터를 원본 비디오와 함께 RTSP로 재전송하는 변환장치라고 한다.
이러한 솔루션은 객체 탐지 추적, 이상행동 감지, 공항 자동출입국 심사대, 해안 경비 시스템 등 다양한 분야에서 활용된다고 한다.
이밖에도 AI 화상솔루션, 교육 솔루션, 비대면 입출입 기기 및 장비, 키오스크, 감지 및 식별 시스템, 금융, 유통 물류 등의 각종 솔루션과 기기를 참관하고 직접 시연할 수 있었다. 챗봇 및 어시트턴트, RPA, 5G·네트워크, IoT, 자율주행, 의료·헬스케어, 금융, 보안, 제조·유통·소매, AI로봇 등을 직접 체험하고 관련 인사이트를 공유하였다.
이번 국제인공지능대전은 8개국 138개사, 23,263명이 참관했으며 다양한 전시회들이 코로나로 인해 연기되었음에도 불구하고, 정해진 일정에 맞게 정상 개최된 국제인공지능대전 AI EXPO에는 첫날부터 많은 관람객이 인산인해를 이루는 모습을 볼 수 있었다. 코로나로 인해 입장 인원에 대한 제한이 있었기에 일부가 들어갔다 나오면 들어갈 수 있어 어쩔 수 없는 기다림의 시간도 있었지만, 인공지능, ICT, IoT 산업의 전체적인 동향과 발전된 기술을 한번에 확인할 수 있는 뜻깊은 전시회였다.
2020년 10월 개최했던 국제인공지능대전보다 규모도 크고, 개인적으로 볼거리나 얻을 수 있는 정보가 더 많았던 2021년 국제인공지능대전으로 생각된다. 내년에는 또 어떤 기술의 발전으로 관람객들을 놀라게 할지 기대해보며 이번 관람기를 마친다. DM