본문 바로가기
유익한 정보

GPT-4, 처리단어량·기억력 대폭 상승… “범용 AI 현실화 훨씬 앞당겨" 네이버·카카오 '긴장'

by 현명한도미니카 2023. 3. 17.
728x90
반응형

챗 GPT 의 능력 향상

생성형 인공지능(AI) 챗GPT를 개발해 세계적 돌풍을 일으킨 오픈AI가 챗GPT에 적용된 GPT-3.5의 업그레이드 버전인 GPT-4를 공개하면서 구체적으로 어떻게 성능이 향상됐는지 이목이 집중되고 있다.

3월16일 정보기술(IT) 업계에 따르면 오픈AI는 지난 14일 대규모 AI 언어 모델(LLM) GPT-4를 공개했다.

 

한때 GPT-4는 GPT-3의 매개 변수(파라미터) 규모인 1천750억개를 아득히 뛰어넘은 1조개 이상의 매개 변수를 갖출 것이라는 추정이 나왔지만 오픈AI는 GPT-4 매개 변수 규모를 공개하지 않았다.

다만 업계에서는 확실히 '더 똑똑한 모델'이라는 평가가 나오고 있다.

 

이는 이미지를 보고 이해할 수 있게 됐고 언어 구사 능력과 기억력이 높아진 것은 물론 영어 이외의 외국어 실력도 전반적으로 향상 됐기 때문이다.

오픈AI에 따르면 GPT-4는 기존 GPT-3.5와 달리 텍스트뿐 아니라 이미지까지 여러 데이터 형태를 인식하는 멀티모달(복합 정보 처리) 모델이다.

 

문자로만 대화할 수 있었던 데서 사진과 문자를 결합한 질문도 이해하고 답변할 수 있게 발전한 것이다.

계란과 밀가루, 버터, 우유 사진을 올리고 "이걸로 요리할 수 있는 게 뭐지?"라고 물으면 "팬케이크나 와플, 프렌치토스트 등등"이라고 답하는 식이다.

 

언어 능력 자체도 향상됐다.

처리할 수 있는 단어량은 2만 5천 단어로 챗GPT보다 약 8배 늘어났고 GPT-4는 미국 모의 변호사 시험에서 90번째, 대학 입학 자격시험인 SAT 읽기·수학 시험에서는 각각 93번째와 89번째의 백분위수를 기록했는데 이는 상위 10% 수준이라고 오픈AI는 설명했다.

 

대화 내용을 기억할 수 있는 능력도 대폭 늘어났다.

미국 정보기술(IT) 전문 매체 테크크런치는 "GPT 3.5는 책 4∼5페이지에 해당하는 4천96 토큰(메모리 단위)을 보유했는데 GPT-4는 최대 책 50페이지 수준인 3만2천768 토큰을 보유했다"면서 "희곡이나 단편 하나를 통째로 외울 수 있다는 의미"라고 소개했다.

 

특히 GPT-3.5의 고질적 문제였던 '할루시네이션(환각) 현상'도 크게 줄었다고 오픈 AI는 설명했다.

이는 AI가 틀린 정보나 무의미한 내용을 마치 환각을 보는 듯이 그럴듯하게 제시하는 현상이다.

오픈AI는 " GPT-4는 내부 사실성 평가에서 최신 GPT-3.5보다 40% 높은 점수를 받았다"고 했다.

 

네이버 카카오 긴장

 

한국어를 비롯한 비영어 언어 성능이 높아진 점도 주목된다. 오픈AI가 시험한 26개 언어 가운데 GPT-4는 한국어와 일본어, 프랑스어 등 24개 언어에서 GPT-3.5가 영어를 하는 수준보다 더 높은 성능을 보였다.

 

이는 국내에서 생성형 AI를 개발하는 네이버와 카카오 등을 가장 긴장하게 하는 지점이다.

두 회사는 GPT-4가 어떤 반향을 부를지 주목 하면서 한국어 특화 대규모 언어모델 개발에 더 집중하겠다는 입장을 밝혔다.

 

네이버 관계자는 "진행 중인 하이퍼클로바X 프로젝트를 기반으로 초대규모 AI 생태계를 확대하고 새로운 검색 경험인 서치GPT를 통해 AI 기술 경쟁력을 확보해 나갈 예정"이라고 언급했다.

또한 카카오 관계자는 "AI 자회사 카카오브레인을 통해 한국어 특화 언어모델 KoGPT(코지피티) 연구에 박차를 가할 것"이라며 "복잡한 문맥과 뉘앙스 등도 철저히 연구해 한국어를 누구보다 더 잘하는 모델을 만들겠다"고 주장했다.

 

GPT-4가 혁신적인 변화이기는 하지만 아직 인간과 동일한 수준의 능력을 갖춘 것은 아니라 엉뚱한 답을 내놓을 수 있다는 한계가 있다.

 

AI 스타트업 업스테이지의 박은정 최고과학책임자(CSO)는 "GPT-4가 범용 인공지능(AGI) 수준에 도달하지 못한 것은 맞지만 '머나먼 미래'였던 예전보다 훨씬 가까워졌다”며 "검색 대상인 콘텐츠가 대부분 기계에 의해 만들어지며 인간이 만든 것과 구분하기 어려울 정도가 되면서 양질의 콘텐츠를 가려내는 게 또 다른 도전과제가 될 것"이라고 덧붙였다.

 

활짝 열린 인공지능 시대… AI 담당임원 'CAIO'가 떴다 -달라진 생각

신기빈 올거나이즈 CAIO

제발, 최고인공지능책임자(CAIO·Chief Artificial Intelligence Officer)를 고용하지 마세요.

(2017년 3월)


미국 노스웨스턴대학 컴퓨터과학과 교수이자 인공지능 스타트업 내러티브 사이언스의 공동창업자인 크리스티안 해먼드가 2017년 3월 경영 전문지 하버드 비즈니스 리뷰에 기고한 글(https://hbr.org/2017/03/please-dont-hire-a-chief-artificial-intelligence-officer)의 제목이다. 때는 2016년 3월 이세돌과 알파고의 바둑 대결의 열기가 채 가시지 않았던 시점이다.

해먼드 교수는 간청했다. 그는 "CAIO는 본질적으로 문제라는 '못'에 AI라는 '망치'를 들이대는 것이 목표인 사람"이라면서 "우리는 이미 AI의 작동과 적용이 시기상조일 수 있다는 것을 경험했다"고 주장했다. 그는 또 만류했다. "AI는 마법이 아니다. AI를 위해 마법사나 유니콘을 고용할 필요가 없다"고. 기업에 AI 전담 임원을 두면 지나치게 AI 활용성에 매몰된 경영전략을 구사하게 된다는 우려였다.

                                                                                         게티이미지뱅크

그로부터 6년 뒤인 지난 올해 2023년 2월. 미국 비즈니스 잡지 패스트컴퍼니에는 과거 해먼드 교수의 주장과 정면 배치되는 글(https://www.fastcompany.com/90847356/every-fortune-500-business-needs-a-chief-ai-officer)이 실렸다. 그 글의 제목은 이랬다.

 

포춘 500대 기업은 왜 CAIO가 필요할까.(2023년2월)


미국 음성인식 AI 스타트업 어셈블리 AI의 창업자 딜런 폭스는 "AI는 이제 대세"라면서 "AI를 제품, 운영, 비즈니스 전략에 통합하지 않는 기업은 경쟁력을 유지하기 힘들 것"이라고 내다봤다. 폭스는 단호했다. 그는 "훌륭한 머신러닝(기계학습) 과학자와 데이터 분석가를 고용하는 것만으로는 충분치 않다"면서 "CAIO는 기업이 장기적인 성공을 거두기 위해 AI 전략을 개발하는데 중대한 역할을 할 것"이라고 말했다.

두 글은 불과 6년 만에 기업 경영에서 AI의 위상이 얼마나 높아졌는지를 극명하게 보여주는 사례다. 한때는 거추장스러운 기술 취급을 받던 AI는 이제 거스를 수 없는 파도가 되어 전 산업계를 덮치는 중이다. 지난해 11월 30일 등장한 오픈AI의 챗GPT가 새 물결의 기점이 됐다.

국내 한 스타트업은 이 물결이 시작되기 직전, 폭스의 제언처럼 CAIO 직을 신설했다. 기업을 대상으로 인공지능 챗봇 솔루션을 제공하는 스타트업 올거나이즈(Allganize)다. 지난해 12월 최고기술책임자(CTO)에서 최고인공지능책임자로 변신한 신기빈 올거나이즈 CAIO를 만나, AI 분야를 총괄하는 다소 생소한 책임임원, CAIO에 대해 들어봤다. 이하 일문일답.

                                                               신기빈 올거나이즈 CAIO

-올거나이즈가 지난해 말 CTO(기술)직과 CAIO(인공지능) 직을 분리한 이유가 무엇일까요?

"올거나이즈는 AI 기술을 이용한 제품(챗봇 '알리')을 고객사들에게 제공하는 회사입니다. AI를 구현하는 기술과 제품을 만드는 기술은 서로 뗄래야 뗄 수 없는 관계죠. 그런데 사실 양쪽 성격이 많이 다릅니다. 우선 AI 모델을 개발하는 일은 호흡이 길어요. 제품 개발은 상대적으로 짧습니다.

그렇다고 AI 모델의 성능을 개선시키는 작업이 덜 시급한 것도 아닙니다. 고객에게 최종적으로 전달되는 제품의 세세한 기능들을 챙기는 것도 무척 중요하죠. 저희는 이 두 가지 일을 한꺼번에 하는 것보다는 분리하는 게 맞다고 판단했습니다. CAIO CTO의 분리는 저희 기술의 변화를 좀 더 빨리, 적극적으로 이끌어내기 위한 결과죠."

-CAIO CTO의 업무 분담은 어떻게 되나요?

"CTO실 산하에는 많이 알려진 것처럼 △사용자 인터페이스 등을 개발하는 프론트엔드(Front-end) 엔지니어와, △서버 및 데이터를 관리하는 백엔드(Back-end) 엔지니어가 일하고 있습니다. 저희는 작은 규모의 스타트업이다 보니, CAIO실에서 AI 연구원과 AI 엔지니어 역할을 둘 다 하고 있습니다.

 

 AI 연구원은 AI 모델 개발에 더 집중하고, AI의 성능을 최대한으로 끌어올리는 역할을 합니다.

 AI 엔지니어는 AI가 데이터를 학습하고, 또 사용자에게 학습된 내용을 구현할 수 있도록 유지하고 관리해요. 올거나이즈는 별도의 데이터팀도 두고 있습니다. AI시대에서 '데이터는 쌀'이라고 하죠. 데이터가 없으면 AI가 가동되지 않습니다. 데이터팀은 온라인상의 데이터를 긁어 모으고(수집), 데이터 오류를 제거하고(정제), 데이터가 분류될 수 있도록 이름표를 다는 작업(태깅)을 맡고 있습니다."

-기능이 분화되고 난 뒤엔 어떤 변화가 있었나요?

"지난해 11월 오픈AI에서 챗GPT 를 공개한 뒤 말 그대로 세상이 뒤집어졌습니다. 저희도 챗GPT의 새로운 기술을 도입하고, 챗GPT를 저희 제품인 '알리'와 결합하면서 업무가 가중되었습니다. 다행히 CAIO실이 만들어진 이후라, 이 결합을 거의 한두 달 만에 완벽하게 해낼 수 있었습니다. 회사가 조직개편을 한 시기가 시류와 우연히 잘 맞아떨어진 셈이죠."

 

-롤모델로 삼았던 CAIO가 있었나요?

"처음 이창수 대표가 CTO였던 제게 직책을 신설해 업무를 조정해 보자고 제안했을 때만해도 CAIO는 꽤나 생소한 개념이었습니다. 2018년 '컴퓨터과학계의 노벨상'이라고 불리는 튜링상(수학자 앨런 튜링을 기리기 위한 상)을 받은 딥러닝(심층학습)의 '3대 천황'이 존재하는데요. 얀 르쾽, 제프리 힌턴, 요슈아 벤지오입니다. 이들 중 얀 르쾽이 현재 페이스북 운영사인 메타에서 최고AI과학자로 일하고 있죠. 얀 르쾽과 직책이 같다니 영광이었죠."

-CAIO에게 다른 C레벨들과는 달리 특별히 요구되는 덕목이 있을까요?

"네. 저희는 기업간 거래(B2B)를 하고 있다 보니, 고객사가 원하는 수준의 AI 모델을 빠르게 만들어 비즈니스 혁신을 돕는 게 가장 중요한 목표입니다. 무조건 성능이 뛰어난 AI 모델을 개발하는 게 능사는 아니죠. 예를 들어 항상 100% 정답을 말하는 AI를 개발했다고 가정해 볼까요? 그런데 질문에 대한 답이 하루 뒤에 나온다면 어떨까요? 쓸 수 없는 기술일 겁니다. CAIO도 너무 AI 연구에만 치우칠 게 아니라, 기업의 수요에 따라 모델을 개발해야 하죠."

 

 

AI 세 종류…초인공지능까진 아직 먼 길

 

 

챗GPT, AGI 꿈 앞당겼지만 아직 기능 제한된 ANI…ASI 등장이 특이점 부를까


 사람과 비슷한 수준으로 대화할 수 있는 인공지능(AI) 챗봇 챗GPT가 세계적 선풍을 일으키면서 AI의 종류에도 관심이 쏠린다.

7일 정보기술(IT) 업계에 따르면 학계와 업계에서는 AI를 지능화 수준과 적용 범위에 따라 크게 세 가지로 분류한다.

챗GPT 등장으로 주목받는 '범용 인공지능(AGI)'과 인류의 지능을 뛰어넘어 스스로 목표를 설정하고 지식을 강화하는 '초인공지능(ASI)', 그리고 특정 작업만 수행할 수 있지만, 현재 가장 널리 활용하는 '제한적 인공지능(ANI)'이다.

우선 AGI는 말 그대로 특정 분야뿐 아니라 사람과 비슷하거나 어느 정도 뛰어넘는 수준으로 새로운 상황에 맞춰 학습하고 해결책을 찾을 수 있는 인공지능이다.


당초에는 미국 AI 학자 레이먼드 커즈와일이 2005년 저서 '특이점이 온다'에서 밝힌 바와 같이 2029년에 실현될 것으로 예상됐다. 이 시점은 챗GPT와 구글의 바드가 최근 대규모 AI 모델의 잠재력을 입증하면서 더 앞당겨질 수 있다는 추측이 나온다.

다만 챗GPT가 AGI의 윤곽을 그려볼 출발점일 수는 있어도, AGI는 아니라는 것이 업계의 중론이다. 챗GPT가 아직 인간이 할 수 있는 지적인 업무를 모두 해낼 수 없고 기능 분야가 제한적이어서다.

AGI가 인간보다 훨씬 뛰어난 지적 능력과 의지를 갖추고 행동할 수 있을 정도로 발전한 것이 ASI다. 이런 ASI를 인류가 통제하지 못한다면 전 지구적 위험이 초래될 것이라는 지적도 나온다.

스티븐 호킹 박사는 2014년 "완전한 AI 개발이 인류의 종말을 가져올 수 있다"면서 이런 상황에 대해 경고한 바 있다

마지막으로 ANI는 지금까지 인간에게 위협이 되는 대신 가장 광범위하게 도움을 주면서 삶을 발전시켜 왔다는 평가가 나온다. 특히 최근 몇 년 사이 기술 발전의 원동력이 됐다는 것이다.

챗GPT 같은 챗봇 역시 질문에 답을 하는 특정 작업을 수행하도록 설계된 ANI라고 할 수 있다. 고객 서비스를 돕고, 질문에 답변하고, 약속을 잡아 주는 등 사람들의 노력과 시간을 절약해 주면서 향후 활용도가 더욱 높아질 것으로 예상된다.

ANI는 이제 누구나 휴대전화에 애플리케이션(앱)으로 가지고 있는 삼성 빅스비와 애플 시리 등 AI 개인비서, 이미지·음성 인식 기능 등으로 구현된다.

또 유용하게 쓰이는 ANI의 사례가 광학문자판독(OCR)과 추천·검색을 합친 '서제스트'(Seargest:검색과 추천의 합성어) 기술이다.

OCR은 인쇄물을 스캔해 디지털 데이터로 만들어 주는 것으로, AI가 결합하면서 인식 정확도가 크게 향상됐다.

서제스트는 온라인 플랫폼에 쏟아지는 데이터의 홍수 속에서 필요한 정보를 찾는 데 필수적인 기능으로 여겨진다. 아마존, 넷플릭스, 유튜브 등 대표적인 온라인 플랫폼들은 일찌감치 이 기술을 매출 성장을 견인하는 도구로 활용하고 있다.

네이버와 카카오 등 국내 기업들도 자체적으로 서제스트 기술을 개발해 쇼핑과 콘텐츠 등 다양한 분야에 접목시켰고, AI 기업 업스테이지는 서제스트와 함께 OCR 도입을 돕는 'AI 팩'을 출시해 한화생명, 삼성SDS, LG유플러스 등 여러 기업에 제공하고 있다.

업계 관계자는 "AI 시대라고는 해도 AGI가 등장해 본격적으로 우리 삶을 윤택하게 하기에는 조금 더 시간이 걸릴 것"이라며 "이미 현실에서 활용되는 ANI는 이미 다양한 방식으로 우리 삶을 변화시키고 있으며, 효율성과 정확성이 높아지면서 수많은 기업의 혁신에 기여할 것으로 기대된다"고 말했다.

(서울=연합뉴스) 임성호 기자 

댓글