본문 바로가기
유익한 정보

"챗GPT 공부하자" 과기정통부도 긴장 "넌 뭐냐?"

by 현명한도미니카 2023. 2. 24.
728x90
반응형

"챗GPT 공부하자"…과기정통부 연구모임 발족, 네이버 전문가 초빙

 
 

GPT는 미국의 인공지능 연구기관인 '오픈AI(OpenAI)'가 공개한 챗봇 서비스다. 지난해 12월 공개 이후 최단기간(5일)에 100만 사용자를 달성하는 기록을 세웠다. 출시 2개월째 되는 지난 1월에는 월간활성이용자수(MAU) 1억명을 돌파했다. 

 

 

 
 
과학기술정보통신부는 하정우 네이버 인공지능연구소장을 초청해 관련 동향 파악에 나섰다.
 

'대화형 인공지능(AI)' 챗GPT(ChatGPT) 광풍이 불고 있는 가운데, 정부 부처 직원들도 민간 전문가를 초청해 학습에 들어갔다. 챗GPT는 미국 실리콘밸리 스타트업 오픈AI(OpenAI)가 만든 대화형 AI 로봇이다. 서비스 출시 두 달 만에 '월간 활성 사용자 수'(MAU) 1억명을 도달할 정도로 사회 각계 각층에 큰 파장을 일으키고 있다.

과학기술정보통신부는 2월 22일 챗GPT에 대한 이해를 높이고 부처 내 활용 방안을 탐색하기 위해 전문가 특강을 개최했다. 하정우 네이버 인공지능연구소(AI Lab) 소장이 관련 기술 동향과 정부 부처 응용 가능 분야 등을 발표했다. 하 소장은 현재 대통령 직속 디지털플랫폼정부위원회 AI-데이터 분과위원장을 맡고 있다.

이번 특강은 사전 신청자가 현장 수용 인원을 초과해 내부 온라인망에서도 생중계됐다. 특강에선 챗GPT를 활용해 업무메일, 보도자료, 사회관계망서비스(SNS) 홍보 문구 작성 등을 시연하는 시간이 마련됐다. 또 챗GPT가 촉발한 초거대 AI 생태계 미래와 정부 대응책 등을 논의하는 시간이 이어졌다.




류광준 과기정통부 기획조정실장은 "AI 등 최첨단 기술을 부처 업무에 접목해 정책의 품질을 높여 나가겠다"며 "관련 성공 사례를 만들어 다른 부처에도 적극 전파하겠다"고 밝혔다.

과기정통부는 향후 연구모임 '스위프트'(SWIFT·업무 혁신 선도팀)를 구성 운영할 계획이다. 스위프트는 과기정통부 직원과 전문가 등으로 구성하고, 첫 번째 과제로 챗GPT  AI의 활용법과 적용 가능한 업무 분야 등을 발굴하고 사례를 공유할 예정이다.

 '척척박사' 챗 GPT에 부는 열풍..."누구냐 넌"

 

챗GPT. 이것이 지금 지구촌을 2023년 벽두에 강타하고 있다. 알파고가 이세돌9단을 이겼을 때는 바둑이니까 그렇겠지 했는데 이것은 인류를 직접적으로, 어떻게 보면 위협적인 존재로 다가오고 있기 때문이다.

이 챗GPT, 어디까지 쓸 수 있는 것인지, 우리를 위협하는 존재인 것인지 청와대 디지털소통 관련해서 관계자로 있었던 미디어스피어 강정수 박사에게 자세히 알아보기로 한다.

강정수 박사는 국정홍보, 디지털 영역에서 관계부처하고 같이 일을 하고 또 청와대에 있었던 유튜브라든지 이런 소셜미디어 채널들 운영하고 이런 기타 등등을 다 총괄했었다. 디지털 분야의 최고 전문가라고 할 수 있다.


강정수 박사가 말하는 챗 GPT


우선은  챗은 우리가 채팅한다는 뜻의 챗이고요. GPT의 뜻을 알게 되면 GPT의 파괴력, 힘, 그리고 앞으로 어떤 발전 방향을 알 수가 있습니다. GPT는 뭐의 약자냐 하면 G는 제너러티브, 생성이라고 하죠.

텍스트를 집어넣으면 그림을 만드는 것도 제너러티브 AI라고 합니다. 텍스트를 집어넣으면 음악을 만들어주기도 하고 텍스트를 집어넣으면 영상을 만들어주기도 하고 이런 것을 전반적으로 제너러티브.

그래서 G라는 단어를 써서 텍스트를 만들어내는 그런 거지만 G가 들어가고요. P라는 것은 프리트레인, 이미 학습된 뜻이라는 겁니다. 이미 학습된 것을 우리가 보통 측정할 때 파라미터라는 측정을 합니다. 우리가 1차 함수를 표현할 때 Y는 AX+B라고 하잖아요. 표현을 하잖아요. 그때 A하고 B가 파라미터인데요. 이 파라미터가 챗GPT에는 1075억 개가 있습니다.

1075억 개. 대단히 우리가 상상하기도 어려운 거고 그리고 곧 출시될 챗GPT4같은 경우에는 4조 단위 정도입니다. 그러니까 대단히 고차방정식에 있는 일종의 이러한 것들은 함수기 때문에 그런데 우리가 너무 어렵게 생각할 필요가 없이 여기서부터 여기까지의 구간은 시와 관련된 거예요.

시와 관련된 능력을 가지고 있고 프리트레인드, 이미 학습된 그런 기술들을 갖고 있다는 거고 여기서부터 여기까지는 논설문, 여기서부터 여기까지는 연애편지. 여기서부터 여기까지는 학술적인 논문들, 이런 식으로. 또는 여기서부터 여기까지는 법률적인 용어들, 이렇게 하면서 자신들이 인간과 대화할 수 있고 설득할 수 있고 이런 것들을 이미 학습한, 프리트레인드라는 스킬셋이라고도 해요.

 

쳇GPT에게 질문하는 방법

챗 GPT 에게는 어떻게 질문하느냐에 따라서 그 대답이 달라진다. 그야말로 준비가 되어 있다는 것이다.

윤석열 대통령이 이번에 신년사를 챗GPT한테 써보라고 했더니 조금만 보완하면 될 정도로 훌륭하게 썼더라고 한다.

 

그런데  중요한 건 그냥 '무엇에 대해서 답을 줘' 라고 한다든지  ' 연설문 써줘' 라고 한다고 되는게 아니라 '어떤어떤 키워드가 들어가는 연설문을 써달라' 라고 구체적으로 요구를 해야  하는 것이다.

 

그래서 사실은 질문이 되게 중요해지는 시대이다. 그러니까  GPT가 똑똑하니까 똑똑한 친구로부터  좀 더 많은 것을 얻기 위해서는 훌륭한 질문을 던져야, 훌륭한 걸 요구해야 한다.

 

왜냐하면 A라는 사람이 GPT 요구한 것과 B라는 사람이 요구한 사람이 결과가 완전히 달라지는 데 그것은 질문의 수준에 따라 답이 달라지기 때문이다.

 

그래서 최근에 영국에 있는 한 로펌 같은 경우에는 챗GPT에게 질문 잘하는 사람을 뽑는다는 채용 공고를 냈다. 그 정도로 어떤 질문을 하는가에 따라서 답들이 다 달라지기 때문에 질문은 굉장히 중요한 상황이 되었다.




 단순한 백과사전적인 지식들 이런 것들을 많이 갖고 있다고 해서 인간하고 똑같아진다고 얘기할 수 없습니다. 다만 어떤 마켓이 형성되냐면 질문을 사고파는 거예요. 훌륭한 질문이  결과를 다르게 만들다 보니까 질문을 사고팔 수 있는 마켓들은 형성되고 있어요.


챗GPT의 오류


여기서 중요한 것은 챗GPT는 흔히 말하는 진실을 얘기하는 게 주 목적이 아니에요. 챗GPT는 사람을 설득하는 것이 가장 큰 목적입니다. 설계 자체가. 그래서 저희가 일종의 리터너치가 필요한데 챗GPT 는 다 진실만을 말한다고 얘기하면 큰일 납니다. 챗GPT는 그 사람을 설득하기 위해서 때로는 거짓말도 합니다.

그러니까 아직까지는 우리가 조심해서 써야 하며 이런 부분들이 앞으로는 점점 개선될 거라고 보고 있다.

예를들면 챗GPT가 '그 사람의 A라는 논문에 따르면 그 사람의 주장은 이것과 같습니다'라고 하는데  실제로는그런 논문이 없는 사례들이 대단히 많이 나오고 있다는 것이다.



그런데 이제는 학생들이  학교에서의 과제들을 다 챗GPT로 하기 시작했다는 문제가 대두되었다..

그러나 우리 인간이 해야 될 것은 그것에서 아이디어를 얻어야 하는 거죠. 이렇게 표현하면 좋은 표현이겠구나.
또는 해외에서 이메일이 온다면 그걸 요약해줘. 요약한 다음에 한글로 다시 번역해서 사람들한테 알려줄 수도 있다..
 
우리가 업무에 3시간 걸려서 할 수 있는 것들을 1시간 반 만에, 1시간 반이 필요해서 할 수 있는 일을 30분 만에 처리할 수 있는 것, 챗GPT가 도와주는 것이다.
그래서 우리가 우리의 일터에서 우리의 일들을 도와줄 수 있고 우리가 공부하는 과정에서 이것을 도와줄 수가 있고 그렇게 우리가 편하게 일할 수 있도록 도움을 받울 수 있다.
 
그런데 이 시점에서 우리가 알아야 할 것은 스마트폰도 어린아이부터 나이많은 어르신까지 다 쓰고 있지만 쓸 수 있는 한계와 용도가 다르듯이 이젠 이런 챗GPT라는 것은 우리에게 일상으로 다가온다. 한 달에 20달러를 내고 훨씬 더 기능이 좋은 챗GPT를 쓸 수도 있다.
 
그리고 GPT4가 올해 나오면 더욱더 향상된 기능성이 있고 이와 관련돼서 응용된 프로그램도 수백 개가 나오고 있다.

이런 것들을 잘 다루면 흔히 말하는, 앞으로의 젊은 세대는 AI 네이티브가 될 거라고 생각한다.

우리가 모바일 네이티브, 그다음에 인터넷 네이티브 이런 단어를 썼던 것처럼 AI 네이티브 세대가 지금 출현하기 시작하고 있는 거고 여기에서도 격차가 벌어질 것이다.

그래서 이걸 잘 못 쓰는 사람, 그리고 일일이 자기 혼자서 다 해야 되는 사람, 물론 이걸 긍정적으로 보면 독립적 사고를 하고 있다고 얘기할 수 있겠지만 여전히 6시간씩, 10시간씩 일을 해야 되고 어떤 친구들 같은 경우에는 이것들을 너무나도 활용을 잘하면서 1시간 30분 만에 동일한 일을 처리하는 이러한 양태로 사회가 재편될 가능성도 충분히 있다.

그래서 식별하려고 하는 기계들. 항상 우리가 봐야 될 것은 기술이 발전하면 다양한 문제점이 나오면서 그 문제들을 해결할 방법들은 찾으면서 성장한다. 해결하면서 기술은 진화하고 진보하는 것이기 때문이다.

 

그런 면에서 당연히 오픈 AI라고 하는 챗GPT를 만드는 회사에서는 우리가 GPT0라고 하는 이렇게 2를 만들겠다. 그래서 이 글이 GPT로 만들어졌는지 이 텍스트가 GPT로 만들었는지를 만들어서 배포하겠다고 하고 있어요. 그런데 사실은 그들 입장에서도 필요하다.

왜냐하면 우리가 인공지능이라고 부르는 것은 학습을 계속해 줘야 되는 것이다. 그런데 학습을 해야 될 이 먹을거리가 텍스트인데 어느 정도 시간이 지나면 자기가 만든 텍스트를 자기가 먹을 수도 있는 것. 그러니까 즉 GPT가 잘못 만들어놓았던 많은 글들을 다시 학습하게 되면 이건 문제가크게 발생할 수 있는 것이다.

그래서 GPT 스스로가 그걸 걸러내기 위해서 GPT 제로라고 하는 이런 GPT를 걸러내려고 하는, GPT로 만들어진 것을 걸러내고 판독하려고 하는 솔루션이 만들어지고 있고 이미 나와 있는 것도 있다.

예를 들자면 영어로 치자면 어빌리티 어브, 어떤 것의 능력이라고 한다면 여기에 크리에이팅, 창작하는 능력, 또는 언더스탠딩 이런 것들이 대부분 확률로써 정리되어 있고 이 확률에서 랜덤하게 어떤 특정 확률 이상을 어빌리티 오브 언더스탠딩. 이렇게 연결을 시켜주는 것이다. 마찬가지로 거꾸로 이런 판독을 하게 되면 이런 특정 단어에 하필이면 이런 확률로써 나왔던 것은 그런 의혹이 있다.

그런데 그것이 한 문단 안에 10개 이상이 발견되고 있다, 또는 15개 이상 발견되고 있다 했을 경우에 이것은 우리가 볼 때 추론할 때 75% 정도 GPT로 썼을 가능성이 있다, 이렇게 문장이 나올 것다. 100% 얘는 GPT, 얘는 아니야, 이런 식으로 정확하게 판단하는 것이 아니라 확률적인 게임이기 때문에 확률적으로 추론할 가능성이 높다.


 

 

 

 

마이크로소프트사의 챗봇 '링'에 대해서 알고 싶으면 아래 링크를 클릭하시면 됩니다

https://bmh8108.tistory.com/entry/

댓글