본문 바로가기
기술공학/세상을 바꾼 IT

[세상을 바꾼 IT: 미래] chatGPT, 생성형 인공지능의 시대

by 롱카이 2024. 7. 5.
반응형
  • 인공지능은 창작할 수 없다는 인식
AlphaGo 신드롬으로 유명해진 빅데이터 드립
AlphaGo 신드롬으로 유명해진 빅데이터 드립

2015년 이후 인공지능 기술은 빠르게 성장하고 있었습니다. 그리고 2016년 九단 이세돌과 AlphaGo 간의 대결로 인공지능이 얼마나 발전했는지 대중에게 살짝 공개했습니다. 허나 AlphaGo 신드롬은 1년 뒤 잊혀졌고 일상에서 인공지능은 여전히 게임을 제외한 다른 곳에는 보이지 않았습니다. 또한 대중에게 인공지능이 알려지며 미래에 인공지능이 인류에게 위협이 될 수도 있다는 의견이 대두되었습니다.

아이, 로봇(2024)의 한 장면처럼 인공지능은 예술을 할 수 없다는 통념이 지배적이었다
아이, 로봇(2002)의 한 장면처럼 인공지능은 예술을 할 수 없다는 통념이 지배적이었다

그런 와중에 오직 예술은 인간이 자유의지를 가지고 창작하는 영역으로 인공지능이 절대 모방하거나 스스로 창조할 수 없는 분야로 여겨졌습니다. 많은 학자들이 예술은 기계가 접근할 수 없는 인간만의 영역이라고 주장했으며 인간의 자유의지와 예술은 신성불가침의 영역으로 여겨졌습니다. 하지만 그런 와중에 인공지능은 연구실에서 스스로 창조하는 능력을 강화하고 있었습니다.
 
 
 

  • 인간의 믿음을 깨부수고 생성형 인공지능의 시대를 열다
alignDRAW
alignDRAW

그런 와중 2015년 인간이 자연어로 친 언어를 그림으로 전환하는 인공지능 모델인 alignDRAW가 토론토 대학교에서 개발되었습니다. 그리고 alignDRAW 모델을 연구해 인간이 내린 명령에 따라 그림을 더 잘 그리는 인공지능들이 연구되었습니다. 그리고 2021년에는 Google의 Transformer을 더욱 연구해 발전시킨 OpenAI가 DALL-E를 완성하며 프롬프트를 치면 그림을 그려주는 생성형 인공지능 기술이 비약적으로 발전했습니다.

인간만이 예술을 할 수 있다는 통념을 깨부순 Theatre D'opera Spatial
인간만이 예술을 할 수 있다는 통념을 깨부순 Theatre D'opera Spatial 작품

그러나 이들은 아직 대중에게 공개되지 않아 대중은 그런 인공지능의 발전을 몰랐습니다. 그 사이 캘리포니아에서 데이비드 홀츠가 Midjourney, Inc라는 연구소를 설립해 그림을 창작하는 인공지능을 연구했습니다. 그리고 2022년 7월 12일 연구소에서 개발한 Midjourney를 베타 버전으로 출시했습니다. 그리고 디지털 아티스트인 제이슨 앨런은 베타 버전의 Midjourney를 이용해 Theatre D'opera Spatial이라는 제목의 작품을 창작한 뒤 8월 열린 콜로라도 주립 박람회 미술대회에서 1등을 하며 전세계 사람들에게 충격을 안겼습니다.

2022년을 달군 Midjourney
2022년을 달군 Midjourney

인간 만이 예술을 할 수 있다는 인류의 상식을 정면으로 깨부순 Theatre D'opera Spatial은 Midjourney를 널리 알렸고 생성형 인공지능의 시대를 알렸습니다. 예술가를 비롯한 많은 사람들이 인간보다 훨씬 짧은 시간에 우수한 예술 창작을 하는 Midjourney의 저력에 놀라고 당황했습니다. 그리고 Midjourney가 사람들에게 알려지자 이어 여러 생성형 인공지능들이 출현했습니다.

높은 수준의 실사 이미지를 생성하는 것으로 세계의 주목을 받은 Stable Diffusion
높은 수준의 실사 이미지를 생성하는 것으로 세계의 주목을 받은 Stable Diffusion

2022년 8월 22일에 Stability AI 기업과 뮌헨의 루트비히 막시밀리안 대학교의 CompVis가 공동개발한 Stable Diffusion이 등장했습니다. 2022년 하반기에 동시에 등장한 Midjourney와 Stable Diffusion은 미술 분야에서 인간이 인공지능에게 처참하게 패배함을 알렸습니다. 게임회사와 광고업계는 인간 대신 Midjourney와 Stable Diffusion을 공격적으로 이용하며 해당 분야에 빠르게 정착시켰습니다.
 
 
 

  • OpenAI에서 탄생한 GPT
BERT
BERT

2017년 Transformer를 발표한 Google은 Transformer의 잠재성을 과소평가했지만 그렇다고 Transformer에서 더이상 연구를 진행하지 않은 것은 아니었습니다. Google은 Transformer를 이용한 언어모델LM을 개발했고 2018년 BERT를 발표하며 영어 자연어 처리 모델을 제시했습니다. Google은 BERT 모델을 보유함으로서 Google이 인공지능 분야에서 압도적인 우위를 유지하고 있다고 자신했습니다. 하지만 Google의 독주에 대항한 작은 기업이 존재했습니다. 그 기업은 OpenAI였습니다.

영화 터미네이터 시리즈 속 스카이넷처럼 인류는 AGI를 인류에게 위협을 가할 수 있는 존재로 생각했다
영화 터미네이터 시리즈 속 스카이넷처럼 인류는 AGI를 인류에게 위협을 가할 수 있는 존재로 생각했다

한편 2015년 인공지능에 큰 관심을 두었던 일론 머스크, 샘 올트먼, 그렉 브로크만 등의 인물은 연구실에서 성장하는 인공지능을 주의깊게 살펴보았습니다. 그들은 인공지능의 발전 방향을 보니 인간과 다름없는 지능을 보유하는 인공 일반 지능Artificial general intelligence가 출현할 수도 있겠다는 생각을 했습니다. 그래서 그들은 인공 일반 지능AGI이 가져올 수 있는 인공 일반 지능의 실존적 위험에 대비하자는 뜻을 모았고 인공 일반 지능을 통제하기 위해 OpenAI를 설립했습니다.

GPT-1 구조
GPT-1 구조

OpenAI는 인공 일반 지능AGI를 개발하고 통제하는 것을 목표로 했습니다. OpenAI가 2015년부터 인공지능에 대해 연구를 하던 중 2017년 구글에서 Transformer 개념이 발표되자 OpenAI는 Transformer에 집중했습니다. Transformer는 더 짧은 시간에 효율적인 방법으로 방대하고 복잡한 데이터를 학습하고 창조할 수 있는 기술이었습니다. 이는 인공지능이 인류가 사용하는 언어를 이해하고 언어를 구사하는데 중요한 기술이었습니다. OpenAI는 Google의 BERT와 다른 방법으로 Transformer을 개량했습니다. 2018년 OpenAI는 간단한 대화가 가능한 GPT-1을 개발했습니다.

매개변수 수를 늘리며 비대해지는 LLM
매개변수 수를 늘리며 비대해지는 LLM

Generative Pre-trained Transformer라는 이름을 가진 GPT는 117,000,000(1억1천7백만)개의 매개변수를 보유한 대규모 언어모델Large Laguage Model이었습니다. 이는 세계 최초의 대규모 언어모델LLM 중 하나였습니다. OpenAI는 이어 2019년 상반기에 GPT-2를 오픈소스로 출시하며 대규모 언어모델LLM의 개념을 잡아갔습니다. 그리고 2020년 6월 OpenAI는 이전 모델보다 더 거대하며 성능이 뛰어난 GPT-3을 개발 완료했습니다. Microsoft에 인수된 OpenAI는 GPT-3이 등장하자 이를 상업적으로 활용하며 본격적으로 세상에 알리기 시작했습니다.
 
 
 

  • DALL-E와 GitHub Copilot, 세상에 나온 GPT
DALL-E 2가 그린 [진주 귀걸이 소녀]
DALL-E 2가 그린 [진주 귀걸이 소녀]

OpenAI를 인수한 Microsoft는 OpenAI가 개발한 GPT를 상업적 용도로 사용하려고 했습니다. 그래서 2020년 GPT-3이 유의미한 성능을 보이자 OpenAI와 Microsoft는 GPT-3을 특정 산업에 적용했습니다. 2021년 1월 OpenAI는 DALL-E라는 그림을 창조하는 생성형 인공지능을 공개했습니다. DALL-E는 그리 잘 알려지지 않았지만 2022년 DALL-E 2가 등장하고 이어 다른 연구소에서 Midjourney와 Stable Diffusion이 등장해 생성형 인공지능 신드롬을 불러일으키며 유명해졌습니다.

코드를 파악하고 보완하며 개발자의 조력자가 된 GitHub Copilot
코드를 파악하고 보완하며 개발자의 조력자가 된 GitHub Copilot

초반에 주목받지 못한 DALL-E와 달리 2021년 10월에 출시한 GitHub Copilot은 관련 업계인 개발자 사이에서 큰 주목을 받았습니다. 그동안 개발자들은 코딩으로 컴퓨터에게 명령을 입력하고 문제가 있는 부분은 개발자들이 직접 찾아야 했습니다. 그래서 개발자들은 긴 코드 중 논리 구조 상 문제가 되는 코드를 찾느라 많은 시간을 소모했고 불필요한 시간과 체력을 소모해야 했습니다. 허나 GitHub Copilot은 코드를 인공지능이 파악하고 문제 부분을 알려주고 일부는 더 좋은 코드를 제안하는 등 능동적으로 개발자의 코딩을 도왔습니다.

능동적으로 코드를 파악하고 개발을 도와주는 GitHub Copilot
능동적으로 코드를 파악하고 개발을 도와주는 GitHub Copilot

개발자를 도와 양질의 코드를 짜게 돕는 GitHub Copilot은 개발자들에게 혁신이었습니다. 개발자들은 더이상 스스로 문제를 하나하나 파악하고 수정할 필요없이 GitHub Copilot에게 문제 부분을 찾게 하고 문제 코드를 수정하거나 혹은 GitHub Copilot이 제안하는 더 나은 코드로 변경했습니다. 이는 디버깅에 걸리는 시간 소모가 확실히 감소하는 효과가 있었고 개발자들은 무의미한 원인 찾기에 시간을 소모하지 않고 개발을 진행할 수 있게 되었습니다. GitHub Copilot은 개발자 사이에서 알려지며 인공지능의 능력을 알렸습니다.
 
 
 

  • 모두와 대화하는 인공지능, chatGPT
채팅하듯이 인공지능과 소통하는 chatGPT
채팅하듯이 인공지능과 소통하는 chatGPT

2021년 OpenAI와 Microsoft는 GPT-3으로 사업을 진행하며 GPT의 능력을 재확인했습니다. 그리고 그들은 서비스로 얻은 노하우를 살려 GPT를 모두가 사용하게 하는 거대한 사업을 준비했습니다. 그리고 2022년 11월 OpenAI는 GPT-3을 더 개량한 GPT-3.5에 채팅 기능을 합쳐 chatGPT 3.5를 출시했습니다. 본격적인 chatGPT의 시작이었습니다.

5일 만에 사용자 100만명을 달성한 chatGPT
5일 만에 사용자 100만명을 달성한 chatGPT

2022년 11월 공개된 chatGPT 3.5는 전세계 사람들에게 큰 주목을 받았습니다. 사람들은 말로만 들은 인공지능과 직접 소통할 수 있다는 것에 먼저 관심을 보였고 인공지능의 대답이 의외로 사람과 대화하는 것과 비슷하다는 점에서 놀라워했습니다. 무엇보다도 chatGPT 3.5는 정보를 찾고 싶을 때 귀찮게 여러 검색엔진에서 검색하고 사이트를 탐방하는 과정을 거치지 않고 똑똑한 친구에게 물어보듯이 질문하면 바로 chatGPT 3.5가 대답해준다는 점이 사람들을 놀랍게 하고 매력을 느끼게 했습니다. 덕분에 chatGPT는 사용자 100만명을 달성하는데 겨우 5일이 걸리는 기염을 토하며 빠른 시간 안에 전세계 사람들이 필수적으로 사용하는 서비스가 되었습니다.

사람들은 교육, 사무 업무 등 일상의 대부분 활동에 chatGPT를 사용했다
사람들은 교육, 사무 업무 등 일상의 대부분 활동에 chatGPT를 사용했다

그리고 chatGPT의 등장은 사회와 일상을 바꾸어 놓았습니다. 교육자와 학생으로 구분된 학교와 대학교 등의 교육현장은 학생들이 교육자에게 배우는 것이 아닌 chatGPT에 질문하고 답변을 얻는 것이 일상적으로 행해졌으며 개발자들은 GitHub Copilot과 chatGPT를 함께 사용하며 개발을 진행했습니다. 또한 사무 업무에서 chatGPT를 이용한 빠른 시간 내 다양한 업무를 신속히 처리하는 것이 미덕으로 여겨졌습니다. 이처럼 교육부터 업무에 이르기까지 chatGPT는 기존의 질서를 바꾸고 모두가 chatGPT를 이용해 일을 진행하는 것으로 바꾸어놓았습니다.
 
 
 

  • 진화를 멈추지 않는 GPT
chatGPT
chatGPT

chatGPT 신드롬은 실로 무서웠습니다. chatGPT는 한 달도 되지 않은 시간 내에 사람들이 일상에서 필수적으로 사용해야 하는 서비스로 등극했습니다. 2022년 등장한 chatGPT-3.5는 사람의 말을 제대로 알아듣지 못하고 오류를 내는 등 상업적으로 미완성된 서비스였지만 사람들은 인공지능이 알아서 대답해주는 서비스에 감탄하며 chatGPT를 포기하지 못했습니다. 그리고 이는 OpenAI와 Microsoft, 그리고 인공지능을 구동하는데 필수적으로 사용되는 GPU를 생산하는 NVIDIA에 큰 부를 가져다 주었습니다.

문자를 읽는 것을 넘어 보고 들으며 판단하는 것이 가능한 chatGPT-4o
문자를 읽는 것을 넘어 보고 들으며 판단하는 것이 가능한 chatGPT-4o

2022년 등장해 2023년 전세계 사람들을 소비자로 만든 chatGPT-3.5는 2023년 3월 GPT-4를 적용한 chatGPT-4를 출시하며 한단계 업그레이드했습니다. 그리고 이어 2024년 5월 등장한 chatGPT-4o는 프롬프트를 읽는 것을 넘어 그림을 보여주거나 음성을 들려주면 이를 받아 스스로 판단하고 답변을 하는 놀라운 성능을 보여주며 또 한번 사람들을 놀라게 했습니다. 2022년 연말부터 2024년에 이르기까지 짧은 시간 동안 chatGPT는 아트와 개발 부분의 상당 부분을 능동적으로 수행하며 일부 사람에게 도움을 제공하고 일부 사람들과 경쟁하는 수준에 이르렀습니다.
 
 
 

  • 도래한 생성형 인공지능의 시대
Google이 출시한 Gemini
Google이 출시한 Gemini

OpenAI를 인수한 Microsoft는 chatGPT의 대박과 함께 막대한 이익을 창출하며 단숨에 세계를 선도하는 기업, 인공지능 최고 기술 보유 기업으로 등극했습니다. 오랜 시간 인공지능 분야에서 1인자였던 Google은 chatGPT가 세계를 움직이자 급히 Gemini를 출시했습니다. 하지만 Gemini는 chatGPT보다 부족하다는 평가를 받으며 chatGPT의 권자를 빼앗지 못했습니다.

Meta에서 개발한 LlaMA
Meta에서 개발한 LlaMA

메타버스 실현에 앞장섰던 Meta는 2023년 2월 LlaMA라는 생성형 인공지능을 출시하며 차세대 세계를 선도할 기업 자리를 포기하지 않음을 보여줬습니다. LlaMa는 chatGPT보다 기능의 종류는 많지는 않았지만 대화할 때 성능은 꽤 괜찮은 편에 속하며 양질의 대규모 언어모델LLM 중 하나로 인정받았습니다.

01.AI가 개발한 Yi
01.AI가 개발한 Yi

중국의 스타트업 01.AI 역시 Yi라는 대규모 언어모델LLM을 출시하며 미국이 주도의 인공지능 기술의 격차를 줄이려고 노력했습니다. 중국은 인공지능 기술을 상당히 많이 보유하고 있으나 GPU 등 원천 기술은 미국의 기술에 절대적으로 의존했습니다. 그 상황에서 미국과의 기술 갈등이 더 심화되자 중국 공산당은 2030년까지 인공지능 독자기술 확보를 목표로 전폭적인 지원을 시작했습니다.

Falcon LLM
Falcon LLM

아랍에미리트 역시 차세대 먹거리로 인공지능을 선택했고 Falcon LLM을 출시하고 세계 각지의 인공지능 전문가를 섭외하며 인공지능 기술에 전폭적인 투자를 하며 세계 주요 인공지능 기술 보유국으로 성장을 준비하고 있습니다. 아랍에미리트는 미국과 중국 등 나라를 가리지 않고 인공지능 기술 협약을 맺으며 미국 주도의 인공지능 질서에서 독자 기술을 확보하려고 하고 있습니다.

NVIDIA TensorRT-LLM
인공지능의 핵심 기술 NVIDIA TensorRT-LLM

그리고 chatGPT 흥행으로 가장 큰 이익을 얻은 NVIDIA 역시 NVIDIA TensorRT-LLM 기술을 확보하며 인공지능의 핵심 기술 역량을 확보했습니다. NVIDIA는 생성형 인공지능 시대가 도래하며 GPU 최강자를 넘어 인공지능 최강 기업으로 부상했고 더욱 놀라운 기술을 개발하며 인공지능 시대의 주인공으로 등극했습니다.
 
 
 
 

반응형

댓글