생성형 AI, 어디까지 왔는가 (1)기본 개념과 개발 현황

A.I.C.E. 세미나 : AI시대에 인간에게 필요한 역량은 무엇인가 — 김재경 LAB2050 연구원

LAB2050
LAB2050

--

  • 이 글은 2023년 6월 27일을 기준으로 작성되었습니다.
Midjourney로 생성한 이미지. prompt는 GPT-4의 Photorealistic으로 생성.

AI는 정말 위험한가? 전세계에서 가장 빠르게, 단 두 달만에 1억명의 유저를 모은 ChatGPT의 등장을 필두로 ‘AI 시대’가 막을 열었다. ChatGPT를 비롯한 여러 생성형 AI는 놀라울 정도로 높은 수준의 텍스트나 이미지 등을 생성하며 인간이 여러 가지 일을 하는데 큰 도움을 줄 수 있을 것으로 보이지만, 동시에 그 역량으로 인해 여러 일자리가 사라지는 게 아닌가 하는 우려도 낳고 있다.

이런 혼란스러운 시점에 우리가 해야 할 일은 생성형 AI가 현재와 미래에 무엇을 할 수 있는지, 이로 인해 어떤 문제들이 발생할지 알아보고 개인과 사회가 대비하는 것이다. 노벨이 발명한 다이너마이트는 사람을 죽일 정도로 강력하지만, 사용자들의 의지에 따라 광산 작업이나 터널 건설 등 산업적인 용도로 쓰일 수 있다. 원자력 역시 폭탄으로 쓰이거나 발전 과정에서 문제가 발생하면 많은 사람들에게 피해를 주지만, 안전하게 사용하면 에너지를 얻을 수 있다.

AI 역시 결국 인간이 사용하기 나름인 ‘과학 기술’이다. 우리에게 이롭게 활용하기 위해선 우선 원리와 개념부터 알 필요가 있다.

1–1.생성형 AI관련 원리 및 개념 소개 *ChatGPT와의 문답을 바탕으로 작성함.

생성형 AI의 작동 원리를 이해하기 위해 필요한 다섯 개념에 대한 설명을 ChatGPT에게 묻고, 그 대답에 대한 간단한 설명을 덧붙이고자 한다.

- 데이터세트(Data Set): 데이터세트는 AI가 학습하는 데 사용하는 데이터의 모음입니다. 이는 종종 특정 주제나 분야에 관한 정보를 포함하고 있습니다. 예를 들어, AI가 영어 문장을 생성하는 방법을 배우려면, 그 학습에는 수많은 영어 문장들이 포함된 데이터세트가 필요합니다. 이 데이터세트는 소설, 뉴스 기사, 웹페이지, 사전 등 다양한 출처에서 모은 문장들일 수 있습니다.(ChatGPT의 답변)

-> 우선, 생성형 AI는 기본적으로 인간이 만든 데이터를 학습해야 한다. 텍스트를 생성하기 위해서는 인간들이 텍스트를 어떻게 쓰는지를 보아야 하고, 이미지를 생성하기 위해서는 어떤 그림을 그려야 하는지 보아야 한다. 생성형 AI가 학습을 위해 본 데이터들을 ‘데이터세트’라고 할 수 있다. 하지만 기업들이 생성형 AI를 학습시키기 위해 AI기업조차 어떤 데이터를 학습시켰는지 모를 정도로 무분별하게 데이터들을 학습시키기 때문에, 저작권 문제 등 여러 문제가 발생하기도 한다.

-매개 변수(Parameters): 매개 변수는 AI가 학습하는 동안 조정되는 값들입니다. AI는 이 매개 변수들을 조정함으로써 데이터세트에서 가장 일반적인 패턴이나 규칙을 찾아냅니다. 예를 들어, AI가 문장을 생성하는 과정에서 “I am” 다음에 “happy”가 오는 것이 “sad”가 오는 것보다 일반적이라는 패턴을 학습했다면, 이는 매개 변수를 통해 학습된 정보입니다.(ChatGPT의 답변)

-> 생성형AI가 인간이 쓴 글이나 그린 그림들을 보고 패턴이나 규칙을 ‘매개 변수’ 형태로 저장한다. 예시를 들면, ‘오늘의 점심밥으로 뭘 먹을까?’이라는 질문 뒤에는 ‘슬리퍼’,’원피스’보다 ‘돈까스’,’제육덮밥’같은 단어가 더 올 확률이 높다. 생성형 AI는 데이터세트에서 가장 일반적인 패턴이나 규칙, 즉 인간의 질문(프롬프트)에 확률적으로 가장 알맞은 대답을 출력한다. 이는 뒤에 이야기할 ‘환각 현상’이 일어나는 원인이기도 하다.

-학습(Learning): 학습은 AI가 데이터세트에서 패턴을 찾아내고 그 패턴에 따라 매개 변수를 조정하는 과정을 말합니다. 이 과정은 대부분의 AI 시스템에서 중요한 단계입니다. AI는 이 학습 과정을 통해 복잡한 문제를 해결하거나 예측을 수행하는 능력을 얻습니다.(ChatGPT의 답변)

-확률(Probability): 확률은 특정 사건이 발생할 가능성을 수치로 표현하는 것입니다. 확률은 0부터 1 사이의 값으로, 0은 사건이 절대 일어나지 않을 것이라는 확신을, 1은 사건이 반드시 일어날 것이라는 확신을 의미합니다. 생성형 AI는 보통 다음에 어떤 단어가 올 가능성이 가장 높은지를 확률로 계산하여 문장을 생성합니다.(ChatGPT의 답변)

-환각현상(Hallucination): “환각현상”은 AI가 학습 데이터에 없는 정보나 패턴을 ‘창조’하는 현상을 말합니다. 이는 AI가 학습 데이터에 기반한 ‘추측’을 하기 때문에 발생하는데, 때때로 이 추측이 현실과는 맞지 않는 결과를 초래할 수 있습니다. 예를 들어, AI가 ‘빨간색 바나나’ 같은 실제로 존재하지 않는 것을 ‘창조’할 수 있는데, 이는 학습 데이터에 바나나의 색깔에 대한 충분한 정보가 없거나, 색깔과 바나나 사이의 관계에 대한 학습이 부족하기 때문입니다. 이처럼 환각현상은 AI의 출력이 현실과 맞지 않게 되는 경우를 가리킵니다.(ChatGPT의 답변)

-> 생성형AI 관련 밈으로 유명했던 ‘세종대왕 맥북 던짐 사건’이 바로 이 환각 현상의 대표적인 예시다. ‘조선왕조실록에 기록된 세종대왕 맥북 던짐 사건을 알려줘’라는 질문에 ChatGPT-3.5는 실제 있는 사건마냥 대답을 하였다. 생성형 AI가 일부러 거짓말을 한 것은 당연히 아니고, 우리가 앞서 작동 원리를 보았듯이 ‘생성형 AI의 역량 내에서 가장 확률이 높다고 추측되는 대답’을 했기 때문이다. 하지만 같은 질문을 해도 ChatGPT4에서는 그런 사건이 없다고 대답하는데서 알 수 있듯이, 환각 현상은 생성형 AI)의 발전을 통해(챗봇의 경우, 언어 모델 등의 발전도 포함) 없애거나 줄일 수 있다.

위의 다섯 가지 개념을 기반으로 생성형 AI의 작동 원리를 다이어그램으로 나타내면 다음과 같다. 다이어그램 역시 ChatGPT4의 플러그인을 사용하여 만들고 조정했다(플러그인에 대한 내용은 뒤에 바로 소개한다).

1–2. 생성형 AI의 날개 : 프롬프트와 플러그인

앞서 생성형 AI의 개념과 원리를 소개할 때, ‘프롬프트’라는 개념과 ‘플러그인’이라는 개념이 등장했다. 이 두 가지는 생성형 AI에 대해 이해할 때 아주 중요한 개념으로, 앞으로 생성형 AI가 우리 삶에 점점 더 스며들수록 더 자주 접하게 될 단어들이기도 하다. 이 두 가지가 무엇인지, 이번에도 ChatGPT4의 요약으로 우선 살펴보고, 각각에 대한 설명을 이어나가도록 해 보겠다.

-프롬프트(Prompt): 생성형 AI에서 프롬프트는 AI가 반응하거나 답변을 생성하기 위한 입력 또는 질문입니다. 프롬프트는 주로 사용자가 AI에게 주는 명령이나 질문의 형태를 띕니다. 예를 들어, “오늘 날씨는 어떻게 될까?” 또는 “피자 만드는 법 알려줘” 등이 프롬프트의 예가 될 수 있습니다.(ChatGPT의 답변)

-> 프롬프트는 ChatGPT4의 대답만 놓고 보자면 아주 단순해보인다. 하지만 ‘질문’이 무엇인가에 따라 생성형 AI의 응답은 크게 바뀌는데, 이는 ‘생성형 AI, 어디까지 왔는가(2)’에서 더 자세히 다루고자 한다.

-플러그인(Plugin): 플러그인은 AI의 기능을 확장하거나 특정 작업에 대한 AI의 능력을 향상시키는 도구입니다. 플러그인은 AI의 학습 데이터나 알고리즘에 직접적인 변화를 주지 않지만, AI가 특정 작업을 처리하는 방법을 변형하거나 확장시키는 역할을 합니다.(ChatGPT의 답변)

-> 생성형 AI의 플러그인은, 쉽게 말하면 스마트폰의 앱과 같다. 예를 들어, GPT-4에는 유튜브 영상의 소리를 해석하는 능력이 없다. 하지만 여러 가지 GPT-4의 플러그인에서는 동영상(유튜브 등)의 소리를 텍스트로 바꾸어, GPT-4가 요약할 수 있도록 도와준다. 이외에도 앞서 생성형 AI의 작동 원리를 다이어그램으로 그릴 때, GPT-4 플러그인인 ‘Show Me Diagrams’를 이용했다.

2. 생성형 AI 현황

‘AI 시대’라는 말이 과언이 아닐 정도로, AI와 관련된 새로운 소식은 하루를 마다하고 쏟아지듯이 나오고 있다. 그만큼 생성형 AI는 빠르게 발전하고 있다. 그래서 생성형 AI를 다룰 때는 지금까지의 개발 현황을 구체적으로 정리하는 것보다, 원리와 개념을 파악하고 이를 바탕으로 최신 뉴스를 살피며 앞으로 다가올 변화에 대해 살펴보는 것이 더 유용하다. 2023년 6월 27일을 기준으로, 흥미로운 몇 가지 소식을 전하고자 한다.

-오픈AI, AI 모델용 ‘앱 스토어’ 구축한다

https://openai.com/

현재 GPT-4에는 스마트폰의 앱과 비슷한 기능을 하는 ‘플러그인’이 이미 상용화되어 있다. 하지만 보다 더 많은 이용자에게 OpenAI의 AI 모델을 서비스하고자 한다면 독자적인 앱 스토어 구축은 큰 경쟁력이 될 수 있다. 애플의 앱 스토어 런칭을 생각하면 자체적 앱 스토어 구축이 가지는 영향력을 상상하기 쉬울 것이다. OpenAI가 통제 가능한 생태계 구축을 통해 차별화된 사용자 경험을 제공하고, 이것이 시장을 선도하고 수익을 창출하는 계기가 될 수 있다.

-”LLM으로 돈 버세요” 메타의 완전 오픈소스 전략

https://lmsys.org/blog/2023-03-30-vicuna/

생성형 AI 시장에서 Meta는 일찍이 ‘오픈 소스’로 언어 모델을 공개하며 시장에서의 점유율을 높여 OpenAI, Google과 경쟁하고자 하였다. 실제로 위 이미지가 보여주듯이, Meta의 LLaMA(라마)를 기반으로 발전한 Vicuna가 구글의 바드와 비등한 성능을 보여준다는 평가까지 받았다. 하지만 기존에는 상업적 이용을 허가하지 않고 연구 목적으로만 허가하였는데, 다음에 내놓을 메타의 언어 모델은 상업적으로도 이용이 가능하다. Meta의 생성형 AI 오픈 소스화 행보는 기대와 우려를 동시에 낳고 있다.

-국내 생성형 AI 포탈 뤼튼의 행보

https://wrtn.ai/plugins

국내 AI 개발 소식 중에서 독자들에게 가장 먼저 소개하고 싶은 현황은 생성형 AI 포털 서비스인 ‘뤼튼’이다. 지금까지 무료로 사용 가능한 뤼튼에서는 이미 GPT-4를 통한 채팅, 스태빌리티AI를 통한 이미지 생성 등을 지원하며, 마케팅 문구 등을 복잡한 프롬프트 없이 만들어주는 등의 서비스를 제공한다. 뿐만 아니라 조만간 GPT-4와 같은 플러그인 서비스를 국내 사용자에 맞춰 제공할 예정으로, 국내 사용자가 AI를 쉽고 유용하게 쓸 수 있는 AI서비스가 되지 않을까 싶다.

-네이버 AI 챗봇 이름은 ‘큐:’…다음달 베타 테스트 실시

https://clova.ai/hyperclova

네이버가 OpenAI의 ChatGPT에 대응하는 AI 챗봇 서비스인 ‘CUE:’의 베타 서비스를 7월에 시작하기로 발표하였다. 네이버는 이전부터 네이버의 언어 모델인 ‘하이퍼클로바X’의 장점을, ChatGPT보다 ‘한국에 특화된 모델’, ‘환각현상이 적은 모델’로 내세웠다. 한국형 AI의 개발과 비전에 대해 많은 채널을 통해 알려왔던 네이버인 만큼, 실제 공개한 서비스가 어떤 성능을 보여줄지, 네이버 자체 서비스를 포함하여 국내의 얼마나 다양한 서비스와 연계할 수 있는 AI를 내놓을지 궁금하다.

지금까지 AI의 기본 개념과 개발 현황에 대해 간단히 알아보았다. ‘생성형 AI, 어디까지 왔는가(2)’에서는 직접 만든 AI 영상의 개발 과정을 중심으로, 현재 생성형 AI의 역량에 대해 살펴보겠다.

--

--

LAB2050
LAB2050

다음세대 정책실험실 Policy Lab for Next Generation