[지식정보] 초거대 AI 대화형 ‘챗GPT’ 흐름
‘챗GPT’는 Open AI(openai.com)가 개발한 대화 전문 인공지능 챗봇으로, 사용자가 대화창에 텍스트를 입력하면 그에 맞춰 대화를 나누는 서비스이다. Open AI는 인공지능 언어모델 ‘지피티-3’(GPT-3), 그림을 그리는 인공지능 ‘달리2’(DALL-E2), 다국어 음성인식 인공지능 ‘위스퍼(Whisper)’ 등을 선보인 인공지능 회사다.
미국 AI 개발사 오픈AI의 최신 버전 챗GPT3.5는 공개된 지 두 달 만에 월간 사용자 1억 명을 넘었다. 페이스북과 인스타그램 등이 1억명 달성에 수년 걸렸던 것보다 엄청 빠르다. 이용자가 늘자 Open AI는 월 20달러 구독형 유료 서비스를 한다. 이용자는 피크 타임에도 우선 챗GPT에 접속할 수 있고, 응답 속도도 더 빠르다. 변호사 자격시험, 의사 면허 시험, 논문과 연설문 작성 등이 가능하며, 조만간 영화 제작, 작곡 등도 가능하다고 한다. 챗GPT는 검색엔진, 업무 방식, 문화생활 등 일상을 바꿔놓을 수 있는 혁명적 기술이다. 조만간 기업이 자체 앱에 챗GPT를 적용할 수 있는 응용프로그램 인터페이스(API)도 내놓을 계획이다. 마이크로소프트, 구글 등 글로벌 기업과 한국 기업들의 챗GPT 개발 현황을 살펴본다.
자료: 정보통신기획평가원 ICT Brief 2023-01 2023.01.13.
https://terms.naver.com/entry.naver?docId=6646863&cid=43667&categoryId=43667
https://biz.chosun.com/international/international_general/2023/02/03/GAJCYLCZ2JDW3LB6MVO2XBLITQ/?utm_source=naver&utm_medium=original&utm_campaign=biz
https://www.mk.co.kr/news/editorial/10630471
https://it.chosun.com/site/data/html_dir/2023/02/03/2023020300463.html
https://newsis.com/view/?id=NISX20230203_0002180224&cID=13006&pID=13100
https://www.hankyung.com/it/article/2023020339431
https://www.chosun.com/economy/tech_it/2023/02/03/S5Z7BRDKBVAH3JKLQ2RVOMSCVM/?utm_source=naver&utm_medium=referral&utm_campaign=naver-news
https://www.mk.co.kr/news/it/10630576
델코지식정보
https://www.delco.co.kr/
1. 초거대 AI GPT-3 성능+대화·창작·코딩 능력=‘챗(Chat)GPT’
인간의 언어까지 이해하며 스스로 판단·행동하는 수준으로 발전하고 있는 초거대 AI는 GPT-3에 이어 대화뿐 아니라 코딩·원고 작성까지 가능한 ‘챗GPT’가 등장했다. 美 AI 기업 Open AI는 초거대 AI GPT-3(’20.6) 출시에 이어 자연스러운 대화 능력을 갖춘 GPT-3.5 버전인 ‘챗GPT’를 공개했다(’22.11.30).
챗GPT는 질문에 논리적인 답변, 상세한 일상의 대화 가능, 어려운 문제에도 답 제시, 장문의 글 요약, 주제어를 던지면 시·소설 등 창작 활동과 코딩까지 수행한다. 챗GPT 서비스의 보급 속도는 전례 없는 속도로 확장하고 있다.
AI가 반복적으로 시행착오를 거쳐 최적의 방법을 습득하는 머신러닝 기법을 적용해 지속적인 사용자의 지시를 받으면서 상황에 따라 실수를 줄이고 최상의 결과물을 만들어내도록 훈련되어 있다. 챗GPT 주요 기능은 챗봇 개발, 언어 번역, 콘텐츠 생성, 텍스트 요약, 코딩 등이다. 전반적으로 광범위한 대화형 AI 애플리케이션 및 서비스 구축에 사용할 수 있는 강력한 도구다. 다만, 잘못된 정보 생산 가능성, 유해하거나 편견이 있는 콘텐츠 생산 가능성, 2021년 이후 사건에 대한 정보 미반영 등은 한계다.
2. 검색엔진 기능 향상을 위한 마이크로소프트(MS)와 구글의 챗GPT 활용 동향
구글·네이버는 검색 결과 시 광고도 같이 보여주는데, 챗GPT 검색은 그렇지 않다. 기존 검색엔진은 '사용자에게 진짜 필요한 정보'가 아니라 '기업에 의해 검색에 최적화된 정보'를 보여준다는 비판이 있었다는 점을 고려할 때 챗GPT 기반 검색엔진이 등장하면 글로벌 이용자가 이를 선택할 가능성이 높을 것으로 전망된다.
다만 챗GPT 검색 결과는 구글과 달리 출처가 어디인지 밝히지 않고, 최신 데이터가 반영돼 있지 않는 등 한계도 있다. 이러한 이유로 업계에서는 챗GPT가 그대로 검색 결과로 사용되기보다는 일반적인 검색엔진 결과를 보완하는 형태로 나올 것이라는 전망이 우세하다.
MS
마이크로소프트(MS)는 오픈AI에 12조원을 투자하면서 파트너쉽을 형성했다. 챗GPT 기술을 엑셀, 파워포인트 같은 자사 제품에 적극 반영할 계획이다. 특히 MS는 자사 인터넷 검색엔진인 ‘빙’에 챗GPT 기능을 적용해 검색 능력을 끌어올린다. MS는 자사 검색엔진 빙(Bing)에 챗GPT를 결합한 AI 버전의 새로운 검색엔진을 개발하고 있다. 2023년 3월경 출시를 목표로 글로벌 검색엔진 시장에서 확장에 도전한다. 스탯카운터닷컴, 인터넷트렌드 등에 따르면, 글로벌 검색엔진 시장에서 현재 구글 점유율은 92%, MS 빙은 3%대 수준에 불과하다.
MS 빙의 챗GPT는 검색 결과 링크는 물론 검색 질의한 이용자 의도를 파악해 가장 정확한 답변, 상세한 결과를 제시한다. 예를 들어 ‘외국인에게 추천할 만한 서울 관광지’를 검색하면 챗GPT는 ‘창덕궁, 서울숲 등이 있다’고 즉시 답하고, ‘추천한 관광지 중 서울역에서 가장 가까운 곳’을 물으면 곧바로 답변하며 정보를 나열하는 구글 검색과 차별화되어 있다. 구글은 연관된 내용이 있는 문서들을 보여주고 사용자가 직접 이들 결과 중 본인의 의도에 가까운 정보를 선택하는 방식이다.
MS는 검색엔진 고도화를 위해 오픈AI의 대표 솔루션인 챗GPT와 이미지 생성 AI 모델인 달리2(DALL-E 2)를 모두 결합하고 있다. 검색엔진 외에도 MS 워드(Word), 아웃룩(Outlook), 파워포인트(Powerpoint) 및 MS 365앱에 챗GPT를 도입하여 사용자가 간단한 프롬프트를 입력해 자동으로 텍스트를 생성할 수 있도록 하는 방안을 연구 중이다. 자사 클라우드 서비스인 ‘애저’에서 오픈AI의 대규모 언어 모델인 GPT-3.5와 이미지 생성 모델 달리2(Dall-E2) 등을 도입했다.
구글
구글은 자회사 딥마인드의 ‘알파고(바둑 AI)’, 람다(AI챗봇) 개발 등 글로벌 AI 기술을 선도하고 있으나 최근 챗GPT 급부상과 관련 업계 도전에 긴장하고 있다. 구글 검색엔진은 이용자가 입력한 검색어와 연관성이 높은 링크를 보여주고 해당 링크에 직접 액세스하여 정보를 찾아보는 방식이다. 검색 결과를 직접 선별하고 판단해야 하는 구글 검색엔진과 달리 챗GPT와 같은 대화형 AI챗봇은 상대적으로 간편하게 정보를 확보할 수 있다는 점에서 구글에게는 위협 요인이다. 구글은 검색엔진을 기반으로 한 광고 사업이 수익의 큰 비중을 차지하고 있는 만큼, 검색시장의 판도 변화는 전체 수익에 영향을 미칠 수 있다. 이용자들이 챗GPT를 통해 정보검색을 한다면 구글링크 클릭과 함께 제공되는 광고링크 클릭이 줄어들어 광고 수익에는 부정적인 영향을 미칠 전망이다.
구글은 자사 AI 언어 모델 ‘람다(LaMDA)’를 활용한 새 AI 챗봇 ‘어프렌티스 바드(Apprentice Bard)’을 본격 테스트하고 있다. 구글 검색에 활용하기 위해, 사람의 질문에 AI가 얼마만큼 정확하게 답변하는지 확인하기 위한 것이다. 구글은 또 AI 신제품이 윤리적으로 타당한지를 검토하는 절차를 기존보다 빠르게 진행하는 ‘그린 레인’ 제도 도입을 검토하고 있다. AI 기술을 공개했을 때 발생할 수 있는 논란을 감수한다는 뜻이다. 구글은 이를 통해 2023년 안에 20개 이상의 AI 서비스를 공개할 예정이다.
구글은 AI 계열사인 딥마인드와 협업을 하여 딥마인드 서비스를 구글과 구글 클라우드에 접목하고 있다. 딥마인드는 챗GPT에 대항하는 스패로(Sparow)를 업데이트하고 있다. 스패로는 딥마인드가 만든 AI로 수개월 내 출처를 인용할 수 있는 챗봇 AI로 거듭날 전망이다.
데이터 양이나 기술 부분에서 구글이 오픈AI보다 우위다. 람다는 언어 이해와 언어 생성 능력이 결합된 생성 AI라고 볼 수 있다. 1370억 개쯤의 파라미터로 구성됐고, 30억 개쯤의 문서, 11억개쯤의 대화를 학습 데이터로 사용한다. 결과를 도출해내는 방식은 GPT와 동일하다. 파라미터(매개변수) 수에서는 챗GPT가 더 앞서지만, 구글은 독보적인 무기 ‘검색엔진’을 가지고 있다. 이는 대화의 범위를 검색 기능으로까지 확장할 수 있음을 의미한다.
반면 챗GPT의 경우 방대한 양의 데이터로부터 학습했지만 지속적으로 최신 정보를 업데이트하지 못하는 등 답변의 정확도나 신뢰성에 대해서는 한계가 나타나고 있다는 지적이다. 구글이 검색 기능을 적용하는 경우 윤리적 문제와 같이 해결해야 할 부분이 있기는 하지만 기존 챗GPT 이상의 능력을 발휘할 수 있다.
3. 2023년 GPT-4 출시 기대, 2023년 AI 업계 10가지 예측 ‘포브스’에도 포함
GPT-4는 더 많은 데이터를 학습하여 그림, 음악, 영상, 글 등 다양한 분야에서 활용 가능한 버전으로 출시가 전망된다. GPT-4 매개변수(파라미터: Parameter)※는 약 1조 개 규모로 예상되며 데이터 처리에 최적화될 것으로 관측된다.
※ 인간 뇌의 학습·연산 기능을 담당하는 ‘시냅스’와 비슷한 역할로 파라미터 수가 많아질수록 AI 성능을 높이는 셈
오픈AI가 2018년 첫 출시한 GPT-1은 1억 1,700만 개 매개변수로 학습하였고 2019년 공개한 GPT-2는 모델의 크기에 따라 약 1억 2,400만 개에서 15억 개로 GPT-1의 10배 수준, GPT-3는 매개변수 1,750억 개로 GPT-2의 100배 규모다.
종전의 GPT-3가 텍스트 데이터만 학습했다는 점에서 한계가 있으나 GPT-4는 소리·영상·사진· 촉각 등 다양한 형태의 정보를 입력하고 사고가 가능할 것으로 예상된다. GPT-4가 텍스트, 이미지, 오디오 등 데이터 입력과 학습이 가능하다면 마치 인간이 정보를 받아들이고 뇌가 사고하는 방식과 거의 동일한 수준이 된다고 한다.
포브스는 ‘2023년 AI 업계 10가지※ 예측(’22.12)’에서 GPT-4의 등장을 포함하고 있다. 포브스는 ’22년 AI 분야의 가장 큰 변화가 ‘생성 AI의 비약적인 발전’이라면 ’23년에는 한층 진보한 초거대 언어모델 GPT-4가 등장해 더욱 빠른 변화를 불러올 것으로 전망하고 있다. 2023년 초 공개를 예상하는 GPT-4는 멀티모달이 될 가능성이 있다고 예측한다. 멀티모달은 텍스트(언어) 외에도 이미지, 비디오 그리고 다른 데이터 형식(생체신호 등)을 컴퓨터가 인식하는 것이다.
4. 한국의 챗GPT 동향
네이버 '서치GPT'
네이버는 신뢰성·최신성 부족 등 기존 챗GPT의 단점을 보완해 업그레이드하고 한국어에 최적화된 모델인 ‘서치GPT로 차별화한다. 서치GPT는 네이버 검색 엔진에 적용하는 것이 아닌 이용자와 고민하는 베타의 장으로 별도 오픈할 계획이다. 이용자 만족도나 데이터가 충분히 쌓이면 정보성 검색은 검색 결과에 적용하는 방안도 검토 중이다. 예를 들어 서울 지하철 요금과 같은 요약된 답변이 필요하면 최신 콘텐츠 데이터를 출처와 함께 잘 요약해 제공하거나, 노트를 싸게 구매하는 방법 등 조언이 필요한 검색도 다양한 콘텐츠 활용한 답변을 제시하는 형태다.
네이버는 2021년 개발한 초거대 AI ‘하이퍼클로바’를 자사 서비스에 이미 활용 중이다. 네이버 쇼핑의 상품 소개 문구를 작성하거나 회의록을 요약하는 등 다양한 방식으로 쓸 수 있다. 하이퍼클로바를 손쉽게 쓸 수 있는 노코드(no code) 툴 ‘클로바스튜디오’를 만들어 스타트업 등에도 제공하고 있다.
2022년 말 기준 네이버의 한국 검색시장 점유율은 62.19%로 1위지만, 점차 구글에 영역을 뺏기고 있는 상황이다. 구글은 시장 점유율 31.77%로 네이버 뒤를 추격하고 있다. 이러한 상황에서 MS가 챗GPT를 탑재하고 '다크호스'로 부상할 수 있어 한국 시장을 놓고 경쟁이 더욱 치열해질 것으로 전망된다.
네이버는 한국어로는 고품질의 검색 데이터를 가장 많이 보유한 사업자이면서, 거대 AI 모델로는 세계 정상급 기술이 있는 국내 최고의 검색·AI 기술 회사다. 네이버는 생성 AI의 단점으로 꼽히는 신뢰성과 최신성 부족, 해외 업체의 영어 기반 개발 모델을 한국어로 번역함으로써 발생하는 정확성 저하를 풍부한 사용자 데이터와 기술·노하우로 해결하고 있다.
서치 GPT는 챗GPT처럼 대화형 챗봇은 아니다. 검색 결과를 현재와 다른 방식으로 보여주는 서비스가 될 전망이다. 서울 지하철 요금과 같이 정보가 요약된 답변이 필요한 검색은 신뢰도 높은 최신 콘텐츠 데이터를 출처와 함께 요약하는 식이다.
서치GPT 개발로 AI와 B2B 사업 조직의 수익성 개선도 꾀한다. 네이버는 클로바 등 AI와 웨일, 파파고 등 B2B 조직을 네이버클라우드 한 곳으로 통합하고 있다. 초거대 AI 기반의 경쟁 우위를 확보해 엔터프라이즈·금융 등으로 시장을 확장한다는 방침이다.
SK텔레콤
대화형 AI 서비스 ‘에이닷’의 활용 범위를 서비스 추천 등으로 확대하고 있다.
KT
2023년 상반기 자체 개발한 초거대 AI ‘믿음’을 상용화할 계획이다.
LG AI 연구원
이미지와 텍스트를 함께 학습한 멀티모달 AI ‘엑사원’을 산업현장에 활용한다.
카카오
텍스트를 입력해 이미지를 만들 수 있는 앱 ‘비디스커버’를 출시했으며, 정교한 한국어 챗GPT를 개발하고 있다.
5. 글로벌 생성 AI 서비스 현황
오픈AI가 공개한 AI 챗GPT의 파장으로 전 세계 테크 업계에서 AI 개발 경쟁이 치열해지고 있다. 그동안 AI 윤리를 강조하며 개발 중인 AI 공개를 꺼리던 미 실리콘밸리 빅테크들은 AI 기술 공개로 급선회하고 개발 인력과 투자를 늘리고 있다.
메타(옛 페이스북)도 새로운 AI 서비스를 출시할 때 내부 승인 절차를 간략하게 하는 방안을 논의하고 있다. AI 개발과 공개에 더 적극적으로 나서겠다는 취지다.
바이두(중국 최대 검색엔진 업체)는 2023년 3월 챗GPT와 유사한 AI 챗봇을 출시한다. 바이두는 2022년 12월 시나리오 작가, 일러스트레이터의 작업을 대신하는 AI 기술을 공개했는데 AI챗봇까지 영역을 넓힌 것이다. 바이두도 구글과 마찬가지로 AI챗봇 기술을 검색엔진과 통합한다.
현재까지 많은 AI 기업들이 오픈AI의 GPT-3를 기반으로 생성 AI 서비스를 개발하고 있다. 깃허브(GitHub)는 GPT-3를 활용해 자동코드완성 AI 서비스인 코파일럿(Copilot)을 선보였고, 노션(Notion)은 GPT-3를 활용한 노션AI 서비스를 신설했다. 여러 스타트업들이 챗GPT나 네이버의 하이퍼클로바를 기반으로 인공지능 서비스를 구축하고 있다.
6. 오픈소스 여부 논쟁
오픈AI의 챗GPT든, 구글의 '어프렌티스 바드’든 관건은 오픈소스 여부다. 오픈AI는 통해 ‘챗GPT 플러스’ 유료 서비스를 소개했다. 요금은 월 20달러로 책정될 예정이다.
의견은 엇갈린다. 안정적인 서비스를 이용하는 측면에서 긍정적 입장도 있지만, 누구나 사용할 수 있다는 오픈소스의 강점이 사라진다. 스테이블 디퓨전(Stable dIffusion)은 대표적인 오픈소스 사례다. 생성 AI를 개발한 스테빌리티(Stability AI)에서 오픈소스 라이선스로 배포하면서 오픈AI의 이미지 생성 AI ‘달리(DALL-E)’ 사용자들 상당수가 스테이블 디퓨전으로 넘어 왔다. 구글이 유로로 할지 오픈소스로 배포할지는 모르지만 결국 사용자들은 오픈소스로 배포하는 곳으로 몰려갈 전망이다.
7. 챗GPT ‘검색엔진’ 시장 전망 엇갈림
챗GPT는 필요한 정보검색 시간을 획기적으로 줄여주기에, 과거 구글이 야후를 도태시켰던 상황과 비슷하다는 전망이 있다. 이용자 의도를 파악해 가장 정확한 답변을 제공한다는 점에서 구글 검색엔진을 넘어설 수 있다. 질문에 답이 될 만한 여러 선택지를 보여주는 구글과 달리 즉각적인 해답을 찾아주는 것이 챗GPT의 강점이다.
반면, 오류와 편향된 정보에 대한 학습이 더 필요하기에, 검색엔진 시장판도를 바꾸기에는 아직 더 많은 시간이 필요하다는 견해도 있다. GPT는 학습한 내용에 오류가 있거나 편향된 정보가 있으면 잘못된 답을 내놓을 수 있다. AI 특성상 학습에 시간이 걸려 최신 정보를 바로 반영하지 못하는 단점도 있다. 거짓된 정보를 사실처럼 그럴듯하게 꾸며내 악용 가능성도 배제할 수 없다.
8. 시사점: AI 투자 시대 ‘초거대 AI’ 선점과 투자 필요
생성 AI 스타트업엔 투자금이 몰리고 있다. 글로벌 투자업계에선 투자의 물줄기가 바뀌어 ‘이제 비트코인 투자 시대는 가고 AI 투자 시대가 왔다.’는 의견도 나온다. 시장조사업체 피치북에 따르면, 2023년 한 해 벤처캐피털들이 생성 AI 스타트업에 투자한 금액은 13.7억 달러(약 1.67조 원)에 달한다. 해당 분야의 지난 5년간 투자금을 합친 것과 맞먹는 액수다.
GPT-3.5버전으로 등장한 챗GPT는 보다 자연스러운 대화와 창작 활동, 코딩까지 가능한 수준으로 진일보하며 검색엔진 시장 경쟁에 영향을 미칠 수 있어 주목된다. 챗GPT은 우리 기업들에도 기회가 될 수 있다. 네이버는 '서치GPT'을 선보여 풍부한 한국어 데이터를 활용하고 신뢰성과 최신성을 강화해 영문 기반의 챗GPT를 뛰어넘는다는 노력을 하고 있고, 카카오도 정교한 한국어 챗GPT를 개발하고 있다.
우리 기업이 챗GPT 경쟁에서 이기려면, 개인정보 과도한 규제 완화, 저작권 침해 방지를 위한 외국어 데이터 활용 방법 모색, 대규모 데이터를 학습 실행하는 컴퓨팅 비용 지원, 지속적인 훈련 환경 확보 등이 필요하다. K팝과 K드라마처럼 우리의 기술력으로 세계적 챗GPT를 만들 수 있다. 산업현장과 일상생활에 적용하여 유의미한 콘텐츠와 서비스를 창출할 수 있는 기업의 창의성을 돕고, 신사업에 과감한 투자를 할 수 있는 환경을 조성해야 한다.
Comments