생성형AI란 ? 텍스트, 오디오, 이미지등의 기존 콘텐츠를 활용하여 새로운 콘텐츠를 만들어 내는 인공지능 기술을 말한다고 합니다. 기존 컨텐츠를 가공해서 새로운것으로 만들어 내는 기술 ~ 아 세상이 참으로 다양하고 변화 무쌍합니다. 감히 우리세대는 앞을 예측하지 못할 정도로 빠른 변화속에서 과학기술 분야의 우리나라 포지션이 나날이 향상되고 격상되어져야 될건데….걱정 스럽습니다. 정부정책과 맞물린 많은 연구개발 부분이 앞으로 더 적극적으로 성장하기 바라며 작은 저의 관심이 새로운 세상을 향해 나아가는 발판이길 바래도 봅니다. 평범함이 일상의 모든것을 뛰어 넘는 세상 생성형AI 인공지능 세상이 아닐까 합니다
생성형AIhttps://blog.naver.com/9452166/223360296678
생성형AI 시장규모
- 전 세계 생성형 AI 시장 규모는 2022년 107억 9천만 달러에서 2032년 1,180억 6천만 달러에 달할 것으로 예상, 2023년부터 2032년까지 예측기간 동안 연평균 27.02% 성장할 것으로 예상
- 텍스트에서 이미지로, 텍스트에서 비디오로의 변환과 같은 기술 사용한 생성 AI의 수요 증가, 미디어 및 엔터테인머트 부문은 2022년 매출의 34% 이상을 차지, 비즈니스 및 금융 서비스 부문에서 2023년부터 2032년까지 36.4%로 가장 빠른 속도로 성장 예상
- 글로벌 생성 AI 시장 규모는 2028년까지 539억 달러 (CAGR 32.2%) 이를 것으로 예상, 트랜스포머(Transformer) 부분이 2021년 생성 AI 시장에서 최대 수익 점유율을 획득하여 2028년까지 224억 달러의 시장 가치를 달성
- 생성형 AI 시장 경쟁 구도를 살펴보면, 마이크로소프트와 구글을 선두로 하여 IBM, 어도비, 아마존 등이 주요 기업으로 부상되고 있음
- 아시아태평양 지역에서 중국 시장이 2021년 생성 AI 시장을 지배, 2022년~2028년까지 40억 4,960만 달러 성장을 예상, 일본 시장은 연평균(CAGR) 32.3%, 인도 시장은 33.9% 성장할 것이라 추정
생성형AI 국내정책
- 과학기술정보통신부
- 국가 인공지능 경쟁력 강화를 위한 ‘인공지능 최고위 전략대화(AIStratege Summit)’를 출범(’21.9)
- ’23년 3월, 3차 회의를 통해 ’ChatGPT 대응을 위한 초거대 AI 정책방향‘ 관련 의견수렴
- 글로벌 생성형 인공지능(AI) 개발 경쟁에 뒤처지지 않기 위해 반드시 필요한 준비물로 ‘양질의 데이터’를 꼽음
- 문제점
- AI 허브에 초거대 언어모델이 학습할 수 있는 데이터 부족
- AI에 데이터를 학습시키는 과정에서 발생하는 저작권 문제
- AI 서비스와 관련해 출판 콘텐츠를 제공할 때는 사용 목적이나 분량, 범위, 기간 등을 분명하게 설정, ‘문어 말뭉치’ 사태와 같은 저작물 무단 이용에 따른 저작권침해 방지
- AI 학습 데이터 저작권에 대한 새로운 법적 기준 시급
- 문화체육관광부
- ChatGPT로 대표되는 생성형 인공지능(AI) 기술 변화에 필요한 문화적·제도적·산업적 기반 마련을 위해 3개의 워킹그룹 발족(’23.2)
- 저작권 제도의 개선,
- 한국어 잘하는 AI’를 위한 한국어 말뭉치 학습
- 콘텐츠 창작과 산업에서의 AI 활용
- ’23년 3월, 3차 회의를 통해 ’ChatGPT 대응을 위한 초거대 AI 정책방향‘ 관련 의견수렴
- 주요내용
- 한국형 ChatGPT가 빠르게 개발될 수 있도록 25종, 약 1억 2000만 어절의 고품질 한국어 말뭉치 구축·배포
- AI 기술 발전에 따른 저작권 제도개선
- 현행 저작권법 내에서 활용될수 있는 ‘저작권 관점에서의 AI 산출물 활용 가이드(안) 마련
- ChatGPT로 대표되는 생성형 인공지능(AI) 기술 변화에 필요한 문화적·제도적·산업적 기반 마련을 위해 3개의 워킹그룹 발족(’23.2)
- 서울특별시의회
- ‘한국형 ChatGPT 산업 현황과 전망에 대한 정책토론회’ 개최(’23. 3. 6)
- 목적
- ChatGPT 신드롬으로 인한 전 세계 인공지능 산업 트렌드와 국내 산업에 끼칠 영향을 분석,한국형 ChatGPT 발굴
- 문제점
- 국내 대기업들이 다양한 서비스를 준비 중이나 정작 생성형 AI 보다는 대형 언어 모델에만 집중하는 분위기, 이에 인공지능은 산업현장 외에도 데이터 기반 행정에 즉시 적용 및 서비스 본질에 좀 더 집중 필요
< 생성형 AI 이미지 >
생성형AI 문제점
- 할루시네이션(환각) 진실 여부에 대한 출처가 확인되지 않는 수많은 데이터를 바탕으로 생성한 ChatGPT의 답변은 겉보기에는 논리적이고 그럴싸해 보이나, 사실은 잘못된 정보이거나 큰 내용이 없는 무의미한 답변일 수 있다는 것, 즉 인공지능 환각은 인공지능(AI) 모델의 고유한 편향, 실제 이해 부족 또는 훈련 데이터 제한에서 발생
- 산수와 관련한 추론 계산에 취약
- 물리적 세계에 대한 추론
- 인간 사고 과정에 대한 추론
- 역사 문제 오류
- 성 차별과 인종 차별 등
- 악의적인 내용 생성
- 인간 같은 인지력으로 이전 모델보다 환각 오류를 상당 부분 개선하였으나 완전하지는 않음
- 데이터 편향성
- 대규모 데이터 세트에서 훈련 시, 해당 데이터가 편향적이거나 부적절한 경우
- 생성된 결과물도 그와 같은 편향성을 반영할 가능성이 큼(인종 편향, 성별 편향, 지역 편향, 선택편향 등)
- 내재적 불확실성
- 생성 AI가 만들어 내는 결과물이 예측 불가능한 경우, 예를 들어 생성된 결과물이 혐오 발언이나 성적 수치심을 유발하는 등의 부정적인 영향
- 데이터 부족 문제
- 생성 AI는 대부분 대규모 데이터 세트에서 훈련되므로 데이터가 부족한 경우 모델 성능의 저하
- 사람의 개입 필요성
- 생성 AI 모델이 만든 결과물을 평가하고 수정하는 작업에는 사람의 개입이 여전히 필요
- 논리적 일관성 부족
- 사람처럼 논리적인 일관성을 유지하지 않을 수 있으며 이전에 생성된 내용과 일관성이 없거나, 상반된 내용을 연속적으로 생성하는 등의 문제 유발
- 가짜 뉴스 및 정보 생성
- 잘못된 의학적 진단을 내리며 가짜 논문을 근거로 제시하는 등의 문제
- 저작권 침해 문제
- 데이터 학습 시 저작권자의 동의 없이 인터넷 등에 공개된 저작물을 무단으로 사용하는 문제
- 표절
- AI는 하이테크 표절의 시스템이고 배움을 회피하게 한다’고 주장, 다수의 전문가와 교육 현장에서 우려가 있음
출처 : 생성형 인공지능(Generative AI) 산업 현황 보고서 – 저작권 위원회