생성형 AI 기술 개발 및 활용 - 1

2023. 8. 4. 15:24머신러닝 딥러닝

미래 생산성 향상의 Key.

 

- 2030년까지 AI 기술로 인해 글로벌 주요국의 국가별 성장률이 5~26%까지 폭증 전망

- AI도입으로 2035년까지 주요 12개 국가의 GVA(Gross Value Added) 성장률은 2배로 증가, 기업들의 수익성은 평균 38% 가량 향상하여 2030년까지 무려 14조 달러 규모의 경제 성장 예상

 

고용시장의 영향

 

- 물리적인 노동력 뿐 아니라 인간의 인지 및 판단 영역을 대체

- 현재 사람이 하고 있는 대부분의 직업이 대체 위험에 노출

- GPT-4를 이용하면 사람과 비슷한 완성도로 작업을 완수하는 데 드는 시간이 50% 이상 감소하는 직업과 작업이 약 14%~46%에 달함.

- 2030년까지 북미와 유럽에서 AI에 의해 높은 위험에 처할 업종별 직업의 수가 무려 23~76%에 이를 것으로 전망

 

생성형 AI의 한계

 

- 잘못된 정보를 그럴듯하게 설명

  환각(hallucination)

    부정확한 결과물이 진실인 것처럼 100% 확신

    내용의 일부 또는 완전히 부정확할 수 있고, 완전히 거짓을 말할 수도 있음

 

- 데이터 보안

   이탈리아에서 한달간 차단

    2023.3.30 차단, 4월 28일 해제

    GDPR 위반 사유

    - 개인정보 적법 처리 근거 부재

    - 사용자 연령 확인 절차 부재

    데이터 수집, 처리에 대한 정보를 공개

    부정확하게 생산한 개인 정보를 수정 및 삭제할 수 있는 기능 추가

    미성년자 보호를 위해 이용자 연령 확인 시스템 도입

 

- 윤리와 편향

   Bias

   훈련에 쓰인 데이터가 편파적인 내용을 담고 있을 가능성

   가치 중립적이지 않음

    이루다 - 사회적 약자, 소수자에 대한 혐오와 차별, 개인정보유출

    테이 - 2016년 3월 일반 공개, 트위터 상에서 대화용 인공지능, 딥러닝 기술 적용,

              인종차별, 성 차별, 정치적 발언 등으로 서비스 중단

 

- 저작권 침해

   표절, 저작권과 상표권 침해 가능성

   원작자 동의 없이 학습

   Stable Diffusion

    원작자인 예술가들의 동의 없이 온라인에서 약 50억개 이미지 스크래핑

    스테빌리티 AI

    게티이미지의 이미지 1200만개 무단 사용

    코파일럿 제작 및 운영에 참여 회사

    깃허브 코드 무상으로 학습

    매튜 버터릭과 조셉 세이버리 로펌이 MS, OpenAI를 상대로 집단 소송 제기

 

- 과제, 시험 등 부정행위

 

- 다른 데이터 소스와의 통합

   - 사전 학습된 LLM와 프롬프트에 근거해서 답변

   - 비용이 많이 드는 재학습이나 fine-tuning을 하지 않으면 다른 데이터 소스의 통합이 어려움

     생성된 내용의 참고문헌과 소스 제공에 한계

 

- Context window 사이즈 제한

  현재 수천 개 단어로 제한되어 있음

 

 

디지털오픈랩(김종우교수님)