본문 바로가기

GPT4o

(1)

멀티모달 AI 트렌드 2025 - 텍스트·이미지·영상·음성 통합이 바꾸는 미래 텍스트만 이해하던 AI가 이미지·영상·음성·문서까지 동시에 처리하는 '멀티모달 AI' 시대가 본격화되고 있습니다. 2024년 GPT-4o 출시를 기점으로 멀티모달 AI는 실용화 단계에 접어들었고, Google Gemini 1.5 Pro는 100만 토큰의 컨텍스트로 2시간 분량의 영상을 통째로 분석하는 수준에 이르렀습니다. 멀티모달 AI 시장 규모는 2025년 약 47억 달러에서 2030년까지 연평균 36% 성장해 221억 달러에 달할 것으로 예측됩니다. 이 글에서는 멀티모달 AI의 현재와 미래, 실제 활용 사례를 분석합니다.멀티모달 AI란 무엇인가멀티모달(Multimodal)은 여러 가지(Multi) 형태(Modal)의 데이터를 처리할 수 있다는 의미입니다. 기존 LLM(대형 언어 모델)이 텍스트만 처리..

이전 1 다음

티스토리툴바